GitHub

基于多源聚合的智能搜索框架，支持 LLM 增强功能

🚀 项目简介

E-WebSearch 是一个功能强大的多源搜索聚合系统，采用分层架构设计，集成了 Bing 搜索、ZAI 搜索和可扩展的私域搜索能力，并支持 API 服务。系统还集成了基于智谱AI GLM-4模型的 LLM 增强功能，为搜索结果提供智能摘要和标签生成。

🎯 核心特性

🔌 多源可插拔引擎: 内置 Bing、ZAI 与私域（如微信、知乎）引擎，基于 BaseEngine 易于扩展
🧹 一体化内容抽取: 自动化正文提取与清洗，统一标题、摘要与链接等字段
🧠 相关性与去重: TF‑IDF + 向量模型的混合评分，结果去重、重排与聚合
🤖 LLM 智能增强: 整体/逐条摘要与标签，优雅降级；支持智谱AI/OpenAI/Azure
⚡ 高并发异步: 全链路 asyncio/aiohttp，内建超时与重试策略
💾 智能缓存系统: 内存/Redis/分布式缓存，TTL、LRU、统计与健康检查，支持自动降级
🧪 可观测与 API: FastAPI/OpenAPI 文档、健康检查与统计接口
🐳 一键部署: Docker & Docker Compose 快速启动

📦 项目结构

e_websearch/
├── 🏗️  core/                    # 核心业务逻辑
│   ├── engines/                 # 搜索引擎实现
│   ├── search_orchestrator.py   # 搜索协调器
│   ├── models.py                # 核心数据模型
│   ├── llm_enhancer.py         # LLM 增强模块
│   └── ...
├── 🌐  api/                     # FastAPI 应用
│   ├── main.py                  # API 端点
│   └── models.py                # API 数据模型
├── 🧪  tests/                   # 测试代码
│   ├── test_llm_functionality.py
│   ├── test_zhipuai_direct.py
│   └── ...
├── 📚  examples/                # 使用示例
│   ├── llm_enhanced_example.py
│   └── ...
├── 📖  docs/                    # 文档
│   ├── llm-enhancement-guide.md
│   └── ...
├── 🐳  Dockerfile               # Docker 配置
├── 📋  requirements.txt         # 依赖列表
└── 📄  README.md               # 项目说明

🚀 快速开始

1. 环境准备

# 克隆项目
git clone https://github.com/your-username/e-websearch.git
cd e-websearch

# 创建虚拟环境
python -m venv venv
source venv/bin/activate  # Linux/Mac
# 或
venv\Scripts\activate     # Windows

# 安装依赖
pip install -r requirements.txt

2. 配置环境变量

创建 .env 文件：

# 基础配置
CACHE_TYPE=memory

# ZAI Search Pro (推荐)
ZAI_API_KEY=your_zai_api_key_here

# Bing Search (可选)
BING_API_KEY=your_bing_api_key_here

# LLM 增强配置
ZAI_API_KEY=your_zhipuai_api_key_here  # 智谱AI
OPENAI_API_KEY=your_openai_api_key_here  # OpenAI (可选)
AZURE_OPENAI_API_KEY=your_azure_api_key_here  # Azure (可选)

# 私域搜索配置 (可选)
WECHAT_SEARCH_ENABLED=true
WECHAT_API_URL=http://your-wechat-api.com/search
ZHIHU_SEARCH_ENABLED=true
ZHIHU_API_URL=http://your-zhihu-api.com/search

3. 启动服务

# 启动 API 服务
python run_api.py

# 服务地址: http://localhost:8000
# API 文档: http://localhost:8000/docs

4. 使用示例

基础搜索

import requests

response = requests.post("http://localhost:8000/search", json={
    "query": "人工智能教育应用",
    "max_results": 10,
    "sources": ["zai"]
})

print(f"找到 {response.json()['total_count']} 个结果")

启用 LLM 增强

# 带智能摘要和标签的搜索
response = requests.post("http://localhost:8000/search", json={
    "query": "人工智能教育应用",
    "max_results": 10,
    "sources": ["zai"],
    # LLM 增强选项
    "llm_summary": True,        # 生成整体摘要
    "llm_tags": True,           # 生成整体标签
    "llm_per_result": False,    # 是否逐条增强
    "llm_max_items": 5,         # 参与增强的结果数量
    "llm_language": "zh",       # 输出语言
    "model_provider": "zhipuai", # 模型提供商
    "model_name": "glm-4"       # 模型名称
})

data = response.json()
print(f"整体摘要: {data['llm_summary']}")
print(f"相关标签: {data['llm_tags']}")
# 逐条结果上的增强（直接在每条结果对象中返回）
for item in data["results"]:
    print(f"- {item['title']}")
    print(f"  摘要: {item.get('llm_summary')}")
    print(f"  标签: {item.get('labels', [])}")

🤖 LLM 增强功能

系统集成了可选的 LLM 增强功能，基于智谱AI GLM-4模型，提供：

📝 智能摘要: 对所有搜索结果生成统一的摘要总结
🏷️ 智能标签: 为搜索结果集合生成相关标签
🎯 逐条增强: 为每个搜索结果单独生成摘要和标签
🔄 优雅降级: 当 LLM 服务不可用时自动跳过增强

详细使用指南请参考：LLM 增强功能使用指南

📡 API 接口

搜索接口

POST /search

请求参数:

{
    "query": "搜索关键词",
    "max_results": 10,
    "sources": ["zai", "wechat"],
    "include_content": true,
    "filters": {
        "time_range": "month",
        "domain": "www.sohu.com"
    },
    "llm_summary": true,
    "llm_tags": true,
    "llm_per_result": false,
    "llm_max_items": 5,
    "llm_language": "zh",
    "model_provider": "zhipuai",
    "model_name": "glm-4"
}

响应格式:

{
    "success": true,
  "results": [
    {
      "title": "人工智能在医疗领域的应用",
      "url": "https://example.com/article1",
      "snippet": "人工智能技术正在医疗领域发挥重要作用...",
      "source": "zai",
      "score": 0.95,
      "llm_summary": "文章介绍了AI在医疗诊断中的应用",
      "labels": ["医疗AI", "诊断技术", "智能医疗"]
    }
  ],
    "total_count": 10,
    "query": "搜索关键词",
    "execution_time": 2.5,
    "sources_used": ["zai"],
    "cache_hit": false,
    "llm_summary": "智能生成的摘要...",
    "llm_tags": ["标签1", "标签2"],
  "llm_per_result": { ... }  
  // 兼容旧字段：同样的信息也包含在 results[*].llm_summary / results[*].labels 中
}

其他接口

GET /health - 健康检查
POST /suggestions - 搜索建议
GET /statistics - 系统统计
DELETE /cache - 清空缓存

🐳 Docker 部署

快速部署

# 启动服务
docker-compose up -d

# 查看日志
docker-compose logs -f

# 停止服务
docker-compose down

生产环境配置

设置环境变量
配置 Redis 缓存
启用日志记录
配置反向代理

🧪 测试

# 运行 LLM 功能测试
python tests/test_llm_functionality.py

# 测试智谱AI API
python tests/test_zhipuai_direct.py

# 测试 LLM 增强器
python tests/test_llm_enhancer_direct.py

# 运行所有测试
python -m pytest tests/

🤝 贡献

欢迎提交 Issue 和 Pull Request！

贡献指南

Fork 本仓库
创建特性分支 (git checkout -b feature/AmazingFeature)
提交更改 (git commit -m 'Add some AmazingFeature')
推送到分支 (git push origin feature/AmazingFeature)
打开 Pull Request

📄 许可证

本项目采用 MIT 许可证 - 查看 LICENSE 文件了解详情。

🙏 致谢

FastAPI - 现代化的 Web 框架
智谱AI - 提供强大的 LLM 服务
Redis - 高性能缓存数据库
Docker - 容器化部署平台

E-WebSearch - 让搜索更智能 🤖

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
.github/workflows		.github/workflows
api		api
core		core
docs		docs
examples		examples
tests		tests
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
__init__.py		__init__.py
config.py		config.py
docker-compose.yml		docker-compose.yml
dotenv.example		dotenv.example
pyproject.toml		pyproject.toml
pytest.ini		pytest.ini
requirements.txt		requirements.txt
run_api.py		run_api.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🚀 项目简介

🎯 核心特性

📦 项目结构

🚀 快速开始

1. 环境准备

2. 配置环境变量

3. 启动服务

4. 使用示例

基础搜索

启用 LLM 增强

🤖 LLM 增强功能

📡 API 接口

搜索接口

其他接口

🐳 Docker 部署

快速部署

生产环境配置

🧪 测试

🤝 贡献

贡献指南

📄 许可证

🙏 致谢

About

Uh oh!

Releases

Packages

Uh oh!

Languages

LBatsoft/e_websearch

Folders and files

Latest commit

History

Repository files navigation

🚀 项目简介

🎯 核心特性

📦 项目结构

🚀 快速开始

1. 环境准备

2. 配置环境变量

3. 启动服务

4. 使用示例

基础搜索

启用 LLM 增强

🤖 LLM 增强功能

📡 API 接口

搜索接口

其他接口

🐳 Docker 部署

快速部署

生产环境配置

🧪 测试

🤝 贡献

贡献指南

📄 许可证

🙏 致谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages