OrphanCure-AI Pro 是一个专为药物重定位(Drug Repurposing)设计的智能体(Agent)。它不仅仅是一个简单的问答机器人,而是一个集成了多源异构数据检索、逻辑推理和严格证据验证的科研辅助工具。
该项目旨在解决生物医药领域 AI 应用的核心痛点——“幻觉”。通过强制引用溯源和逻辑验证层,它能确保生成的假设都有据可查。
-
** 严格的证据验证 (Anti-Hallucination)**
- 内置
Verifier模块:强制 LLM 在生成结论时提取原始文献的引用片段。 - 使用模糊匹配算法(Fuzzy Matching)自动比对生成的引用与 PubMed 原始摘要,标记未通过验证的风险声明。
- 内置
-
** 多源数据融合**
- OpenTargets Platform: 获取经过验证的靶点、疾病关联评分及药物作用机制(MoA)。
- PubMed/MEDLINE: 实时检索最新的临床试验、系统综述和学术论文。
-
** 智能实体消歧 (Entity Resolution)**
- 结合模糊搜索与 LLM 语义理解,自动识别并纠正药物/疾病名称拼写错误(如 "Metformn" -> "Metformin")。
- 支持 Human-in-the-Loop(人机回环),允许专家在分析前确认实体选择。
-
** 可视化与结构化输出**
- 生成药物-靶点-疾病相互作用网络图(Graphviz)。
- 提供符合严格 Schema 的 JSON 报告,包含验证状态、置信度评分和风险标识。
系统采用模块化设计,主要包含以下组件:
graph TD
User[用户输入] --> Res[实体消歧层]
Res -->|纠错与确认| OT[OpenTargets 服务]
subgraph Data Retrieval
OT -->|获取共有靶点| Targets[靶点数据]
OT -->|生成搜索策略| PubMed[PubMed 服务]
PubMed -->|检索 & 排序| Papers[文献摘要数据]
end
subgraph Synthesis & Verification
Targets & Papers --> LLM[LLM 推理引擎]
LLM -->|生成假设 & 引用| RawRep[原始报告]
RawRep --> Verifier[证据验证器]
Verifier -->|比对引用片段| FinalRep[最终验证报告]
end
FinalRep --> UI[Streamlit 界面]
确保您的系统已安装 Python 3.8+。
MacOS: brew install graphviz
Ubuntu/Debian: sudo apt-get install graphviz
Windows: 下载安装包 并将 bin 目录添加到系统 PATH 环境变量中。
git clone [https://github.com/YourUsername/OrphanCure-AI.git](https://github.com/YourUsername/OrphanCure-AI.git)
cd OrphanCure-AI
pip install -r requirements.txt本项目默认配置为使用 DeepSeek-V3 模型(通过 SiliconFlow API)。您需要获取一个 API Key。
如果没有 Key,请前往 SiliconFlow 或相关服务商注册。
注:如需更改模型提供商(如使用 OpenAI 原生 API),请修改 app.py 中的 LLMService 类。