月上西楼!一行命令让本地大模型学会 DeepSeek 的深度思考!

by June 2025-03-04

OpenAI o1-pro 和 Google Gemini 1.5-pro 的”深度研究”(Deep Research)功能虽强大,但其闭源特性、高成本及数据安全隐患限制了国内用户的使用。为此,我们提出基于 LeetTools + DeepSeek 的开源替代方案,通过本地化部署与轻量化设计,实现更安全、灵活且低成本的深度研究报告生成。

🚀LeetTools:https://github.com/leettools-dev/leettools

演示

一、Deep Research 功能的魅力与局限

堪称大模型、超级搜索与研究助理的完美结合,Deep Research 就像一位能够在几分钟内完成人类专家数小时甚至数天工作的超级研究员。

Deep Research 为何备受青睐? 

当用户输入查询问题并选择该功能后,模型会自动检索分析海量优质在线资源,进行综合整理与深度加工,最终生成专业水准的综合报告。与普通搜索引擎相比,其优势显著。

  1. 复杂任务的端到端处理能力:Deep Research能够自主完成从问题解析、多源搜索、跨模态分析到结构化报告生成的全流程,将原本需要数天的人工研究压缩至5-30分钟。例如,在金融领域,它能自动分析10-K财报、整合市场数据并生成投资建议报告,显著降低专业研究门槛。
  2. 超人类级耐心与推理深度:通过端到端强化学习(RL)训练,Deep Research具备多步骤回溯与动态调整能力。它能规划搜索路径、验证假设,甚至在发现信息矛盾时重新修正研究方向,这种类人的迭代式思考远超传统搜索引擎的线性检索模式。
  3. 多模态信息整合与权威性保障:区别于普通搜索引擎仅提供链接列表,Deep Research可解析文本、图像、PDF及数据图表,并通过语义融合生成跨模态分析结论。其输出的研究报告严格标注引用来源,关键结论精确到原文段落,显著提升可信度。

现有深度研究功能的不足

尽管深度研究功能表现出色,但并非适用于所有用户,尤其是对中国用户及企业并不友好。一方面,OpenAI 不向中国大陆提供服务,且 Deep Research 仅向订阅 ChatGPT Pro 计划(每月 200 美元)的用户开放,使用成本高昂,限制了许多用户的使;另一方面,数据安全是企业级用户的关键考量,深度研究功能在降低幻觉方面仍依赖本地知识库,这可能导致企业隐私数据存在泄露风险。

为此,我们提出基于 LeetTools+DeepSeek+DeepResearch 的开源替代方案,通过本地化部署与轻量化设计,实现更安全、灵活且低成本的深度研究报告生成。

LeetTools 作为一体化工具链,无缝集成检索、分析与生成流程,无需依赖复杂的向量数据库(如 Milvus)或额外框架(如 LangChain),显著降低技术门槛。配合 DeepSeek 模型的强大推理能力,用户可快速构建符合企业级需求的深度研究系统。

二、结果展示及对比

为了让大家更直观地感受其效果,我们以 “agentic AI 与生成式 AI 将如何影响非技术领域工作?” 这一问题为例进行了测试,并生成了一份分析报告。相关的示例输出保存在目录 examples/deepseek/aijob.fireworks.md 中。同时也提供了由 OpenAI o1-pro 模型与 Google Gemini 1.5-pro 模型生成的报告链接,方便大家进行对比:

  • OpenAI o1-pro 模型输出:https://chatgpt.com/share/67a6a4db-1564-800f-baae-a6b127366947
  • Google Gemini 1.5-pro 模型输出:https://g.co/gemini/share/d63f48b93981

通过以上生成结果及对比,我们可以观察到在复现本地 DeepResearch 的过程中,LeetTools展现出了如下能力:

能力LeetTools
部署复杂度低(一键安装)
多数据源支持开箱即用
生成可解释性思维轨迹可视化
企业数据安全性端到端加密与本地缓存

三、部署与生成流程 

借助 fireworks.ai 的 DeepSeek 模型 API,LeetTools 的使用变得极其便捷。用户只需简单几步安装和配置,就能轻松运行并生成属于自己的深度研究报告。📌 第一步:环境配置

安装 LeetTools 并配置 DeepSeek API:

pip install leettools

创建环境变量文件 .env.fireworks:内容如下(请根据实际 API 密钥等信息进行修改)

cat > .env.fireworks <<EOF
EDS_DEFAULT_LLM_BASE_URL=https://api.fireworks.ai/inference/v1
EDS_LLM_API_KEY=fw_3ZS**********pJr
EDS_DEFAULT_INFERENCE_MODEL=accounts/fireworks/models/deepseek-r1
EDS_DEFAULT_EMBEDDING_MODEL=nomic-ai/nomic-embed-text-v1.5
EDS_EMBEDDING_MODEL_DIMENSION=768
EOF
📌 第二步:生成报告

最后,通过如下命令生成报告(生成结果将保存在指定的 aijob.fireworks.md 文件中):

leet flow -e .env.fireworks -t digest -k aijob.fireworks -q "How will agentic AI and generative AI affect our non-tech jobs?" -l info -o aijob.fireworks.md

详细的使用说明请参见项目文档。需要注意的是,一些较小的模型可能无法完全按照预定指令生成报告。如有特定模型的需求,请及时反馈,我们将努力优化支持相应模型。

四、LeetTools 的“思维轨迹”示例

值得一提的是,使用 DeepSeek – R1 模型配合 LeetTools 生成报告的有趣之处在于,用户可以观察到模型在规划与撰写各部分内容时的“思维轨迹”。

例如,在生成 “非技术领域工作中的岗位流失与新岗位创造” 这一章节时,模型会先从给定的上下文中提取关键点,像引用文献中的行业实例、劳动力影响及案例研究等,然后有条理地规划内容,先描述传统岗位被自动化取代的案例,再转入新岗位的创造,并准确引用相关数据和案例,确保段落逻辑清晰。这种透明的 “思维过程”,不仅让用户对报告内容的可靠性更有信心,还为理解 AI 内部决策过程提供了宝贵的参考。

以下示例展示了在生成“非技术领域工作中的岗位流失与新岗位创造”这一章节时,模型的内部规划与最终输出内容:

原始示例内容章节

标题:非技术领域中的岗位流失与创造

最终生成的章节内容:

五、总结

通过 OpenAI、Google Gemini 以及 LeetTools 等平台,我们可以看到当前大型语言模型在自动生成专业研究报告方面已取得显著进展。借助 DeepSeek 模型 API,不仅能够高效生成报告内容,还能追踪模型在规划和撰写过程中的“思维轨迹”,这对于理解 AI 内部决策过程提供了宝贵的参考。 

LeetTools+DeepSeek+DeepResearch 方案以“轻量化、透明化、安全化”为核心,大幅降低了深度研究功能的实现门槛。其开箱即用的特性与思维轨迹追溯能力,不仅适用于学术研究、商业分析,还可无缝集成至企业私有知识库,为数据敏感场景提供可靠支持。我们也期待未来能支持更多模型,并不断优化工具的适用性,满足用户多样化的研究需求。

🚀 立即体验:https://github.com/leettools-dev/leettools

留言

评论

暂时还没有一条评论.