当需要做行业调研、市场分析、技术选型调研时,往往需要花费数小时甚至数天在互联网上搜索、阅读、归纳整理。GPT Researcher正是为解决这个痛点而生的——它是一个 autonomous research agent,能够在指定主题上自动完成深度调研,并输出一份结构化的研究报告。
项目简介
GPT Researcher是由assafelovic开发的 autonomous AI研究代理,基于Python语言构建,底层使用LangChain框架。它能够针对任意主题,自动发起多个并行搜索任务、访问搜索结果页面、抓取关键信息、提炼观点,最终综合整理成一份完整的研究报告。项目托管于 GitHub,采用 Apache-2.0 开源协议。
核心特色功能
1. 全 autonomous 调研流程
用户只需输入一个研究主题(如「2026年AI芯片市场分析」),GPT Researcher会自动:生成多个相关搜索查询词、在Google/Bing等搜索引擎发起并行搜索、抓取排名靠前的结果页面、过滤低质量内容、提炼每篇内容的关键信息、最后综合所有信息生成结构化报告。全程无需人工干预。
2. 并行搜索与爬取,效率极高
系统会同时发起多个搜索请求(通常5-10个),并行爬取多个网页,充分利用网络IO等待时间。研究一个主题通常只需3-5分钟,而人工做同样的工作可能需要数小时。
3. 多种LLM后端支持
支持OpenAI GPT系列、Anthropic Claude、Azure OpenAI、本地模型(通过Ollama/LM Studio)等。可以根据调研任务的复杂度和预算选择合适的模型。
4. 灵活的输出格式
生成的报告可选不同详细程度(简短摘要/完整报告),支持输出为Markdown、HTML等格式,方便后续编辑或直接发布。
5. 资源访问控制与过滤
可以指定只爬取特定域名(如只从权威媒体获取信息),也可以排除某些低质量来源。系统内置了内容质量评分机制,会自动过滤广告多、信息少的页面。
6. 本地部署,数据不外传
支持完整的Docker本地部署,所有爬取、LLM调用均在本地完成,企业用户无需担心敏感信息泄露。
安装步骤
环境要求:Python 3.10+、OpenAI API Key或其他LLM后端
方式一:Docker快速部署(推荐)
git clone https://github.com/assafelovic/gpt-researcher.git cd gpt-researcher cp .env.example .env # 编辑 .env 填入 OPENAI_API_KEY 等配置 docker-compose up -d
访问 http://localhost:8000 打开Web界面。
方式二:前端+后端分离部署
# 后端 cd gpt-researcher/backend pip install -r requirements.txt python main.py # 前端(新开终端) cd gpt-researcher/frontend npm install npm run dev
方式三:仅后端API调用
pip install gpt-researcher # 通过Python API调用 from gpt_researcher import ResearchAgent agent = ResearchAgent(topic="AI芯片行业分析") report = await agent.run()
使用方法
Web界面使用:
1. 在输入框输入研究主题
2. 选择详细程度(Outline/Report)和输出格式
3. 点击「Start Research」,等待3-5分钟
4. 系统自动生成报告,可在线查看或导出
API调用示例:
import asyncio
from gpt_researcher import ResearchAgent
async def main():
agent = ResearchAgent(
topic="2026年电动汽车市场趋势",
report_type="research", # research | outline
sources=[] # 可指定特定URL来源
)
report = await agent.run()
print(report)
asyncio.run(main())
配置文件说明(.env):
OPENAI_API_KEY=your_key_here TAVILY_API_KEY=your_tavily_key # 可选,增强搜索质量 ANTHROPIC_API_KEY=your_claude_key # 可选,使用Claude
适用场景
• 行业研究报告:投资分析、市场调研、竞争情报收集
• 技术选型调研:评估不同技术方案的优缺点和适用场景
• 学术文献综述:快速了解某一研究领域的研究现状和主流方法
• 内容创作准备:博客文章、播客、演讲稿的前期资料收集
• 竞品分析:系统化收集和分析竞争对手的产品、定价、市场动态信息
• 法律/合规调研:收集特定法规、判例、行业标准等信息
开源协议
GPT Researcher采用 Apache License 2.0 开源协议,允许自由使用、修改和商业应用。
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。












暂无评论内容