探秘 DeerFlow:字节跳动开源的科研创作魔法盒!
1.前言
字节跳动于2025年5月9日开源了名为DeerFlow的全新Deep Research项目,该项目基于LangStack框架,旨在通过人工智能技术简化科研和内容创作流程。DeerFlow整合了语言模型、网络搜索、爬虫和Python代码执行等多种工具,支持深度研究、MCP集成、AI增强报告编辑以及播客生成等功能。
DeerFlow采用多Agent系统架构,包括协调器、规划器、研究团队和报告生成器等模块,能够实现人机协作和动态任务迭代,显著提升研究效率。例如,其Arxiv搜索功能可快速识别高质量学术资源,而AI驱动的内容创作模块则能自动生成播客脚本、音频合成和演示文稿。
该项目还强调灵活的协作机制,支持团队成员实时共享数据和模型,打破地域限制,促进知识交流。DeerFlow的开源不仅展示了字节跳动在AI领域的技术积累,也为全球研究者和开发者提供了一个高效的研究工具平台。
一张图给大家看一下项目功能特点。
那么如何运行这个项目和体验这个项目呢?今天就带大家体验一下这个项目。
2.DeerFlow 安装和使用
1.环境要求
确保您的系统满足以下最低要求:
- Python: 版本
3.12+
- Node.js: 版本
22+
2.安装
# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow# 安装依赖,uv将负责Python解释器和虚拟环境的创建,并安装所需的包
uv sync# 使用您的API密钥配置.env
# Tavily: https://app.tavily.com/home
# Brave_SEARCH: https://brave.com/search/api/
# 火山引擎TTS: 如果您有TTS凭证,请添加
cp .env.example .env# 查看下方的"支持的搜索引擎"和"文本转语音集成"部分了解所有可用选项# 为您的LLM模型和API密钥配置conf.yaml
# 请参阅'docs/configuration_guide.md'获取更多详情
cp conf.yaml.example conf.yaml# 安装marp用于PPT生成
# https://github.com/marp-team/marp-cli?tab=readme-ov-file#use-package-manager
brew install marp-cli
我们使用 git 把代码克隆
安装依赖,uv将负责Python解释器和虚拟环境的创建,并安装所需的包
修改配置文件
复制.env.example 变成 .env 同时修改.env相关配置
其中搜索引擎用到了tavily,我们把tavily 的api key填入配置文件,火山引擎TTS 我们目前用不到先不填写,修改后的配置文件内容如下:
# Application Settings
DEBUG=True
APP_ENV=development# Search Engine
SEARCH_API=tavily
TAVILY_API_KEY=tvly-xxx
# JINA_API_KEY=jina_xxx # Optional, default is None# Optional, volcengine TTS for generating podcast
VOLCENGINE_TTS_APPID=xxx
VOLCENGINE_TTS_ACCESS_TOKEN=xxx
# VOLCENGINE_TTS_CLUSTER=volcano_tts # Optional, default is volcano_tts
# VOLCENGINE_TTS_VOICE_TYPE=BV700_V2_streaming # Optional, default is BV700_V2_streaming# [!NOTE]
# For model settings and other configurations, please refer to `docs/configuration_guide.md`
同样我们需要修改 conf.yaml, 这里主要是用到的基础模型,我们换成google gemini2.5pro
BASIC_MODEL:base_url: https://geminicloudflare.duckcloud.fun/v1model: "gemini-2.5-flash-preview-04-17"api_key: xxxx
以上我们就完成 DeerFlowa环境安装和基础配置
可选,通过pnpm安装Web UI依赖:
cd deer-flow/web
pnpm install
3.控制台UI
接下来我们使用控制台UI启动程序页面访问
uv run main.py
这样我们就可以通过交互方式 提问题了。
我的问题
GitHub上最热门的仓库有哪些?
最后搜索的结果
控制台的确给我搜索,这里大家觉的这种交互方式不好看,我们可以使用Web UI方式
4.Web UI
在windows平台上,我们启动一个叫做bootstrap.bat 文件
我们在浏览器中输入http://localhost:3000
看到上面页面就可以实现访问了。
我们先拿官方的例子
撰写关于南京传统美食的文章
这个效果明显比控制台的输出效果强很多, 还有搜索的图片信息。
最终生成的来的报告(报告有点长我只截图一部分)
还可以生成播客,由于我上面火山引擎没有配置TTS 所以声音出不来(大家可以自己去配置体验一下)
3.总结
DeerFlow的发布标志着字节跳动在AI技术与开源领域的进一步深耕。作为一款开源框架,DeerFlow不仅为用户提供了一个强大的研究工具,也为开源社区注入了新的活力。未来,随着更多开发者参与其中,DeerFlow有望成为深度研究和自动化分析领域的重要工具,并推动相关技术的持续进步。感兴趣的小伙伴可以按照上面步骤自己部署体验一下。今天的分享就到这里结束了,我们下一篇文章见。