当前位置: 首页 > news >正文

探秘 DeerFlow:字节跳动开源的科研创作魔法盒!

1.前言

字节跳动于2025年5月9日开源了名为DeerFlow的全新Deep Research项目,该项目基于LangStack框架,旨在通过人工智能技术简化科研和内容创作流程。DeerFlow整合了语言模型、网络搜索、爬虫和Python代码执行等多种工具,支持深度研究、MCP集成、AI增强报告编辑以及播客生成等功能。

DeerFlow采用多Agent系统架构,包括协调器、规划器、研究团队和报告生成器等模块,能够实现人机协作和动态任务迭代,显著提升研究效率。例如,其Arxiv搜索功能可快速识别高质量学术资源,而AI驱动的内容创作模块则能自动生成播客脚本、音频合成和演示文稿。

该项目还强调灵活的协作机制,支持团队成员实时共享数据和模型,打破地域限制,促进知识交流。DeerFlow的开源不仅展示了字节跳动在AI领域的技术积累,也为全球研究者和开发者提供了一个高效的研究工具平台。

一张图给大家看一下项目功能特点。

image-20250511164201449

那么如何运行这个项目和体验这个项目呢?今天就带大家体验一下这个项目。

2.DeerFlow 安装和使用

1.环境要求

确保您的系统满足以下最低要求:

  • Python: 版本 3.12+
  • Node.js: 版本 22+

image-20250511154555603

image-20250511154652429

2.安装

# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow# 安装依赖,uv将负责Python解释器和虚拟环境的创建,并安装所需的包
uv sync# 使用您的API密钥配置.env
# Tavily: https://app.tavily.com/home
# Brave_SEARCH: https://brave.com/search/api/
# 火山引擎TTS: 如果您有TTS凭证,请添加
cp .env.example .env# 查看下方的"支持的搜索引擎"和"文本转语音集成"部分了解所有可用选项# 为您的LLM模型和API密钥配置conf.yaml
# 请参阅'docs/configuration_guide.md'获取更多详情
cp conf.yaml.example conf.yaml# 安装marp用于PPT生成
# https://github.com/marp-team/marp-cli?tab=readme-ov-file#use-package-manager
brew install marp-cli

我们使用 git 把代码克隆

image-20250511154755031

安装依赖,uv将负责Python解释器和虚拟环境的创建,并安装所需的包

image-20250511154928017

修改配置文件

复制.env.example 变成 .env 同时修改.env相关配置

其中搜索引擎用到了tavily,我们把tavily 的api key填入配置文件,火山引擎TTS 我们目前用不到先不填写,修改后的配置文件内容如下:

# Application Settings
DEBUG=True
APP_ENV=development# Search Engine
SEARCH_API=tavily
TAVILY_API_KEY=tvly-xxx
# JINA_API_KEY=jina_xxx # Optional, default is None# Optional, volcengine TTS for generating podcast
VOLCENGINE_TTS_APPID=xxx
VOLCENGINE_TTS_ACCESS_TOKEN=xxx
# VOLCENGINE_TTS_CLUSTER=volcano_tts # Optional, default is volcano_tts
# VOLCENGINE_TTS_VOICE_TYPE=BV700_V2_streaming # Optional, default is BV700_V2_streaming# [!NOTE]
# For model settings and other configurations, please refer to `docs/configuration_guide.md`

同样我们需要修改 conf.yaml, 这里主要是用到的基础模型,我们换成google gemini2.5pro


BASIC_MODEL:base_url: https://geminicloudflare.duckcloud.fun/v1model: "gemini-2.5-flash-preview-04-17"api_key: xxxx

以上我们就完成 DeerFlowa环境安装和基础配置

可选,通过pnpm安装Web UI依赖:

cd deer-flow/web
pnpm install

image-20250511160236704

3.控制台UI

接下来我们使用控制台UI启动程序页面访问

uv run main.py

image-20250511160638323

这样我们就可以通过交互方式 提问题了。

我的问题

GitHub上最热门的仓库有哪些?

image-20250511160801685

最后搜索的结果

image-20250511161029508

控制台的确给我搜索,这里大家觉的这种交互方式不好看,我们可以使用Web UI方式

4.Web UI

在windows平台上,我们启动一个叫做bootstrap.bat 文件

image-20250511160948318

image-20250511161333910

image-20250511161345162

我们在浏览器中输入http://localhost:3000

image-20250511161435115

看到上面页面就可以实现访问了。

image-20250511161520565

我们先拿官方的例子

撰写关于南京传统美食的文章

image-20250511161711075

这个效果明显比控制台的输出效果强很多, 还有搜索的图片信息。

最终生成的来的报告(报告有点长我只截图一部分)

image-20250511161850274

还可以生成播客,由于我上面火山引擎没有配置TTS 所以声音出不来(大家可以自己去配置体验一下)

image-20250511162042036

image-20250511162104060

3.总结

DeerFlow的发布标志着字节跳动在AI技术与开源领域的进一步深耕。作为一款开源框架,DeerFlow不仅为用户提供了一个强大的研究工具,也为开源社区注入了新的活力。未来,随着更多开发者参与其中,DeerFlow有望成为深度研究和自动化分析领域的重要工具,并推动相关技术的持续进步。感兴趣的小伙伴可以按照上面步骤自己部署体验一下。今天的分享就到这里结束了,我们下一篇文章见。

相关文章:

  • python使用AES进行加密和解密
  • HTOL集成电路老化测试学习总结-20250510
  • k8s的节点是否能直接 curl Service 名称
  • 实战演练:用 AWS Lambda 和 API Gateway 构建你的第一个 Serverless API
  • langchain 接入国内搜索api——百度AI搜索
  • Python-86:奇妙货币交易问题
  • 基于SpringBoot的在线教育管理系统
  • Qt 界面优化(绘图)
  • 计算机网络--2
  • 黑名单中的随机数-leetcode710
  • PostgreSQL 的 pg_column_size 函数
  • 用一张网记住局域网核心概念:从拓扑结构到传输介质的具象化理解
  • 【计算机网络01】 网络组成与三种交换方式
  • 万字了解什么是微前端???
  • Redis爆肝总结
  • CacheBackEmbedding 组件的运行流程和使用注意事项
  • Python-MCPAgent开发-DeepSeek版本
  • iOS实名认证模块的具体实现过程(swift)
  • 【C++】16.继承
  • 【东枫科技】使用LabVIEW进行深度学习开发
  • 走进“双遗之城”,领略文武风采:沧州何以成文旅新贵
  • 人民币对美元即期汇率盘中创半年新高,离岸市场升破7.2
  • 老镇老宅楼:破旧,没产证,要不要更新?
  • 李公明 | 一周画记:印巴交火会否升级为第四次印巴战争?
  • 巴基斯坦称未违反停火协议
  • 经济日报刊文:品牌经营不能让情怀唱“独角戏”