当前位置: 首页 > news >正文

【一手实测】字节豆包 1.6 + Trae + 火山 MCP + FaaS:AI云原生 Agent 开发部署全流程体验!

原创 Aitrainee AI进修生 2025年06月13日 16:42 湖南 标题已修改

缘起 ——

火山引擎在 2025 原动力大会上,也端出了自家的豆包大模型:Doubao-Seed-1.6 系列。

这三兄弟都支持文本、图片、视频输入,都带着 256K 的长上下文。

豆包三剑客

Doubao-Seed-1.6-thinking,这是火山目前最强的思考模型,在编码、数学、逻辑推理这些基础能力上又进了一步。它的思考模式是强制开启的,关不掉。

然后是 Doubao-Seed-1.6,All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。

此外,你给它一段文字或图片描述,它能直接给你生成高质量的前端页面,样式还挺精美(我们后文用它做网站、构建Agent)。

最后是 Doubao-Seed-1.6-flash,主打一个字:快。TPOT 只要 10ms,延迟极低,适用于对速度要求高的场景。

Doubao 1.6 设计一个落地页?我给它喂了一份"超纲"需求

前段时间,在优化公众号文章排版,积累了些经验。我想把这些想法、经验转化成一个产品原型,同时测试一下这些AI。

这玩意儿是个"AI 智能排版增强服务",专门给内容创作者用的。

我想看看,现在的 AI,能不能帮我设计一个高转化率的落地页。

于是,我没跟它客气,直接扔过去一份堪称"变态级"的设计需求文档。

设计需求

BeforeAfter魔法般的转变

从【导航栏】到【主视觉区】,每个细节都得安排得明明白白。主视觉,我要求它搞个特有冲击力的"Before & After"对比动画,要那种"魔法般"的转变效果,让用户一眼就看到产品的价值。然后是【社会认同】,得有 logo 墙,告诉大家"超过 1000+ 创作者和 50+ 新媒体团队都在用"。

核心功能,我让它用卡片网格布局展示三个点:

  • 能读懂你:不光排版,还能修正语法、理顺句子,但保留你的个人风格。

  • 专属设计师:一键应用各种风格模板,或者直接跟 AI 说你想要的"感觉"。

  • 让图片讲故事:自动处理图片,加圆角、阴影,智能推荐图注、加入SVG等等。

工作流程,我让它设计成"三步,见证奇迹":粘贴初稿 -> 选择风格 -> 一键复制。

我还给 AI 提了更"玄学"的要求。

我让它把这个落地页,构想成一个 有空间意境 的地方,比如"深夜的灵感阁楼"、"充满活力的创意工坊",整体氛围要"神秘并激发好奇,简约却不失格调"。交互体验,要像"与一位有趣的灵魂对话"或者"翻阅一本精心编排的互动书籍"。

我喜欢 玄学。我想让ai自己发挥,就像以前的AI自己决策思考提示词一样。

灵感阁楼创意工坊玄学空间意境

布局逻辑,我给了它"主题岛屿式"、"时间轴式"、"仪表盘式"这些选项。

动效设计,我也没放过。板块过渡要像"电影胶片切换"或者"水墨在宣纸上晕开",交互反馈要清晰明确,信息强调要用"微妙的脉冲效果"或者"呼吸灯动画"。

基本上,我把一个资深产品经理+设计师+前端工程师可能要思考的所有东西,都压缩成了一份指令,一股脑儿地喂给了 AI。我想看看,它到底能消化多少,又能给我带来怎样的惊喜。

在火山引擎:https://exp.volcengine.com/ark?model=doubao-seed-1-6-250615,这里我们选择Doubao-Seed-1.6来试试。

打开canvas模式,把提示词输给他,先通过生成单个Html网页来实现。

canvas模式

效果非常不错,你能想到通过一个提示词,就能把你的想法变成了现实吗:

生成效果

不过,通过单个htm实现的网页,在某些点击、动效等等还是比不上现代化Web开发框架。

所以我用Trae + Doubao-Seed-1.6 + Next.js + Shadcn UI 重写了一遍。这并不难,先初始化 Next.js框架(如下命令)得到项目文件夹:

npx create-next-app@latest FinalTouch-AI --ts --tailwind --eslint --src-dir --app --import-alias "@/*" -y && cd my-app && npx shadcn-ui@latest init -y && npx shadcn-ui@latest add all -y    

接着用Trae(因为上线了1.6)打开这个文件夹再输入上面的提示词。

效果如下:

,时长00:24

是不是好看、工整、优秀的许多?后面我还让他加入了豆包模型做核心服务支撑。

Next.js版本

核心服务如下:

核心服务

通过AI实现了文本排版。这一块的更多细节,我们以后再单独写。这个提示词的构建设计了许多东西:关于saas网站如何提高转化率?怎么根据你一个想法让ai来构建?让他自发的适配更好的风格等等...

接下来我要介绍一个更有意思的:

AI 云原生正在加速 Agentic AI 时代的到来

工具调用模型推理应用部署Trae豆包1.6FaaS火山方舟 MCP全链路闭环开发范式模块化组装,专注业务逻辑

在 2025 原动力大会上,字节跳动提出了全新的 AI 云原生 Agent 开发范式:借助 Trae + 火山方舟 MCP + 豆包大模型 + FaaS,开发者可以实现从 工具调用 → 模型推理 → 应用部署 的全链路闭环,打通了智能 Agent 开发的完整流程。

这一范式的核心,是通过"模块化组装"的方式,彻底摆脱过去繁琐的手动集成与开发,真正让开发者专注于业务逻辑,而非底层细节。我们具体来看一下。

我想构建一个Agent:

你是一个名为"CityWalk AI Planner"的智能城市漫游助手。你的核心使命是为用户提供高度个性化、充满惊喜、且充分考虑实时情况的一日城市漫游(CityWalk)路线规划。你不仅是一个信息聚合器,更是一位懂生活、有品味、善于规划的本地向导。将你最终规划好的所有内容,构思并编程生成一个【精美的、交互式的单页HTML网页】。

我们需要使用这几个MCP

MCP工具

其中 VeFaaS MCP用于前端网页应用部署,比如这个html做好了之后可以一键调用,发布到火山引擎。并返回可访问的链接。

这样就可以在一个IDE里面开发和部署了,就像以前说Windsurf那个功能一样。

IDE一键部署云端可访问链接

这些mcp都是火山引擎云端托管的,配置很简单。去火山引擎,安装步骤如下:

注意,你选择远程即可。免费。

火山引擎配置

接着我们需要在Trae里面创建一个Agent(类似于Cursor自定义Agent),可以配置使用哪些工具和MCP,以及提示词:

Trae Agent配置

从提示词的设计可以看出,我们构建的并不只是一个简单的旅游问答助手。考虑到 1.6 模型具备 Auto-Think 的能力,我们在提示词中巧妙加入了大量问号,以此引导模型进行更深层次的主动思考。

这种提示词设计,既有明确的结构规范,也保留了足够的开放性,目的是激发模型的"思考本能",而不是仅仅被动回答。它更像是在与一个具备判断力和意图感的智能体对话,而不是传统的工具式交互。

然后我们就直接@刚创建的这个智能体给需求即可。

Agent使用

📱 可上下滑动查看完整内容

效果如下:

生成效果1

📱 可上下滑动查看完整内容

case2:西安七日游

西安七日游

📱 可上下滑动查看完整内容

case3:新加坡七日游

新加坡七日游

📱 可上下滑动查看完整内容

接着,VeFaaS MCP可以用于前端网页部署:网页可以一键部署。

这样提示:把这个html网页发布到faas,并返回一个可访问链接。

一键部署

你可以在火山引擎函数服务这里查看:

函数服务

可以看到他部署好的代码以及连接信息:

部署信息

火山引擎可能也是国内第一个把 MCP 部署搞得这么端到端的云厂商。

端到端云厂商

有了这个。我们下面的测评内容,也可以一键被其他人访问。

Doubao Seed 1.6 模型测评

这三个模型都是支持视频的。我们可以试试让他看视频生成网页。这是一个鼠标点击按钮滑动+变色的视频。

,时长00:22

很有挑战性。丢给它

视频挑战

除了logo那小部分,基本上很还原了。

还原效果

视频理解AI生成网页视频理解与代码生成多模态交互新体验

以前gemini说的那些,都可以试试了。编码封神,Gemini 2.5 Pro (I/O 版)视频秒转 App!网友:比 o3/Claude 强,Vibe 程序员集结!

另外有一点。蛮爽的是他图片上传竟然支持gif。gemini不支持。

GIF支持

我上传了一个解释RAG、Agentic相关的GIF和一张排版不错的网页截图。想让他理解MCP内容然后按照第二种风格转换表现形式。

MCP理解

输出:

MCP输出

📱 可上下滑动查看完整内容

其实按照gif里面的mcp的内容来说,选择第2种表现形式并不是一种很好的方式。不过他也按照我们的要求改成了这种方框的形式。

并且方框里面都加入了能体现gif流程的标号。

原GIF RAG、Agentic RAG 分别是7个和12个标号,豆包都一一找到并且对应了,视觉理解能力这块确实不错。

多模态输入和风格转化视觉理解。可玩性很高了。

要个啥的UI 动效组件,搞个啥广告展示页、作品集、动态专题页等等

UI组件

它甚至可以把思维导图一键转化成课程介绍网页

"请根据思维导图生成一个课程介绍 html 网页":

思维导图转换1

📱 可上下滑动查看完整内容

思维导图转换2

📱 可上下滑动查看完整内容

内容详实美观,还留了个报名地址。

你的头脑风暴,模糊的想法,可以一键传递给他人了。

还有这种写了个草稿大概的,它也能转化的很好。

草稿转换

有些模糊不清的数据表格也可以做成美观的网页。

根据这些数据生成一个美观的 html 介绍网页:

数据表格转换1

📱 可上下滑动查看完整内容

数据表格转换2

📱 可上下滑动查看完整内容

你把网页长截图给他,它能复刻一个高度相似的html

网页复刻1

📱 可上下滑动查看完整内容

网页复刻2

📱 可上下滑动查看完整内容

让它参考下面Openai的排版格式,改改颜色,帮我写一个介绍 Claude的 html 网页

Claude介绍1

📱 可上下滑动查看完整内容

Claude介绍2

📱 可上下滑动查看完整内容

截图网站复刻:

网站复刻1

📱 可上下滑动查看完整内容

网站复刻2

📱 可上下滑动查看完整内容

参考下面截图网页的风格,帮我写一个介绍 deepseek 的 html 网页

Deepseek介绍1

📱 可上下滑动查看完整内容

Deepseek介绍2

📱 可上下滑动查看完整内容

按照我的这个Saas网站的风格。

SaaS风格

帮我生成一个风格类似的旅行日记网页:

旅行日记网页

📱 可上下滑动查看完整内容

模型表现总结

编码能力vsClaude 4价格优性能与性价比双优不输Claude,比Deepseek好用

豆包大模型升级之后效果非常不错。从测试体验来看。1.6 模型在处理复杂提示指令(用上思考模型很强)、编码上效果上不输Claude 4,比Deepseek好用。

此外,上次卡总的“7家大模型做高考数学题的真实分数”,豆包位列第二,也是看得出来有点东西。

图片

价格相比Claude也便宜很多,豆包 1.6 模型价格对照:

价格对比1

价格对比2

AI 云原生生态的未来

字节生态工具链云服务MCP全栈Agent开发生态开箱即用的企业级解决方案

最后,字节内部已经有豆包 App、Coze 空间这些成熟的 Agent 应用了。这也让火山引擎能更好的这些复刻成熟产品的经验。

我们搭建Agent并部署的门槛现在其实已经很低了。

在这次 火山引擎 Force 大会 大会上,他们会现场演示好几个 Agent demo 的完整开发过。

Trae + 火山方舟 MCP + 豆包大模型 + Faas"这么一套组合拳,是一个新理念:AI 云原生开发。

火山引擎提供的是强大的模型+全栈的 Agent 开发工具和丰富的生态,再加上自然语言调度云的能力,能让你开发出生产环境里跑的、对开发者友好的 Agent。

工具服务、云服务、字节的生态服务,全都支持 MCP 协议。

这就实现了一个"工具调用 → 模型推理 → 部署运营"的深度协同。云服务也支持 MCP,形成了一套标准化的协作生态,能直接复用云上成熟的部署运维体系,避免了 Agent 开发和部署环境脱节的尴尬,还能动态调度算力。主打一个企业级 Agent 构建"开箱即用"。

这套平台能力,不只是停留在 PPT 上。

有关信息显示,汽车行业,有将近八成的主流车企,把豆包大模型用在了智能座舱、AI 升级这些核心场景里。

教育领域,浙江大学用火山引擎的 HiAgent 平台和豆包大模型,花了一个星期,就搞定了一个叫“浙大先生”的智能体平台。服务着超过五万名师生。

体验开发部署

One More Thing

从简单的文本生成,到复杂的应用开发与云端部署,豆包 1.6 + 火山方舟的全栈解决方案,展现了 AI 云原生时代的无限可能。

未来,每一个创意都可能在几分钟内变成现实。

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

探索AI前沿,分享实战经验

Aitrainee

 暗色模式,我贼亮 

喜欢作者

SOTA 模型 · 目录

上一篇Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?

阅读 1933

修改于2025年06月13日

留言 3

写留言

  • 幼笙

    朋友湖南2天前

    文章中火山引擎MCP安装教程视频:https://lf3-static.bytednsdoc.com/obj/eden-cn/lm_sth/ljhwZthlaukjlkulzlp/ark/assistant/videos/LAS.mp4

  • AI进修生

    作者3天前

    漏了一图,使用 vefaas mcp部署时(还要手动去火山引擎函数服务的触发器那里创建实例和服务)

  • AI进修生

    作者3天前

    第二个构建Agent的提示词是这个,排版后给漏了

已无更多数据

相关文章:

  • Java 9 新特性全面解析:革命性模块化系统与十大核心功能详解
  • Gödel Rescheduler:适用于云原生系统的全局最优重调度框架
  • Windows系统安装Java web开发环境
  • ELK在Java的使用
  • 华为OD-2024年E卷-找终点[100分] -- python
  • Anaconda 安装教程(Windows/macOS/Linux)
  • 数字孪生技术助力:UI前端设计的精准度与效率双提升
  • STM32L431中,低功耗模式下的仿真调试功能受到限制
  • 解锁AI密码:全面赋能海外社媒矩阵运营
  • 【2023 - 2025 年】6大PLM系统主要干活,提升项目管理效率
  • SEO 与性能优化说明文档
  • Leap Micro不可变Linux
  • USB接口DP(D-)和DM(D+)英文全称
  • EMAGE:通过具表现力的掩码音频动作建模,实现统一的整体共语姿态生成
  • 设置Git和Github
  • 【Python打卡Day44】预训练模型 @浙大疏锦行
  • ACM设计平台-核心模块解析-赵家康
  • Python实现高效导入Excel数据到ClickHouse
  • ImageNet 上的安全外包神经网络推理
  • HarmonyOS5 购物商城app(二):购物车与支付(附代码)
  • 企业网站设计文档/百度上怎么免费开店
  • 高级web程序设计——asp.net网站开发课后答案/google关键词挖掘工具
  • 天津疫情最新通报/廊坊百度快照优化排名
  • 成品免费的视频软件有哪些好用点/百度seo排名技术必不可少
  • 六安网站建设/杭州seo优化公司
  • 网站的前端开发/陕西疫情最新消息