当前位置: 首页 > news >正文

GoogleAgent-quickstart 学习笔记

谷歌代理开发工具包 (ADK)快速入门

官方文档 : google.github.io/adk-docs/get-started/quickstart/

一、Quickstart

1.配置环境

参照官方文档配置环境、创建项目结构、获取APIkey (注意Google AI Studio的API密钥设置了地理位置限制,仅允许特定国家/地区访问,需要先挂代理)

在这里插入图片描述

2.运行项目

运行adk web后打开http://localhost:8000/,经测试对话功能和agent的时间、天气查询功能均能正常使用(demo代码仅支持new york单个城市)
在这里插入图片描述


二、Quickstart (streaming)

1.配置环境

和no streaming的流程基本一样,参照官方文档完成。
在这里插入图片描述

2.运行项目

在这里插入图片描述
在这里插入图片描述
通过测试发现这个demo虽然代码简短,且仅调用了 google_serach 这一个tool,却可以很有效地识别图片、语音、视频、通过搜索回答实时问题。

3.demo分析

ADK Streaming和Gemini模型的协同设计实现了这种"简单调用,多模态响应"的效果,核心原因有三:

  1. 模型多模态原生支持:gemini-2.0-flash-exp本身是多模态模型,内置理解图像/语音/视频的能力。ADK Streaming通过框架层自动将音视频流转换为模型可理解的格式,无需额外工具。

  2. 实时数据流处理:ADK Streaming架构采用异步双向通信管道,能实时处理流式输入(麦克风/摄像头数据流)并分片传输给模型,同时保持对话上下文连贯。

  3. 工具链隐式集成:虽然只显式添加google_search,但ADK底层已集成语音识别(STT)、语音合成(TTS)、视频帧分析等基础工具链,通过参数配置自动激活

这种模式特别适用于AI原生应用开发:​​用大模型的多模态能力作认知引擎,用框架处理传感器级的信号转换,开发者只需聚焦业务逻辑编排​​。

4.构建自定义流式app

原先使用的是 ADK 自带的默认界面,这一步使用 FastAPI 和 ADK Streaming 构建自定义流式应用,学习如何集成 ADK 的 agent 到 Web 服务中。(官方文档中给出的代码只包含基础的文字聊天界面)
在这里插入图片描述

在这里插入图片描述

相关文章:

  • 23种GoF设计模式
  • 【开题报告+文档+源码】基于SpringBoot教学评价评教系统
  • 数据采集与Web组态显示的技术实现路径解析
  • Android 16应用适配指南
  • 数据集成工具推荐,支持数据库、API、消息文件等集成技术,并具备低代码与可视化配置特性
  • ps 人像学习
  • 方案精读:51页 财政数据信息资源目录数据标准存储及大数据资产化规划方案【附全文阅读】
  • langchain之agent系列:zero-shot-react-description agent
  • 【models】Transformer 之 各种 Attention 原理和实现
  • LLM KV Cache压缩技术解析:Multi-Head Key-Value共享方案
  • openharmony—release—4.1开发环境搭建(踩坑记录)
  • 软考 系统架构设计师系列知识点 —— 设计模式之抽象工厂模式
  • WPS复制粘贴错误 ,文件未找到 mathpage.wll
  • Android学习22 -- perfetto
  • 【自动驾驶 机器人】速度规划 |梯形/S型速度曲线
  • python中的字符串
  • 嵌入式面试笔试那点事2:2025.4.13
  • Vue事件修饰符课堂练习
  • golang-context详解
  • MySQL varchar 最大长度
  • 郭继孚被撤销全国政协委员资格,此前为北京交通发展研究院长
  • 演员刘美含二手集市被曝售假,本人道歉
  • 商超展销延长、专区专柜亮相……上海“外贸拓内销”商品与市民见面
  • 伊朗港口爆炸已致40人死亡
  • 原创话剧风向标!这个展演上《大宅门》《白鹿原》先后上演
  • 教育强国建设基础教育综合改革试点来了!改什么?怎么改?