当前位置: 首页 > news >正文

文心一言开发指南08——千帆大模型平台推理服务API


版权声明

  • 本文原创作者:谷哥的小弟
  • 作者博客地址:http://blog.csdn.net/lfdfhl

在这里插入图片描述

推理服务API概述

百度智能云千帆平台提供了丰富的推理服务API,包括对话Chat、续写Completions、向量Embeddings、批量预测等API能力。

  • 对话Chat:支持创建chat,用于发起一次对话。
  • 续写Completions:支持创建completion,用于发起一次续写请求,不支持多轮会话等。
  • 向量Embeddings:支持Embeddings,用于根据输入内容生成对应的向量表示。
  • 重排序Reranker:支持重排序Reranker,用于重新排序向量模型返回的top-k文档,优化语义搜索结果
  • 自定义模型:平台支持HuggingFace Transformer架构的自定义大模型导入,将自定义模型发布为服务,并支持通过相关API调用该服务。
  • 图像Images:提供图像相关API能力。
  • Token计算,根据输入计算token数。
  • 批量预测:提供创建批量预测任务、获取批量预测任务详情等能力。

千帆大模型平台推理服务API链接如下:

https://cloud.baidu.com/doc/WENXINWORKSHOP/s/qlgujhcpo

千帆大模型平台推理服务AP图示如下:

在这里插入图片描述

推理服务API调用方式

根据不同鉴权方式千帆大模型平台提供了2种API调用方式。

  • 1、使用access_token进行鉴权调用API流程

  • 2、基于安全认证AK/SK进行鉴权调用API流程

官方链接如下:

https://cloud.baidu.com/doc/WENXINWORKSHOP/s/yloieb01t

使用access_token鉴权调用API

使用访问凭证access_token进行鉴权,调用API 流程,如下图所示:
在这里插入图片描述
官方教程如下:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/dlv4pct3s

基本步骤如下:

  • 创建千帆应用。创建应用后,获取AppID、API Key、Secret Key 等信息。
  • API 授权。针对付费服务,需在千帆大模型平台-在线服务页面,点击开通付费。
  • 获取接口访问凭证 access_token。调用获取access_token接口获取 access_token ,通过 access_token 鉴权调用者身份。
  • 调用API接口。

请注意:access_token默认有效期30天,所以在生产环境注意及时刷新。

基于安全认证AK/SK鉴权调用API

基于安全认证AK/SK进行鉴权,调用API流程简介如下图所示:
在这里插入图片描述

官方教程如下:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Hlwerugt8

基本步骤如下:

  • API授权。千帆平台默认为应用开通所有API调用权限,无需申请授权。如需申请,可以在千帆平台-在线服务页面,点击开通付费。
  • 获取安全认证Access Key(即AK)/Secret Key(即SK)。
  • 生成鉴权认证信息Authorization。根据签名计算生成鉴权信息Authorization,具体流程请参考鉴权机制。
  • 调用API接口。

在线调试

千帆大模型平台提供了 API在线调试平台 ,用于帮助开发者调试接口,平台集成快速检索、查看开发文档、查看在线调用的请求内容和返回结果、复制和下载示例代码等功能,简单易用。

在线调试平台-示例代码中心官方链接如下:

https://console.bce.baidu.com/support/#/api

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

相关文章:

  • Manus AI多语言手写识别技术全解析:从模型架构到实战部署
  • MAC安装unar并解压.rar文件
  • 基于AutoDL V100微调DeepSeek Coder 6.7B (2)
  • 智体OS-V3.7重大发布:智体管家2.0、ai-docs知识库2.0、mcphost支持千款MCP-server、氛围电商或知识库电商模板、智体轻聊网页版
  • Java 多线程基础:Thread 类详解
  • 【Sqlalchemy Model转换成Pydantic Model示例】
  • 【含文档+PPT+源码】基于SSM的电影数据挖掘与分析可视化系统设计与实现
  • 嵌入式学习笔记 - 关于STM32 SPI控制器读取以及写入时,标志位TXE, RXNE的变化
  • Leetcode 3530. Maximum Profit from Valid Topological Order in DAG
  • C#实现对达索(Dassault)SolidWorks中3D图纸转化为手机可直接查看预览图纸格式
  • 扣子流程图批量导入飞书多维表格
  • springboot 框架把 resources下的zip压缩包, springboot 项目启动后解压到项目根目录工具类
  • 域对齐是什么
  • 基于STM32、HAL库的ATECC608B安全验证及加密芯片驱动程序设计
  • Kotlin-高阶函数,Lambda表达式,内联函数
  • Spring Boot × K8s 监控实战-集成 Prometheus 与 Grafana
  • 在开发板上如何处理curl: (60) SSL certificate problem
  • openssl_error_string() 不要依赖错误信息作为逻辑判断
  • C语言复习笔记--数据在内存中的存储
  • 【LLM】解析RAG增强检索技术:原理、实现与应用
  • 备案时填写 网站内容/广东seo点击排名软件哪里好
  • 网站建设工作讲话/济南最新消息今天
  • 网站平台怎么做的好处/怎样和政府交换友链
  • web软件开发工具/网站排名优化怎样做
  • 学建筑的女生后悔吗/搜索引擎优化的英文缩写是什么
  • 江门恒阳网站建设/宝鸡seo外包公司