当前位置: 首页 > news >正文

大模型005

量化

在这里插入图片描述

什么是量化?

在这里插入图片描述

为什么需要量化?

在这里插入图片描述

量化的核心原理

在这里插入图片描述
在这里插入图片描述

主流量化技术

1 根据是否校准基准
2 根据量化比特数 Based on Bit-width
在这里插入图片描述

挑战与权衡

在这里插入图片描述

讯飞星火大模型!

讯飞智文

重点:语音识别,语言翻译 数学教育
To G
会议系统
语音识别-》会议纪要生成-》下发具体任务和OA对接。
语音识别开源 OpenAI whisper
三重一大
C端:
讯飞星火APP
AI硬件 AI学习机

B端:
教育
医疗
汽车:智能座舱

星火大模型介绍与使用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

讯飞–深度推理X1模型

星火大模型API使用

webSocket的API
双向通信:服务器与客户端可以建立长连接,服务器可以主动推消息过来:

星火大模型定制平台

https://www.iflytek.com/

https://maas.xfyun.cn/modelSquare

提示词小技巧:Prompt:

思维树TOT
Tree of Thought


TOT Tree of Thought

模拟人的思考决策过程-- 决策树

根节点:如何让00后爱上我们的产品
第一层:核心创意
第二次 每一个 创意如何执行
第三次。。。p
评估与剪枝
风险高
超预算
见效快
TOT如何实现:
生成多个核心创意 思想分解
为每个创意构建策略 思想生成
量化评估每个策略 评估器(大模型做裁判)
选择最优路径,并整合 搜索算法

TOT小结:

多阶段生成相关方案,每个阶段对应的模型的角色有差别,这里可以选择调用不同的模型API
–如果是本地部署,可以考虑简单任务用小尺寸模型,复杂任务用大模型
用大模型评估:
–评估的时候,提示词可以写的细致一些,可以把评分考虑的维度,每个维度的权重都告诉模型。
结构化数据:
–使用json数据
树结构的保存:
–通过字典对象代表了树结构上的每一个节点
–节点之间的 关系,通过字典的key-value来保存
适合使用TOT的场景:
–对具有发散思维有需要的场景:
商业计划
产品线路规划
危机公关方案
–关键节点还是要使用最强的模型,保证效果
–可以考虑使用RAG做检索增强
历史成功案例
行业最新报告
为TOT决策加入事实依据
–如果任务比较复杂,需要做持久化,生成的内容可以做好缓存。

LangChain

http://www.dtcms.com/a/307719.html

相关文章:

  • 反射之专题
  • C++:结构体(Structure)
  • Flux.1系列模型解析--Flux.1
  • OpenCV 中的「通道」(Channel)详解
  • C# 入门教程(四)委托详解
  • 国产芯+单北斗防爆终端:W5-D防爆智能手机,助力工业安全通信升级
  • Flutter Chen Generator - yaml配置使用
  • 一个清洁机器人的城市漂流记
  • C++面试5题--6day
  • 三维开放场景图助力机器人自主导航!Point2Graph:点云驱动的三维开放词汇场景图端到端机器人导航
  • Flutter 页面跳转及传参总结
  • Excel超级处理器,多个word表格模板中内容提取到Excel表格中
  • npm从入门到精通一篇全
  • 深度学习(鱼书)day07--误差反向传播(前四节)
  • [免费]基于Python的招聘职位信息推荐系统(猎聘网数据分析与可视化)(Django+requests库)【论文+源码+SQL脚本】
  • 无人机光伏巡检缺陷检出率↑32%:陌讯多模态融合算法实战解析
  • InfluxDB 与 Python 框架结合:Django 应用案例(三)
  • git使用秘诀(详解0到1)
  • C# 事件Event
  • python中高效构建提示词
  • 软件工程:软件复用
  • 当过滤条件不符合最左前缀时,如何有效利用索引? | OceanBase SQL 优化实践
  • Verilog实现RPC从机(配合AXI_Slave使用)
  • 消息队列学习-----消息消失与积压
  • 操作系统数据格式相关(AI回答)
  • 性能优化(二):JS内存泄漏“探案”:从闭包到事件监听的隐形杀手
  • 经典屏保问题 - 华为OD机试真题(Java 题解)
  • uniapp Vue3版本使用pinia存储持久化插件pinia-plugin-persistedstate对微信小程序的配置
  • Django模型迁移指南:从命令用法到最佳实践
  • 分布式微服务--万字详解 微服务的各种负载均衡全场景以注意点