当前位置: 首页 > news >正文

认识人工智能与大模型应用开发

目录

  • 认识
  • 大模型应用开发
    • 模型部署
      • 开放的大模型API
      • 在云平台部署私有大模型
      • 在本地服务器部署私有大模型
    • 调用大模型
      • 接口说明
        • message
          • role
            • system(设定角色和任务背景)
            • user(用户输入的具体指令)
            • assistant(大模型生成的消息)
    • 大模型应用
    • 大模型应用开发
      • 纯Prompt问答
      • FunctionCalling
      • RAG(检索增强生成)
      • Fine-tuning

认识

Transformer,这是一种由多层感知机组成的神经网络模型,是现如今AI高速发展的最主要原因。
Transformer的一种功能:推理预测。
LLM如何生成大语言模型?
根据前文推测出接下来的一个词语后,把这个词语加入前文,再次交给大模型处理,推测下一个字。

大模型应用开发

模型部署

开放的大模型API

在云平台部署私有大模型

在本地服务器部署私有大模型

调用大模型

在这里插入图片描述

接口说明

请求方式,一般是POST
请求路径,url
请求参数:model,message(是一个消息数组,包括role,content)

message
role
system(设定角色和任务背景)
user(用户输入的具体指令)
assistant(大模型生成的消息)

比如上一轮对话生成的结果。
每一次发送请求时,都把历史对话中每一轮的User消息、Assistant消息都封装到Messages数组中,一起发送给大模型,这样大模型就会根据这些历史对话信息进一步回答,就像是拥有了记忆一样。

大模型应用

在这里插入图片描述

大模型应用开发

在这里插入图片描述

纯Prompt问答

AI应用再在用户的prompt基础上再继续组织优化。

FunctionCalling

传统应用中的部分功能封装成一个个函数(Function),根据prompt自己决定去调用。

RAG(检索增强生成)

  • 检索模块(Retrieval):负责存储和检索拓展的知识库
    • 文本拆分:将文本按照某种规则拆分为很多片段
    • 文本嵌入(Embedding):根据文本片段内容,将文本片段归类存储
    • 文本检索:根据用户提问的问题,找出最相关的文本片段
  • 生成模块(Generation):
    • 组合提示词:将检索到的片段与用户提问组织成提示词,形成更丰富的上下文信息
    • 生成结果:调用生成式模型(例如DeepSeek)根据提示词,生成更准确的回答

Fine-tuning

模型微调,在预训练大模型(比如DeepSeek、Qwen)的基础上,通过企业自己的数据做进一步的训练,使大模型的回答更符合自己企业的业务需求。

http://www.dtcms.com/a/544927.html

相关文章:

  • 电子学会青少年机器人技术(一级)等级考试试卷-实操题(2025年9月)
  • 亲 怎么给一个网站做备份哪些专业能建网站
  • JWT 全面解析与 Spring Boot 实战教程
  • 【预览PDF】前端预览pdf
  • 【PrintPDF】PrintPDF Cargo.toml 分析
  • R/3 销售与分销
  • 唐山微网站建设价格网站建设信息发布
  • 做的最好的理财网站国内无版权图片网站
  • GXDE OS 支持在 WSL 上使用了(带桌面环境)
  • 【Linux】基础指令(2):理解Linux的指令和核心概念
  • Rust 借用分割技巧:安全解构复杂数据结构
  • 在Vue项目中平滑地引入HTML文件
  • 1688网站特点石家庄模板网站建设
  • 不练不熟,不写就忘 之 compose 之 动画之 animateDpAsState动画练习
  • HTML的布局—— DIV 与 SPAN
  • php网站搬家软件潍坊网络营销公司有哪些
  • Langchain中的消息
  • SQL是怎样执行的
  • 合肥网站建设卫来科技郑州高端建站
  • 景区网站建设策划书wordpress去掉rss订阅
  • HTTP中get请求和post请求的区别和联系
  • Rust 开发环境配置:IDE 选择与深度优化实践
  • PyTorch与TensorFlow GPU分布式训练策略详解
  • IDE热键冲突的解决
  • Docker篇1:docker-compose和docker.io区别
  • 如何将 TRAE IDE 的插件市场源切换至 VS Code 官方市场
  • 公司网站建设的请示有网站怎么做下载直链
  • 2025.10.29【服务器】|lftp 常见参数与使用方法详解(含上传下载实战)
  • 多模态大模型开发实战 -- OCR 基础入门
  • DeepSeek-OCR:下一代文档理解模型的技术跃迁