当前位置：首页 > news >正文

认识人工智能与大模型应用开发

news 2025/10/30 8:36:55

目录

认识
大模型应用开发
- 模型部署
- - 开放的大模型API
  - 在云平台部署私有大模型
  - 在本地服务器部署私有大模型
- 调用大模型
- - 接口说明
  - - message
    - - role
      - system（设定角色和任务背景）
        user（用户输入的具体指令)
        assistant(大模型生成的消息）
- 大模型应用
- 大模型应用开发
- - 纯Prompt问答
  - FunctionCalling
  - RAG(检索增强生成）
  - Fine-tuning

认识

Transformer，这是一种由多层感知机组成的神经网络模型，是现如今AI高速发展的最主要原因。
Transformer的一种功能：推理预测。
LLM如何生成大语言模型？
根据前文推测出接下来的一个词语后，把这个词语加入前文，再次交给大模型处理，推测下一个字。

大模型应用开发

模型部署

开放的大模型API

在云平台部署私有大模型

在本地服务器部署私有大模型

调用大模型

在这里插入图片描述

接口说明

请求方式，一般是POST
请求路径，url
请求参数：model，message（是一个消息数组，包括role，content）

message

role

system（设定角色和任务背景）

user（用户输入的具体指令)

assistant(大模型生成的消息）

比如上一轮对话生成的结果。
每一次发送请求时，都把历史对话中每一轮的User消息、Assistant消息都封装到Messages数组中，一起发送给大模型，这样大模型就会根据这些历史对话信息进一步回答，就像是拥有了记忆一样。

大模型应用

在这里插入图片描述

大模型应用开发

在这里插入图片描述

纯Prompt问答

AI应用再在用户的prompt基础上再继续组织优化。

FunctionCalling

传统应用中的部分功能封装成一个个函数（Function），根据prompt自己决定去调用。

RAG(检索增强生成）

检索模块（Retrieval）：负责存储和检索拓展的知识库
- 文本拆分：将文本按照某种规则拆分为很多片段
- 文本嵌入（Embedding)：根据文本片段内容，将文本片段归类存储
- 文本检索：根据用户提问的问题，找出最相关的文本片段
生成模块（Generation）：
- 组合提示词：将检索到的片段与用户提问组织成提示词，形成更丰富的上下文信息
- 生成结果：调用生成式模型（例如DeepSeek）根据提示词，生成更准确的回答

Fine-tuning

模型微调，在预训练大模型（比如DeepSeek、Qwen）的基础上，通过企业自己的数据做进一步的训练，使大模型的回答更符合自己企业的业务需求。

http://www.dtcms.com/a/544927.html

相关文章：

电子学会青少年机器人技术（一级）等级考试试卷-实操题（2025年9月）

亲怎么给一个网站做备份哪些专业能建网站

JWT 全面解析与 Spring Boot 实战教程

【预览PDF】前端预览pdf

【PrintPDF】PrintPDF Cargo.toml 分析

R/3 销售与分销

唐山微网站建设价格网站建设信息发布

做的最好的理财网站国内无版权图片网站

GXDE OS 支持在 WSL 上使用了（带桌面环境）

【Linux】基础指令（2）：理解Linux的指令和核心概念

Rust 借用分割技巧：安全解构复杂数据结构

在Vue项目中平滑地引入HTML文件

1688网站特点石家庄模板网站建设

不练不熟，不写就忘之 compose 之动画之 animateDpAsState动画练习

HTML的布局—— DIV 与 SPAN

php网站搬家软件潍坊网络营销公司有哪些

Langchain中的消息

SQL是怎样执行的

合肥网站建设卫来科技郑州高端建站

景区网站建设策划书wordpress去掉rss订阅

HTTP中get请求和post请求的区别和联系

Rust 开发环境配置：IDE 选择与深度优化实践

PyTorch与TensorFlow GPU分布式训练策略详解

IDE热键冲突的解决

Docker篇1：docker-compose和docker.io区别

如何将 TRAE IDE 的插件市场源切换至 VS Code 官方市场

公司网站建设的请示有网站怎么做下载直链

2025.10.29【服务器】|lftp 常见参数与使用方法详解（含上传下载实战）

多模态大模型开发实战 -- OCR 基础入门

DeepSeek-OCR：下一代文档理解模型的技术跃迁