当前位置: 首页 > news >正文

零基础学AI大模型之AI大模型常见概念

大家好,我是工藤学编程 🦉一个正在努力学习的小博主,期待你的关注
实战代码系列最新文章😉C++实现图书管理系统(Qt C++ GUI界面版)
SpringBoot实战系列🐷【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案
分库分表分库分表之实战-sharding-JDBC分库分表执行流程原理剖析
消息队列深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK)
AI大模型零基础学AI大模型之SpringAI

前情摘要:
1、零基础学AI大模型之读懂AI大模型
2、零基础学AI大模型之从0到1调用大模型API
3、零基础学AI大模型之SpringAI


本文章目录

  • 零基础学AI大模型之AI大模型常见概念
    • 一、先搞懂:什么是AI大模型?
    • 二、AI大模型的6个核心概念
      • 1. 提示词(Prompts)
      • 2. 令牌(Tokens):大模型的“语言最小单位”
      • 3. 嵌入(Embeddings)
      • 4. 结构化输出(Structured Output)
      • 5. 检索增强生成(RAG)
      • 6. 工具调用(Tool Calling/Function Call)
      • 6. AI大模型概念总结

零基础学AI大模型之AI大模型常见概念

一、先搞懂:什么是AI大模型?

AI大模型(AI Models)本质是具备大规模参数、能模拟人类认知功能的信息处理算法——它不仅能“读懂”输入(比如文本、语音、图像),还能“生成”符合需求的输出(比如对话、图片、代码),核心优势是“泛化能力强”:不用针对单个场景单独训练,就能应对多种任务(比如既会写邮件,也能做数据分析)。

而SpringAI作为开发者常用的框架,直接为大模型提供了“落地工具”,支持多种核心模型类型,覆盖大部分业务场景:

  • 聊天模型:核心是“对话与文本生成”,比如客服机器人回复咨询、自动生成周报,甚至帮开发者写接口文档;
  • 嵌入模型:负责“文本向量化”,把文字变成计算机能理解的“数字向量”,是后续语义搜索、相似内容匹配的基础;
  • 图像生成模型:实现“文本→图像”转换,比如输入“蓝色天空下的白色风车”,就能生成对应的图片;
  • 语音模型:处理“语音↔文本”双向转换,比如会议录音转文字、文字稿合成播报语音。

二、AI大模型的6个核心概念

如果把AI大模型比作“智能大脑”,下面这些概念就是它的“神经中枢”——决定了它“怎么思考”“怎么干活”“怎么不犯错”。

1. 提示词(Prompts)

提示词不是简单的“一句话提问”,而是引导模型输出符合预期的“语言输入基础”。在SpringAI里,它被拆成了3个关键部分,分工明确:

  • 系统消息:定“规则”,比如“你是一名技术文档助手,回答需简洁,只讲Java相关内容”;
  • 用户消息:提“需求”,比如“帮我解释SpringAI的嵌入模型用法”;
  • 助手消息:存“历史”,记录模型之前的响应,确保对话连贯(比如多轮咨询时,模型不会忘记上一轮的问题)。

开发者还能用StringTemplate等模板引擎优化提示词,比如做一个“生成笑话”的模板:“讲一个{type}类型的笑话,主角是{role}”,后续只需填充“冷笑话”“程序员”这样的占位符,就能快速适配不同用户输入。

2. 令牌(Tokens):大模型的“语言最小单位”

你可能听过“ChatGPT3只能处理4K内容”,这里的“4K”指的就是令牌(Tokens)——大模型处理语言的基本单位,相当于人类说话的“词语片段”。

  • 换算规则:英文里1个Token约等于0.75个单词(比如《莎士比亚全集》90万字,约合120万Token);中文里1个Token约对应1-2个汉字;
  • 核心影响:直接关联“成本”和“能力上限”:
    • 费用:AI服务按“输入+输出”的Token总数收费,比如输入1000Token、输出500Token,就按1500Token计费;
    • 限制:每个模型有“上下文窗口”(Token上限),比如GPT3是4K、GPT4有8K/16K/32K版本,超过上限的内容会被“截断”,模型无法处理。

DeepSeek示例

在这里插入图片描述

3. 嵌入(Embeddings)

嵌入是大模型“理解语义”的关键技术——把文本、图像等信息转换成浮点数组(向量),就像给每个内容分配一个“数字坐标”:语义越相似的内容,坐标越近(比如“猫”和“狗”的向量距离,比“猫”和“汽车”近)。

  • 核心用途:最常见于“语义搜索”,比如在企业文档库里搜“请假流程”,嵌入模型能找到“休假申请步骤”“事假审批规则”等相似内容;
  • 与RAG的关联:后续要讲的RAG技术,核心就是靠嵌入模型把文档转成向量,再存到向量数据库里,方便后续检索。

4. 结构化输出(Structured Output)

传统AI输出是字符串(比如即使返回JSON,也得手动转成Java对象),而结构化输出能让模型直接生成开发者需要的数据格式,省去解析步骤。
比如在SpringAI里,想获取5个“Order”对象,只需这样写:

List<Order> Order = chatClient.prompt().user("CCC给我5个订单信息").call().entity(new ParameterizedTypeReference<List<Order>>() {});

5. 检索增强生成(RAG)

大模型有个短板:训练数据有“截止日期”(比如2023年的模型不知道2024年的新政策),而RAG(Retrieval Augmented Generation)就是通过“实时检索外部数据”,让模型输出更精准、更实时

  • 核心流程(类似ETL管道):
    1. 提取:把非结构化数据(比如PDF文档、Word手册)拿出来;
    2. 转换:拆分成“符合Token限制”的片段(关键是不拆段落、代码方法,保留语义),再用嵌入模型转成向量;
    3. 加载:把向量存到向量数据库里;
  • 应用场景:比如用户问“2024年个税起征点是多少”,RAG会先从数据库里检索2024年的个税政策文档,再把“政策内容+用户问题”一起传给模型,让模型基于最新数据回答,避免“答非所问”。

6. 工具调用(Tool Calling/Function Call)

大模型本身不能查天气、查股票,但工具调用能让它“调用外部API”,获取实时数据或执行操作,相当于给模型装了“外接大脑”。

  • 简化流程(以SpringAI为例):
    1. 用@Tool注解定义工具(比如“天气查询工具”,说明参数是“城市名”“日期”);
    2. 模型判断是否需要调用工具(比如用户问“北京明天天气”,模型会决定调用天气API);
    3. 应用执行工具,返回“北京明天晴,气温15-25℃”;
    4. 模型基于这个结果,生成自然语言回答。
  • 价值:让模型从“只懂理论”变成“能做实事”,比如自动查物流、生成实时报表。

6. AI大模型概念总结

在这里插入图片描述

觉得有用请点赞收藏!
如果有相关问题,欢迎评论区留言讨论~


文章转载自:

http://VsSopVxr.Ldcrh.cn
http://Udd9NA93.Ldcrh.cn
http://ijV9hQau.Ldcrh.cn
http://WANFqPuV.Ldcrh.cn
http://DpdHLsuE.Ldcrh.cn
http://YQ1qtYHT.Ldcrh.cn
http://viAcOvZo.Ldcrh.cn
http://oa9NrSbp.Ldcrh.cn
http://cUqs5SBn.Ldcrh.cn
http://5bdJCC0c.Ldcrh.cn
http://nCeClX3W.Ldcrh.cn
http://MvPAHW7Z.Ldcrh.cn
http://Bv7Sp45h.Ldcrh.cn
http://9f1r8LhR.Ldcrh.cn
http://MtcG4CsS.Ldcrh.cn
http://oWl2Fcoz.Ldcrh.cn
http://JSd73dU7.Ldcrh.cn
http://VasYrFVt.Ldcrh.cn
http://5M0TyvOK.Ldcrh.cn
http://AZO5zXiD.Ldcrh.cn
http://nkWgqV9j.Ldcrh.cn
http://hKNZ3Bch.Ldcrh.cn
http://ea39AjBo.Ldcrh.cn
http://kKsb2tul.Ldcrh.cn
http://9ajj5Jr8.Ldcrh.cn
http://tNdtPHDv.Ldcrh.cn
http://8dRl4dMb.Ldcrh.cn
http://TsKvb792.Ldcrh.cn
http://4gRz44QQ.Ldcrh.cn
http://841863CA.Ldcrh.cn
http://www.dtcms.com/a/382077.html

相关文章:

  • [Dify] 插件节点用法详解:如何将插件整合进工作流
  • 2025年数字公共治理专业重点学什么内容?(详细指南)
  • 如何在 Windows 系统中对硬盘 (SSD) 进行分区
  • 【深耕好论文】
  • Python快速入门专业版(二十八):函数参数进阶:默认参数与可变参数(*args/**kwargs)
  • 残差:从统计学到深度学习的核心概念
  • 华为体检转氨酶高能否入职
  • DeerFlow 实践:华为IPD流程的评审智能体设计
  • AI赋能金融研报自动化生成:智能体系统架构与实现
  • 一、Java 基础入门:从 0 到 1 认识 Java(详细笔记)
  • python123机器学习基础练习1
  • 微信小程序坐标位置使用整理(四)map组件
  • 贪心算法在联邦学习客户端选择问题中的应用
  • 自增主键为何需要返回?
  • JDBC从入门到面试:全面掌握Java数据库连接技术
  • java本机电脑跳过2层网络连到客户内网远程调试方案
  • 基于多元线性回归、随机森林与神经网络的农作物元素含量预测及SHAP贡献量分析
  • MySQL数据库 -- 6.事务
  • CSS :has() 选择器详解:为什么它是“父选择器”?如何实现真正的容器查询?
  • 6-1ASPNETCoreWeb入门
  • 【文献笔记】PointWeb
  • Rupert Baines加入CSA Catapult董事会
  • 解密进程管理:从创建到回收全解析(基于Liunx操作系统)
  • 深度神经网络2——优化器选择、学习率消毒、正则化选择
  • 核心利润获现率
  • Nginx 502 网关错误:upstream 超时配置的踩坑与优化
  • (综述)视觉任务的视觉语言模型
  • 【C语言选择排序算法详解】+ 算法性能优化 + 动态演示实现
  • 基于Matlab硬币圆形检测的实现
  • go使用反射获取http.Request参数到结构体