当前位置: 首页 > news >正文

AI是什么?大模型、语料、训练、推理、机器学习、神经网络等专业名词如何关联

AI爆火,常常听到一大堆的专业名词,如大模型、语料、训练、推理、机器学习、神经网络、自然语言处理,这些都是什么?跟AI有什么关系?相信很多人都有同样的疑惑,带着这些问题,我们通过这篇文章来了解一下。

AI相关名词解释

AI是什么

AI是一门学科/技术,AI是指Artificial Intelligence,人工智能,是由计算机系统模拟人类智能的技术,使其能够执行需要人类智慧的任务,如学习、推理、决策、识别、理解语言等。

模型是什么(大模型/小模型)

模型可以理解为一个数学公式,是对现实世界问题的抽象表示,一般由参数、结构组成,由算法代码实现,如房价预测中的线性回归模型,房价=a*面积 + b*地段 + c,其中a/b/c是模型参数。

  • 大模型通常参数量极大、训练数据规模极大、泛化能力强、通用性高,如deepseek、chart-gpt等
  • 小模型通常参数量小、训练数据规模小、硬件资源要求少,一般用于特定场景

多模态是什么

同时处理和理解多种类型的数据,其核心在于跨模态的关联与融合,模态指数据的表现形式或输入类型,如文本、视觉、听觉、传感器数据。典型应用如图文理解、视频分析、自动驾驶等

语料是什么

为模型训练、模型评估、领域适配(微调、少样本学习)和语言研究(社会热刺、不同地区表达差异)而系统化收集的文本、语音或多媒体数据集合。一般步骤如下:

  1. 数据来源:公开数据、用户数据、专业采集(爬虫等)
  2. 预处理与清洗:去噪、标准化、隐私处理
  3. 标注:自动标注、人工标注和混合方法

当前趋势是自动化标注+人类校验结合

训练是什么

利用语料数据对模型进行循环“试错-修正”,如输入数据计算结果与预期结果相比,根据结果评估偏差并优化模型

推理是什么

推理是指用户在AI应用输入问题后,经向量检索将问题转化为机器可处理的形式,然后用模型或者算法推导结论,输出结果给用户的过程

RAG是什么?当前主流AI技术

Retrieval-Augmented Generation,检索增强生成,是一种结合信息检索和文本生成的技术,通过实时检索外部知识库来辅助生成更准确地回答,回答更真实,不需要重新训练模型即可更新知识。典型应用如问答系统、客户机器人等。

AGI是什么?类人类专家,未来AI方向

Artificial General Intelligence,通用人工智能。具备人类水平的多领域认知能力,可自主学习、推理和解决任意任务的AI,通俗讲就是人类专家

AI计算资源NPU与传统计算资源差异

特性CPU(中央处理器)GPU(图形处理器)NPU(神经网络处理器)
核心目标通用逻辑处理高吞吐并行计算低功耗AI推理
核心数少量(<100)大量(数千)中等(数十到数百)
延迟敏感纳秒级微妙级批处理优化
算力单核~1TOPS10-1000 TFLOPS1-100TOPS
能效比低,1-10GOPS/W中,10-100GOPS/W高,1-10TOPS/W
任务运行操作系统和APP逻辑处理图形和通用并行计算加速本地AI任务

AI相关核心技术

  1. 机器学习(ML):AI 的基础,通过数据训练模型,让机器自动改进表现
  2. 深度学习(DL):一种复杂的机器学习,使用多层神经网络处理大规模数据
  3. 自然语言处理(NLP):让机器理解、生成和翻译人类语言
  4. 计算机视觉(CV):让机器识别图像、视频和环境
  5. 强化学习(RL):通过奖励和惩罚机制,机器自主学习最优策略
  6. 知识图谱:结构化存储和管理复杂知识,提升机器理解能力

AI名词关系梳理

AI模型产生,部署到使用的过程

AI发展与学习方向想法

  • 多模态应用
  • 大模型持续优化,各行各业小模型蓬勃发展
  • 资源(NPU)需求持续优化,能源(电)消耗量持续优化
  • 协调人与AI之间的关系,避免大范围失业等情况出现

站在巨人的肩膀上摘苹果。。。

思考

AI可以为你的行业解决什么问题?对个人的影响是什么?

相关文章:

  • cuda编程笔记(2.5)--简易的应用代码
  • 5.5.2_1并查集
  • Vue3优质动画库推荐
  • 在windows10上安装nvm以及配置环境
  • Claude Code 是什么?
  • 刷leetcode hot100返航版--字符串6/15
  • python动态蓝色蝴蝶爱心
  • 目标分割数据集大全「包含分割数据标注+训练脚本」 (持续原地更新)
  • 设计模式(10)——创建型模式之抽象工厂
  • Python 文件操作详解
  • 电脑上的.ssh目录只做什么的
  • AMD Pensando Pollara 400Gbps网卡深度解析:超级以太网重塑AI集群网络架构
  • linux多线程之POSIX信号量
  • Python变量与数据类型全解析
  • AI视野:视频处理AI排行榜Top10 | 2025年05月
  • SpringJPA统计数据库表行数及更新频率
  • 37-Oracle 23 ai Shrink Tablespace(一键收缩表空间)
  • 打卡day54
  • Pico rp2040开发之Vscode插件+ c/c++独立环境搭建
  • Python中async协程快速理解
  • 专业做辅助的网站/现在广告行业好做吗
  • 网站会员管理/付费恶意点击软件
  • 网站备案下来以后怎么做网页/seo零基础教学
  • 网页设计模板网/seo流量排名工具
  • 安徽建设学校网站/白银网站seo
  • 优惠券怎做网站/ebay欧洲站网址