AI人工智能与LLM语言大模型
AI人工智能与LLM语言大模型
-----------
引言:为什么现在的AI能聊天、写文章、写诗、甚至帮你做PPT?今天带你看懂两大核心科技:AI人工智能 和 LLM大语言模型!
-----------
什么是AI人工智能
--Artificial Intelligence,简称 AI
--让机器拥有人类智慧能力,能像人一样学习、思考、表达、决策
--核心特征
--学习能力:通过算法让计算机从数据中学习规律,自动优化模型性能,无需显式编程
--推理能力:基于逻辑或概率模型进行分析和判断
--自然语言处理:保障人与机器能顺畅交流
--感知能力:多类型信息感知能力,多模态信息感知能力
--应用场景
--医疗:辅助诊断(如乳腺癌识别准确率99%)
--交通:自动驾驶、智能交通调度
--金融:风险评估、欺诈监测、智能投顾
--生活:智能家居、语音助手、个性化推荐
-----------
什么是LLM大语言模型
--Large Language Model,简称LLM
--基于海量文本数据训练的深度学习模型,能够理解和生成自然语言文本
--语言模型≠语音对话模型,是语言所形成的文本大模型
--仅能对文本进行理解,难以理解图片、表格、图表、声音、视频等信息类型
--深度神经网络模型
--包含亿级参数,单位为B=billion=十亿,人脑大约有1000亿神经元大约100B参数
--每个参数都是‘人工神经’,百亿参数织成‘AI 大脑’
--深度学习
--即形成参数值、参数与参数间的关系的过程,最终在训练后形成一种参数关系,这种关系就是最终的认知能力
--比如,在大模型训练前,给它一幅图片,它无法识别里面是否有猫;但是在给它一亿张猫的图片,在告诉它这些是猫,它会自动总结“猫”的规律,形成对“猫”的认知后,它就可以识别出新给的图片中是否有猫
--深度学习与传统编程的区别
--深度学习,能自动总结规律,形成认知,然后依靠形成的认知来处理事务
--传统编程,依靠程序员来总结规律,并通过编程方式固化认知,比如猫的眼睛多大、什么形状、瞳距多少等各种参数进行比对,从而判断图片是否是猫,很显然传统编程方式不仅效率低,而且难以全面
--LLM产品
--国内:deepseek xx系列(深度求索公司)、通义千问Qwen xx系列(阿里巴巴公司)、豆包(字节跳动公司)
--国外:GPT-xx系列(OpenAI公司)、Gemini(Google公司)、Llama xx系列(Meta公司)
-----------
总结
--AI是人造的拥有人类思考能力的机器
--LLM是AI的重要组成部分
--能够理解、推理、组织文字的模型
--是人类和AI进行自然交互的接口