AI大模型的基本知识
什么是AI
让机器执行需要人类智能的任务
阶段:
早期阶段:专家系统 依赖人设定的规则
机器学习时代:数据参数训练
深度学习时代:用神经网络模拟人脑复杂结构 比如图像识别和处理
大模型时代:以规模数据和大算力为基础
AI的分类
1 分析式AI:核心任务是决策
2 生成式AI:做写作 画图等创造性工作
1 大语言模型LLM
基于海量文本数据训练 如 ChatGpt DeepSeek QWen
示例:智能客服 内容创建
2 生图、生视频模型
如Sora liblib.art jimeng
3 视觉识别模型
如视觉识别出产品外观瑕疵,分析X光或CT扫描的病灶点 如 YOLO ResNet,可做图像分类 物体检测
4 自动驾驶模型
如 辅助驾驶 无人配送
ChatGPT是如何训练出来的
1 收集数据 死记硬背 比如背下香蕉是什么
2 强化学习 问香蕉是什么 AI答出4个答案 人工给这4个答案排序 把工作交给AI 领导点评
3 强化学习优化模型 写一个水獭的故事
Rank List标注平台,给机器的回答排序
K2的参数量已达到上万亿
不同大模型的token是如何定义的
tiktokenizer.vercel.app
分词
Temperatrue、Top P的原理与作用
高 temperature: 使得生成结果更具有创造性 可能出现极小概率的答案
低 temperateur: 结果更保守
top P(概率)
Top P(设为0.9) 容易生成高质量的文本 不会出现极小概率的答案
AI大模型聊天产品的超能力
1 联网搜索 function call的能力 比如查询影响黄金价格的因素
2 读取文件 读取企业内部的有价值的文档
3 记忆能力 LLM是无状态的 每次对话时 把最近几轮问答作为背景信息一起发送给LLM;
需长期记忆的关键信息如用户名字 偏好等画像做个提取
2025年年初全球AI模型:
外国推荐的:GPT-4o, Claude 4 Sonnet, Gemini 2.5 Flash
国内推荐的:DeepSeek的 R1 V3,阿里巴巴的 Qwen3, Kimi K2(kimi.com) Qwen-tur?
前沿领域的H20
运行调用API
pip 配置上清华镜像
安装 anacoda3
jupyter 可以运行 .ipynb 文件
system
user
assitant