AI、LLM全景图
概述
本文意在搜集一些制作精良的图片,系统性梳理AI、LLM;也是补充和完善个人技术栈的一次历程。
本文所有图片皆收藏整理自网络,侵删。
概念

基础概念:
- LLM:ChatBot背后的能力提供方、AI应用最核心模块;
- ChatBot:大多数人最熟悉的,聊天工具助手;
- AI绘画
- AI视频:Veo 3、可灵、即梦、Wan 2.2、Hailuo、Vidu、Runway、Luma、Midjourney、Sora。参考AI视频创作工具汇总、Qwen系列模型:WAN介绍;
- AI音乐
- TTS
- ASR:参考ASR工具合集;
- 聚合产品
- API聚合平台
- AI IDE:参考Vibe Coding、AI IDE/插件;
- 虚拟人(数字人)
- 嘴型同步
- Deep Research:深度研究,参考DeepResearch(上);
- Agent:智能体,
- Workflow:工作流,参考Dify理论+部署+实战、n8n、Workflow实战
- OCR:参考OCR、文档解析工具合集、
OCR、文档解析工具合集(下)
LLM简史

下图涉及概念比较杂乱

包括:
- 多智能体:参考Multi-Agent多智能体框架(一);
- 提示词工程:如Planning、PEV、ReAct、ToT、反思(Reflection),参考Prompt Engineering。

工具
这一部分可能会有很多图,毕竟我们大多数人并不是AI科学家、算法工程师、研发工程师,是普普通通的平民大众。Transformer架构,不懂?模型部署,不会?没关系,工具总会用吧。
下面几张图涉及工具肯定有重复的,而这些重复的,恰恰正是经过大家验证过的,能大大提高学习、工作效率,这也正是AI迷人之处:普惠大众。
生成式AI在线Web端产品,月度独立用户访问量排行榜Top50:

其中部分工具网站,需要科学上网;很多名词没有听过?非常正常。
下图汇总91个工具(图中说120个,数据不对;部分图标有误;下面图片也有这类问题,不用在意这点细节即可)。

分为6大类(分类方式仅供参考):
- 聊天机器人:即ChatBot;
- 写作:参考笔记软件汇总:Notion、Obsidian、Typora、Grammarly;
- 市场营销:一个都没听过;
- 视频:
- 设计:
- 生产力:一个都没听过。
下图以14个分类汇总AI效率工具

包括:
- ChatBot:
- PPT:制作PPT,参考AI加持PPT制作;
- 编码辅助:即Vibe Coding,AI IDE、CLI、插件等形态;
- 邮件辅助:
- 图像生成:
- Excel:
- 会议笔记:
- 工作流自动化:
- 写作:
- 调度:
- 视频生成:
- 图形设计:
- 知识管理:笔记工具,参考笔记软件汇总;
- 数据可视化:
下图也是工具汇总,注意多了一个SEO:SurgeGraph、Google Search Console、AnswerSocrates。


大致分类:
- 生产力和工作
- GetStudyPal:学习更高效
- ImagineArt:生成图片、视频、短片(shorts)、语音、音频
- GlobalGPT:100+ AI Models.
- Gamma AI:PPT
- Perplexity:研究
- Google Gemini:研究和洞察
- 写作
- ChatGPT:Writing & ideas.
- Grammarly:Grammar & clarity.
- Quillbot:Paraphrasing.
- Notion AI:Writing & organization.
- Audio, Voice & Music
- Music Arena:Top AI music tools.
- ElevenLabs:Voice generation & cloning.
- Natural Readers:Text to speech.
- Suno:Music creation.
- Video & Animation
- Google Veo:Text-to-video.
- Synthesia:AI videos.
- Runway:Video editing & effects.
- Descript:Edit video/audio.
- App和Web开发
- Replit:Browser-based builder.
- v0 by Vercel:React via prompts.
- Rocket:Build apps easily.
- Lovable:Chat-based builder.
- 编码和设计
- AskCodi、GitHub Copilot、Cursor:编码辅助
- MidJourney、Canva、Ideogram:设计工具

上面列举的工具实在太多,如果不熟悉某一个,或对某个分类(领域)下的工具感兴趣,自行搜索即可,注意需要科学上网。此处贴出部分工具的链接:
- https://quillbot.com:Paraphrase and reduce plagiarism in essays,写作;
- https://gamma.app:Create a presentation in 60 seconds,PPT生成;
- https://socratic.org:Snap a pic to get homework answers instantly
- https://perplexity.ai:Get direct answers to your questions
- https://stealthwriter.ai:Fly under the professor’s radar
- https://kuse.ai:TL;DR summaries for any webpage
- https://otter.ai:Get lecture notes automatically
- https://chatpdf.com:Make any PDF tell you its key points
- https://mybib.com:Citation generator
- https://elicit.org:Your literature review assistant
- https://wolframalpha.com:The answer engine for STEM
技术栈
7层LLM技术栈

解读:
- 数据源获取:
- 数据预处理及管理:
- 模型选择和训练:
- 编排和流水线:
- 推理和执行:
- 集成层:
- 应用层:
AI智能体阶梯图:

解读:
- 基础:
- 中级:
- 高级:
智能体技术栈

包括:
- 垂类领域智能体:如 All Hands;
- 智能体托管和服务:如LangGraph;
- 可观测性:参考可观测性、OpenTracing、OpenCensus、OpenTelemetry、Jaeger、AIOps概述;
- 智能体框架:
- 记忆:参考gent记忆理论与框架(一):Mem0、MemU、MemOS;
- 工具库:通过MCP使用各种工具;
- 沙盒:
- 模型服务:如vLLM、Ollama、XInference推理框架;
- 存储:即向量数据库。
智能体AI技术栈

从上往下分别是:
- 部署基础设施
- 评估监控
- 基础模型:
- 编排框架:LangChain、DSPy、AutoGen、adalflow、LlamaIndex、Haystack、LiteLLM、Dify、RAY
- 向量数据库:Milvus、Qdrant、Redis、PgVector、Vald、Chroma、Pinecone、Elasticsearch、Vespa、Weaviate
- 向量/Embedding模型:
- 数据集成和抽取:Scrapy、Docling、BeautifulSoup、DiffBot、Firecrawl、LlamaParse、Amazon Textract、Apache Tika
- 记忆/上下文管理:Letta、mem0、zep、Chroma、cognee、LangChain、LlamaIndex
从上到下的逻辑:先选好基础模型(第三层),再用编排框架(第四层)把能力串联,向量检索(第五层)+Embedding(第六层)做语义记忆,数据层(第七层)负责喂料,监控(第二层)保证模型不跑偏,基础设施(第一层)负责稳定生产部署,记忆层(第八层)承接长期上下文。
建议的快速落地路线:
- 明确产品目标与关键用例;
- 最小可行技术组合快速验证(模型+编排+向量库);
- 加上数据抽取管道与基础监控;
- 迭代扩展记忆、分布式部署与更细粒度评估。
学习线路

将学习AI分为三个层次:
- 简单AI模型:ChatGPT、Claude、Gemini
技能:基础、提示词工程 (Prompt)、多模态输入、客户支持、创意产生。 - 基础AI Agent:Make、Zapier、n8n
技能:多步骤工作流、API集成 - 智能体AI:LangChain、AutoGen、CrewAI
技能:多智能体协作、高级编排、决策、
系统设计
说不烂的二八原则:
- 80%的AI项目都是在搞工程,剩下20%才是真正的AI研究;
所以之前学过的Java语言,React框架并不会被抛弃,AI的工程化需要这些基础设施。

没有扎实的系统设计,大部分AI应用就只是一个玩具,经不起并发量,产生不了业务价值。
分布式事务、事件溯源、CDC(数据变更捕获)、编排、CAP原理、分布式缓存、幂等性、流控(速率限制)

指导原则

RAG
开源RAG技术栈

包括:
- 摄取和数据处理:Kubeflow、Apache Airflow、Apache NiFi、
- 嵌入模型:参考Embedding入门概述;
- 检索和重排:一些算法,索引,偏底层;
- 向量数据库:如Milvus;
- LLM:
- LLM框架:如LangChain;
- 前端框架:
几种RAG架构

参考:RAG拓展、变体、增强版(一)。
MCP
芯片

GPU和芯片。

