当前位置: 首页 > news >正文

AI、LLM全景图

概述

本文意在搜集一些制作精良的图片,系统性梳理AI、LLM;也是补充和完善个人技术栈的一次历程。

本文所有图片皆收藏整理自网络,侵删。

概念

在这里插入图片描述
基础概念:

  • LLM:ChatBot背后的能力提供方、AI应用最核心模块;
  • ChatBot:大多数人最熟悉的,聊天工具助手;
  • AI绘画
  • AI视频:Veo 3、可灵、即梦、Wan 2.2、Hailuo、Vidu、Runway、Luma、Midjourney、Sora。参考AI视频创作工具汇总、Qwen系列模型:WAN介绍;
  • AI音乐
  • TTS
  • ASR:参考ASR工具合集;
  • 聚合产品
  • API聚合平台
  • AI IDE:参考Vibe Coding、AI IDE/插件;
  • 虚拟人(数字人)
  • 嘴型同步
  • Deep Research:深度研究,参考DeepResearch(上);
  • Agent:智能体,
  • Workflow:工作流,参考Dify理论+部署+实战、n8n、Workflow实战
  • OCR:参考OCR、文档解析工具合集、
    OCR、文档解析工具合集(下)

LLM简史
在这里插入图片描述

下图涉及概念比较杂乱
在这里插入图片描述
包括:

  • 多智能体:参考Multi-Agent多智能体框架(一);
  • 提示词工程:如Planning、PEV、ReAct、ToT、反思(Reflection),参考Prompt Engineering。

在这里插入图片描述

工具

这一部分可能会有很多图,毕竟我们大多数人并不是AI科学家、算法工程师、研发工程师,是普普通通的平民大众。Transformer架构,不懂?模型部署,不会?没关系,工具总会用吧。

下面几张图涉及工具肯定有重复的,而这些重复的,恰恰正是经过大家验证过的,能大大提高学习、工作效率,这也正是AI迷人之处:普惠大众。

生成式AI在线Web端产品,月度独立用户访问量排行榜Top50:
在这里插入图片描述
其中部分工具网站,需要科学上网;很多名词没有听过?非常正常。

下图汇总91个工具(图中说120个,数据不对;部分图标有误;下面图片也有这类问题,不用在意这点细节即可)。
在这里插入图片描述
分为6大类(分类方式仅供参考):

  • 聊天机器人:即ChatBot;
  • 写作:参考笔记软件汇总:Notion、Obsidian、Typora、Grammarly;
  • 市场营销:一个都没听过;
  • 视频:
  • 设计:
  • 生产力:一个都没听过。

下图以14个分类汇总AI效率工具
在这里插入图片描述
包括:

  • ChatBot:
  • PPT:制作PPT,参考AI加持PPT制作;
  • 编码辅助:即Vibe Coding,AI IDE、CLI、插件等形态;
  • 邮件辅助:
  • 图像生成:
  • Excel:
  • 会议笔记:
  • 工作流自动化:
  • 写作:
  • 调度:
  • 视频生成:
  • 图形设计:
  • 知识管理:笔记工具,参考笔记软件汇总;
  • 数据可视化:

下图也是工具汇总,注意多了一个SEO:SurgeGraph、Google Search Console、AnswerSocrates。
在这里插入图片描述

在这里插入图片描述
大致分类:

  • 生产力和工作
    • GetStudyPal:学习更高效
    • ImagineArt:生成图片、视频、短片(shorts)、语音、音频
    • GlobalGPT:100+ AI Models.
    • Gamma AI:PPT
    • Perplexity:研究
    • Google Gemini:研究和洞察
  • 写作
    • ChatGPT:Writing & ideas.
    • Grammarly:Grammar & clarity.
    • Quillbot:Paraphrasing.
    • Notion AI:Writing & organization.
  • Audio, Voice & Music
    • Music Arena:Top AI music tools.
    • ElevenLabs:Voice generation & cloning.
    • Natural Readers:Text to speech.
    • Suno:Music creation.
  • Video & Animation
    • Google Veo:Text-to-video.
    • Synthesia:AI videos.
    • Runway:Video editing & effects.
    • Descript:Edit video/audio.
  • App和Web开发
    • Replit:Browser-based builder.
    • v0 by Vercel:React via prompts.
    • Rocket:Build apps easily.
    • Lovable:Chat-based builder.
  • 编码和设计
    • AskCodi、GitHub Copilot、Cursor:编码辅助
    • MidJourney、Canva、Ideogram:设计工具

在这里插入图片描述

上面列举的工具实在太多,如果不熟悉某一个,或对某个分类(领域)下的工具感兴趣,自行搜索即可,注意需要科学上网。此处贴出部分工具的链接:

  • https://quillbot.com:Paraphrase and reduce plagiarism in essays,写作;
  • https://gamma.app:Create a presentation in 60 seconds,PPT生成;
  • https://socratic.org:Snap a pic to get homework answers instantly
  • https://perplexity.ai:Get direct answers to your questions
  • https://stealthwriter.ai:Fly under the professor’s radar
  • https://kuse.ai:TL;DR summaries for any webpage
  • https://otter.ai:Get lecture notes automatically
  • https://chatpdf.com:Make any PDF tell you its key points
  • https://mybib.com:Citation generator
  • https://elicit.org:Your literature review assistant
  • https://wolframalpha.com:The answer engine for STEM

技术栈

7层LLM技术栈
在这里插入图片描述
解读:

  • 数据源获取:
  • 数据预处理及管理:
  • 模型选择和训练:
  • 编排和流水线:
  • 推理和执行:
  • 集成层:
  • 应用层:

AI智能体阶梯图:
在这里插入图片描述
解读:

  • 基础:
  • 中级:
  • 高级:

智能体技术栈
在这里插入图片描述
包括:

  • 垂类领域智能体:如 All Hands;
  • 智能体托管和服务:如LangGraph;
  • 可观测性:参考可观测性、OpenTracing、OpenCensus、OpenTelemetry、Jaeger、AIOps概述;
  • 智能体框架:
  • 记忆:参考gent记忆理论与框架(一):Mem0、MemU、MemOS;
  • 工具库:通过MCP使用各种工具;
  • 沙盒:
  • 模型服务:如vLLM、Ollama、XInference推理框架;
  • 存储:即向量数据库。

智能体AI技术栈
在这里插入图片描述
从上往下分别是:

  • 部署基础设施
  • 评估监控
  • 基础模型:
  • 编排框架:LangChain、DSPy、AutoGen、adalflow、LlamaIndex、Haystack、LiteLLM、Dify、RAY
  • 向量数据库:Milvus、Qdrant、Redis、PgVector、Vald、Chroma、Pinecone、Elasticsearch、Vespa、Weaviate
  • 向量/Embedding模型:
  • 数据集成和抽取:Scrapy、Docling、BeautifulSoup、DiffBot、Firecrawl、LlamaParse、Amazon Textract、Apache Tika
  • 记忆/上下文管理:Letta、mem0、zep、Chroma、cognee、LangChain、LlamaIndex

从上到下的逻辑:先选好基础模型(第三层),再用编排框架(第四层)把能力串联,向量检索(第五层)+Embedding(第六层)做语义记忆,数据层(第七层)负责喂料,监控(第二层)保证模型不跑偏,基础设施(第一层)负责稳定生产部署,记忆层(第八层)承接长期上下文。

建议的快速落地路线:

  • 明确产品目标与关键用例;
  • 最小可行技术组合快速验证(模型+编排+向量库);
  • 加上数据抽取管道与基础监控;
  • 迭代扩展记忆、分布式部署与更细粒度评估。

学习线路

在这里插入图片描述
将学习AI分为三个层次:

  • 简单AI模型:ChatGPT、Claude、Gemini
    技能:基础、提示词工程 (Prompt)、多模态输入、客户支持、创意产生。
  • 基础AI Agent:Make、Zapier、n8n
    技能:多步骤工作流、API集成
  • 智能体AI:LangChain、AutoGen、CrewAI
    技能:多智能体协作、高级编排、决策、

系统设计

说不烂的二八原则:

  • 80%的AI项目都是在搞工程,剩下20%才是真正的AI研究;

所以之前学过的Java语言,React框架并不会被抛弃,AI的工程化需要这些基础设施。
在这里插入图片描述
没有扎实的系统设计,大部分AI应用就只是一个玩具,经不起并发量,产生不了业务价值。

分布式事务、事件溯源、CDC(数据变更捕获)、编排、CAP原理、分布式缓存、幂等性、流控(速率限制)

在这里插入图片描述

指导原则

在这里插入图片描述

RAG

开源RAG技术栈
在这里插入图片描述
包括:

  • 摄取和数据处理:Kubeflow、Apache Airflow、Apache NiFi、
  • 嵌入模型:参考Embedding入门概述;
  • 检索和重排:一些算法,索引,偏底层;
  • 向量数据库:如Milvus;
  • LLM:
  • LLM框架:如LangChain;
  • 前端框架:

几种RAG架构
在这里插入图片描述
参考:RAG拓展、变体、增强版(一)。

MCP

一个MCP笑谈,君不见收录几万个MCP Server,参考
在这里插入图片描述

芯片

在这里插入图片描述
GPU和芯片。

参考

http://www.dtcms.com/a/617883.html

相关文章:

  • pip升级已安装包方法详解
  • 【Linux日新月异(六)】CentOS 7网络命令深度解析:从传统到现代网络管理
  • LangChain 构建 AI 代理(Agent)
  • 人工智能训练师备考——3.1.1题解
  • 【RL】ORPO: Monolithic Preference Optimization without Reference Model
  • 公益平台网站怎么做网站跳出
  • QT的5种标准对话框
  • 用Rust构建一个OCR命令行工具
  • 网站代码大全国内网站设计作品欣赏
  • LeetCode 热题 100——子串——滑动窗口最大值
  • CPP(容器)STL:
  • 【Java常用API】----- Math
  • RAG 系统 “检索 - 筛选 - 生成” 完整流程
  • 时间复杂度 和 嵌入式时钟概念 有关系。 我的理由是:时钟经常需要计算频率,而频率往往需要和时间进行计数次数i 。 时间复杂度就像是计数次数i
  • 公司做普通网站建立网站地图
  • Java 大视界 -- Java 大数据在智能农业病虫害精准识别与绿色防控中的创新应用
  • 【高并发架构】从 0 到亿,从单机部署到 K8s 编排:高并发架构的 8 级演进之路
  • 基于Streamlit的交互式3D手指运动学仿真
  • 甘肃做网站找谁金种子酒业网站建设
  • 使用 Flink CDC Elasticsearch Pipeline Connector 打通 MySQL 与 Elasticsearch 的实时链路
  • 基于视频识别的大模型项目实战心得
  • Firefly-Modeler 体积雕刻:AI 概念到 3D 基模
  • 提示词工程 - (2) 指南
  • 网络安全 | 深入理解SQL注入的原理和防范
  • python之循环导入
  • 强杀服务、重启系统及断电对 TDengine 影响
  • Odoo 19 制造与会计集成深度解析报告
  • 免费网站软件正能量医院网站建设方案计划书
  • 软件架构趋势:云原生与大模型的融合与重塑
  • 做网站会员登陆长春网站运做思路