当前位置：首页 > news >正文

面向生产环境的大模型应用开发

news 2025/9/9 6:41:53

思维导图

在这里插入图片描述

正文

1. 大模型应用开发与传统软件开发的本质差异

本质属性：属于机器学习工程（效果概率性）而非确定性的传统软件功能开发。
关键区别：
- 传统软件：功能＝确定；验收＝是否完成。
- 大模型应用：效果＝统计分布（如 [Accuracy=85%]），需持续评估与迭代。
- 开发原则：无法量化评估（缺少指标与数据集）→ 不进入实施。
典型错误：直接“写功能”而缺少原型验证 → 评估体系 → 数据基线 → 迭代循环。
评估驱动（Evaluation First）：评估数据集与指标体系要先于工程落地。

1.1 技术范式演进

时代	主要特征	应用范式
专家系统	规则驱动	手工规则维护
机器学习（浅层）	特征工程 + 任务数据	一任务一模型
深度学习（2012–2018）	大量任务数据 + 深层网络	大规模监督训练
预训练模型时代（BERT/GPT-2/T5）	通用语义表示 + 任务微调	适量样本微调（千～万条）
大模型时代（ChatGPT 2022+）	指令对齐 + 泛化 + 工具使用 + 推理	Few-shot / Prompt 直接调用或少参适配器微调

1.2 现代大模型新增能力（课程强调）

接受自然语言指令（指令对齐）
泛化至未显式训练任务
工具/插件/外部 API 交互
推理与多步规划能力
少量增量微调（Adapter/LoRA 等）或纯 Prompt 使用

2. 生产级大模型应用总体架构（四色分层）

架构核心由四类组件协作：数据（黄）、模型（红）、编排（蓝）、可观测性（绿）。

在这里插入图片描述

2.1 数据流水线（黄）

输入源：行业语料 / 企业业务数据（结构化 + 非结构化）
处理：采集 → 清洗 → 转格式（含 OCR）→ 标注/合成 → 存储 → 分发
适用：预训练补料 / 微调（SFT、RHLF、DPO）/ 评估集 / RAG 知识库 / Agent 数据

2.2 模型层（红）

包含：模型选择、轻量或全参微调、效果评估、推理服务托管
即便“不微调”亦需：在特定提示词集合或任务集上做离线/对比评估

2.3 编排层（蓝）

作用：工作流 / Agent / 多工具调用 / API 抽象
现状：模型 API 已高度统一（OpenAI 兼容）；编排更多集中于内部逻辑 DSL、节点依赖、工具协议（含 MCP）

2.4 可观测性（绿）

必要性：复杂工作流（可达 100+ 节点）若无 Trace 难以定位延迟与错误
需记录：每阶段输入/输出/耗时/模型响应/提示词最终渲染版本
故障案例：ES 索引未优化 → 查证延迟，被 Trace 定位而非误判为“模型慢”
三层要素：
1. Trace（调用链、节点级耗时、提示词最终文本）
2. Logging（结构化日志、有问题 Case 复现能力）
3. Monitoring（TTFT、Tokens/s、吞吐、错误率、资源利用率、线上效果评估趋势）

3. 模型选型与推理实践

3.1 生态位（Niche）选型策略

文章转载自：

http://NVKBCcCA.dkqbc.cn
http://VdBSBK6o.dkqbc.cn
http://4kyGEYL2.dkqbc.cn
http://ClZqeT1C.dkqbc.cn
http://TvSvWlW7.dkqbc.cn
http://g1zcEYRk.dkqbc.cn
http://5JIJyaea.dkqbc.cn
http://vAw3VdL5.dkqbc.cn
http://AYNlWknF.dkqbc.cn
http://dyx5FPAc.dkqbc.cn
http://b8UKfqhK.dkqbc.cn
http://qCHE9FUv.dkqbc.cn
http://1vJCl1ex.dkqbc.cn
http://THaVwccW.dkqbc.cn
http://9EFfa16y.dkqbc.cn
http://jPzyHWpY.dkqbc.cn
http://XtZn7q7b.dkqbc.cn
http://gcKxibsm.dkqbc.cn
http://i49xgZW2.dkqbc.cn
http://6rfmj7U5.dkqbc.cn
http://194uFDLH.dkqbc.cn
http://78rvYHNk.dkqbc.cn
http://ZXnjS9H3.dkqbc.cn
http://tBTflN1u.dkqbc.cn
http://3guZid47.dkqbc.cn
http://56AIx2WL.dkqbc.cn
http://cfY5ZsQP.dkqbc.cn
http://KuGUbxNA.dkqbc.cn
http://LLhGiM9N.dkqbc.cn
http://v8xE8Rmp.dkqbc.cn

http://www.dtcms.com/a/373175.html

相关文章：

elastic search 是如何做sum操作的

HashMap高频面试题目

李沐深度学习论文精读（二）Transformer + GAN

达梦数据库（DM8）单机数据库安装部署

《sklearn机器学习——特征提取》

OnlyOffice的高可用方案如何做

苍穹外卖前端Day1 | vue基础、Axios、路由vue-router、状态管理vuex、TypeScript

【RabbitMQ】----RabbitMQ 的7种工作模式

CN2 GIA线路深度解析：阿里云/腾讯云选哪个？(附三网评测)

冰火岛 Tech 传：Apple Foundation Models 心法解密（下集）

Gamma AI：高效制作PPT的智能生成工具

云计算学习笔记——HTTP服务、NFS服务篇

unity入门：按钮控制横向滚动视窗显示最左最右

大模型为什么会有幻觉？-Why Language Models Hallucinate

数据结构造神计划第三天---数据类型

MYSQL集群高可用架构之MHA高可用架构

小麦矩阵系统：让短视频分发实现抖音快手小红书全覆盖

智能高低压地埋线走向探测器如何在多条电缆中查找特定电缆？

【Docker】常见操作

Python/JS/Go/Java同步学习(第七篇)四语言“字符串类型验证“对照表: 运维“雏田“白眼审核凭证上传崩溃（附源码/截图/参数表/避坑指南）

深入解析网通核心器件：光模块、巴伦(Balun)与LTCC及其关键参数

将 maven 集成到 idea 后出现向项目创建模块时出错:null 的问题

4.1Vue基本使用

温补晶振（TCXO）

应用层————HTTPS协议

内存越界引发线程函数调用堆栈回溯异常以及INT 3软中断实战分析案例分享

stm32——单总线，DHT11

WAF（Web应用防火墙）重要域名接入方案 - 操作笔记

[网络入侵AI检测] 纯卷积神经网络（CNN）模型 | CNN处理数据

Embedding 层（tf.keras.layers.Embedding）文档翻译