厦大第三发:《DeepSeek大模型及其企业应用实践》
大家好,我是吾鳴。
之前吾鳴分享过厦门大学出版的两个教程,它们分别是:
《大模型概念、技术与应用实践》
《DeepSeek大模型赋能高校教学和科研》
今天吾鳴要给大家分享由厦门大学出版的第三份教程——《DeepSeek大模型及其企业应用实践》。教程一共148页PPT,文末有完整版下载地址。
内容摘要
1. 大模型:人工智能的前沿
- 概念:大模型指参数规模庞大、训练数据量极大且计算需求高的深度学习模型(如GPT-4、DeepSeek-V3),具备强大的上下文理解、语言生成、迁移学习能力。
- 发展历程:分为萌芽期、沉淀期、爆发期,参数规模从百万级(如LeNet-5)跃升至万亿级(如GPT-4、阿里M6)。
- 分类:按功能分为语言、视觉、多模态模型;按应用层级分为通用(L0)、行业(L1)、垂直(L2)模型;按能力分为通用模型与推理模型。
2. 大模型产品
- 国外产品:如ChatGPT(文本生成)、Gemini(多模态)、Sora(文生视频)、OpenAI o3(推理模型)。
- 国内产品:DeepSeek(推理领先)、豆包(用户量第一)、Kimi(文本处理)、通义万相(视频生成)、文心一言(百度知识增强)。
- 评测:主流模型“非幻觉率”排名(如百度ERNIE 4.0 Turbo达83%),强调大模型可能产生与事实不符的“幻觉”风险。
3. 大模型的行业应用
- 领域:涵盖自然语言处理(客服、翻译)、计算机视觉(医学影像)、语音识别、推荐系统、金融风控、医疗健康、工业制造等。
- DeepSeek应用场景:高频(客服、推荐)、中频(教育、医疗)、低频(法律、智能家居),覆盖自动化回复、个性化推荐、数据分析等。
- 技术融合:与RPA(流程自动化)、知识图谱(结构化知识管理)、物联网(设备监控)结合,优化业务流程。
4. 企业大模型落地方案
- 赋能价值:提升效率、优化流程、降低成本、提高产品质量。
- 部署方式:云端(弹性扩展)、本地(数据安全)、边缘(低延迟)、混合(灵活灾备)、联邦学习(隐私保护)。
- 规划路线:短期构建知识库(RAG),中期微调行业模型,长期搭建AI Agent工作流。
- 挑战:成本(硬件、运维)、数据合规、选型(大厂vs垂直厂商)、收益量化困难。
5. 智能体的企业应用
- 概念:AI Agent是具备自主决策能力的系统(如OpenAI的Operator),可独立规划并执行复杂任务(如采购、数据分析)。
- 与RAG区别:RAG侧重知识增强问答,Agent侧重自主行动(如自动化办公)。
- 类型:生产力智能体(流程优化)、客户服务智能体(7*24客服)、数据分析智能体(商业洞察)。
- 国内平台:如字节跳动Cozé、讯飞星火、支付宝百宝箱,支持低代码开发企业专属Agent。
6. 厂商提供的企业级大模型服务
- 解决方案:分云厂商(如华为昇腾)、AI应用企业(行业定制)、新兴服务商(低成本轻量化)三类。
- DeepSeek一体机:支持本地部署,内置行业场景方案(如金融合同审核),提供全生命周期管理。
- 选型维度:响应速度、输入长度、问答准确率、知识库构建难度、成本效益、垂直训练能力。
7. 大模型典型应用案例
- 医疗:瑞金医院RuiPath病理模型(秒级诊断)、天士力集团(研发与数据分析)。
- 制造:东莞大模型中心(缺陷检测、供应链优化)、云南白药(数据清洗效率提升90%)。
- 政务与教育:厦门合趣科技(AI产业顾问)、华为昇腾(城市级智能算力底座)。
8. AIGC与企业应用实践
- AIGC概述:利用AI生成文本、图像、语音、视频等内容,核心技术包括GAN、大模型、多模态技术。
- 应用场景:文本生成(报告、代码)、图像生成(设计、修复)、语音合成(客服、配音)、视频生成(Sora、可灵)。
- 工具:DeepSeek(文本处理)、即梦AI(图生视频)、腾讯智影(数字人播报)、WPS灵犀(智能办公)。
9. 大模型未来发展趋势
- 技术方向:多模态融合、推理能力强化、小模型高效化、端侧部署普及。
- 应用方向:生成式AI与具身智能结合(物理世界交互)、AI渗透工业与消费电子领域。
- 挑战:算力成本、数据工程效率、模型与业务场景深度融合。
精彩内容
PPT无套路下载地址:夸克网盘分享