咨询导览,AI发展趋势
欢迎来到啾啾的博客🐱。
记录学习点滴。分享工作思考和实用技巧,偶尔也分享一些杂谈💬。
有很多很多不足的地方,欢迎评论交流,感谢您的阅读和评论😄。
目录
- 引言
- 1 2024的LLMs
- 1.1 更小的模型,更广泛的覆盖范围
- 1.2 多模态 AI 走向主流
- 1.3 更好的可解释性和日益增长的监管
- 1.4 新的微调技术
- 1.5 开源创新
- 1.6 日益关注伦理和偏见
- 2 2025年顶级LLM趋势:LLM的未来是什么
- 2.1 更小、更高效的模型
- 2.2 实时事实核查和外部数据访问
- 2.3 合成训练数据
- 2.4 企业集成
- 2.5 特定领域的 LLMs(垂直化AI解决方案)
- 2.6 多模态能力
- 2.7 自主代理
- 2.8 安全、对齐和偏差缓解
- 2.9 安全和风险管理
- 2.10 市场动力与经济影响
引言
本篇作下列两篇文章的搬运整理,很水。
https://www.turing.com/resources/top-llm-trends
https://prajnaaiwisdom.medium.com/llm-trends-2025-a-deep-dive-into-the-future-of-large-language-models-bff23aa7cdbc
总的来说,符合之前网上的四字总结:“专、小、廉、强”。
咨询信息是年初的,但是从2025年上半年的讯息来看,OK。
1 2024的LLMs
1.1 更小的模型,更广泛的覆盖范围
在 2024 年,LLM 开发者专注于使模型更小、更高效。TinyGPT 和 TinyGPT-V 等模型表明,性能并不总是需要巨大的规模。这些模型只需 8GB 的内存即可运行,使它们更容易在移动应用、低功耗设备或互联网接入受限的地方使用。
1.2 多模态 AI 走向主流
OpenAI 发布 GPT-4o 标志着重大进展。它能够实时使用文本、图像和音频进行理解和回应。随后,谷歌(Gemini 2.0)、Meta(LLaMA 3.2)和 Anthropic(Claude 3.5 Sonnet)等类似模型也相继推出,扩展了 AI 在创意工具、无障碍服务和客户服务中的作用。
1.3 更好的可解释性和日益增长的监管
SHAP、LIME 和注意力可视化等工具逐渐受到关注,帮助用户理解 LLMs 如何做出决策。这对于医疗保健和金融等行业至关重要。与此同时,各国政府也在推进监管。欧盟 AI 法案于 2024 年 8 月生效,计划于 2026 年全面实施。
1.4 新的微调技术
提示调整和混合方法帮助团队在不完全重新训练模型的情况下定制模型。AutoML 使微调更加便捷,自动化了超参数选择等决策。这些更新使 LLMs 更快、更经济地达到生产就绪状态。
1.5 开源创新
开源 LLMs 获得了进展。Mistral、DeepSeek-V3 和 LLaMA 3.2 等模型以优异的性能公开发布。这为开发者提供了更多控制和灵活性——帮助更多公司构建定制应用。
1.6 日益关注伦理和偏见
LLMs 继续面临输出中的偏见问题。2024 年,谷歌的 AI 工具 Gemini 因生成历史不准确图像而遭到抨击,例如将二战士兵描绘成有色人种,而这些情境在历史上并不准确。这一事件突显了 AI 在平衡多样性与历史准确性方面所面临的挑战。
研究人员致力于识别诸如训练数据偏差或模型行为等成因,并开发了缓解技术。AI 伦理成为开发者、研究人员和政策制定者共同的责任。
2 2025年顶级LLM趋势:LLM的未来是什么
2.1 更小、更高效的模型
紧凑型模型的推动仍在继续。TinyLlama(1.1B 参数)和 Mixtral 8x7B(47B 参数,每个 token 13B 活跃参数)是早期的例子。这些模型在保持强大性能的同时降低了计算成本,使 LLMs 在教育、移动应用和初创企业中更加普及。
稀疏专家模型也在迅速发展。它们不是激活整个网络,而是仅使用与任务相关的部分——从而提高速度和能源效率。
2.2 实时事实核查和外部数据访问
LLMs 在整合实时数据方面正变得越来越好。像 Microsoft Copilot 这样的工具使用实时互联网访问来验证答案。这有助于减少幻觉,并使模型响应更接近人类交叉核查事实的方式。
未来模型将默认包含引用和引用,从而提高准确性和透明度。
2.3 合成训练数据
一些 LLMs 现在可以生成自己的训练数据。例如,谷歌的自改进模型创建了问题和答案来提升自身——显著提高了测试分数。这种技术可以降低数据收集的成本和时间,并提高在专业领域的性能。
2.4 企业集成
LLMs 正成为日常业务运营的一部分。Salesforce 的 Einstein Copilot 使用 LLMs 来支持客户服务、销售和营销。GitHub Copilot 帮助开发者编写和调试代码。这些集成提高了生产力并减少了手工工作。
2.5 特定领域的 LLMs(垂直化AI解决方案)
不再是一刀切,2025 年正朝着为特定领域训练的模型发展。BloombergGPT 专注于金融领域。Med-PaLM 在医疗数据上进行训练。ChatLAW 支持中国的法律应用。
这些模型能够提供更高的准确性和更少的错误,因为它们对自身领域的上下文理解更加深入。
随着各行业在 AI 应用中的成熟,对针对特定应用的 LLM 的需求日益增长。企业不再仅仅依赖通用模型如 GPT-4,而是越来越多地转向领域特定 LLM。这些模型可以通过专有数据进行微调,以提高在从金融预测和欺诈检测到个性化医疗诊断等任务中的准确性、合规性和效率。
2.6 多模态能力
未来的模型不再局限于文本。多模态 LLMs 可以处理文本、图像、音频,甚至视频。这带来了新的应用场景——例如分析 X 光片、生成音乐,或理解视频场景并回答相关问题。
- 跨语言和跨领域翻译
跨语言和跨领域的无缝工作能力是即将到来的多模态革命的一个显著特征。到 2025 年,LLMs 将能够处理多种语言的信息,打破全球交流的障碍。这项能力将对跨国公司和全球研究合作特别具有变革性,在这些领域实时、准确的翻译至关重要。
2.7 自主代理
2025 年的一大趋势是代理式 AI。这些是由 LLM 驱动的系统,能够做出决策、与工具交互并采取行动——无需持续的人类输入。
例如,OpenAI 的 o1 模型是为思维链推理设计的。结合记忆和规划工具,这些代理可以安排会议、分析报告或管理工作流程。
到 2028 年,Gartner 预测将有 33%的企业应用包含自主代理,使 15%的工作决策能够自动做出。
2.8 安全、对齐和偏差缓解
随着 LLMs 在商业和社会中拥有更多控制权,安全变得至关重要。2024 年,研究人员开始评估模型在情境欺骗或压力下的偏见等行为。2025 年,更多关注将投向稳健的监督、透明度和负责任的 AI 实践。
公司正在采用 RLHF(人类反馈强化学习)、公平性感知训练和外部审计来降低风险。
2.9 安全和风险管理
安全风险也在上升。OWASP 更新的 LLMs 十大风险榜单突出了系统提示泄露、过度内存使用和恶意提示注入等担忧。随着 AI 变得更加自主,这些风险需要持续监控。
开发者正在为模型构建防护措施,例如沙盒环境、输出过滤和红队演练。
2.10 市场动力与经济影响
LLMs 不只是科技故事——它们正在重塑经济。高盛估计,生成式 AI 将在未来十年内将全球 GDP 提升 7%。围绕 AI 工具、基础设施和教育的新产业正在形成。
风险投资正以创纪录的速度流入人工智能初创公司,重点关注高效、开放和可定制的模型。