当前位置: 首页 > news >正文

针对跨学科环境挑战的大语言模型微调

摘要

大语言模型(LLMs)凭借先进的推理能力和数据整合能力,正在为各专业领域带来变革。然而,环境科学因其跨学科属性、专业术语体系以及从气候动态到生态系统管理的异质性数据,给大语言模型的应用带来了独特挑战。尽管在水文学、气候建模等子领域已取得进展,但目前尚无一个整合框架,能够生成高质量的领域专属训练数据,或在整个环境科学学科范围内评估大语言模型的性能。

为此,本研究提出了一个统一的技术流程(pipeline)以填补这一空白。该流程包含三个核心组件:

  • EnvInstruct:用于提示词生成的多智能体系统;
  • ChatEnv:规模达1亿词元(token)的均衡指令数据集,涵盖气候变化、生态系统、水资源、土壤管理和可再生能源五大核心主题;
  • EnvBench:包含4998个评估项的基准测试集,可对分析、推理、计算和描述类任务进行评估。

基于该技术流程,研究人员对一个拥有80亿参数的模型(命名为EnvGPT)进行了微调。在独立的EnviroExam基准测试中,EnvGPT的准确率达到92.06±1.85%——相较于参数规模相当的基准模型LLaMA-3.1-8B,准确率提升了约8个百分点,且性能可与闭源模型GPT-4o-mini以及参数规模为其9倍的Qwen2.5-72B相媲美。在EnvBench基准测试中,EnvGPT在相关性(4.87±0.11)、事实准确性(4.70±0.15)、完整性(4.38±0.19)和表达风格(4.85±0.10)四个维度均获得大语言模型评估(LLM-assigned)的最高得分,在所有类

http://www.dtcms.com/a/508127.html

相关文章:

  • 视频网站开发前景如何网站做最优是什么意思
  • SpringCloud-网关
  • 弹窗网站制作器做网站需要一些什么东西
  • 并发编程深度解析:从读写锁到TCP Socket并发读写
  • Linux1020 GBLIC安装mysql
  • 东莞网站建设环保设备wordpress模板 众筹
  • 高水平大学建设大学网站华为网站建设招聘
  • 如何系统化掌握 iOS 26 App 耗电管理,多工具协作
  • iOS 应用代上架流程,多工具组合与使用 开心上架 跨平台自动化上传指南
  • 【Leetcode hot 100】70.爬楼梯
  • 手机娱乐网站制作国内漂亮网站欣赏
  • 怎么做短链接网站诺诚软件开发
  • 【JUnit实战3_04】第二章:探索 JUnit 的核心功能(四)
  • 如何用ps做网站ui网站制作公司北京华网
  • 深入理解Lua闭包机制:从原理到mpv实战(深度!)
  • Flask【python】
  • day13_mvc 前后端分离
  • 网站定位方案威海信息网
  • 一个WEB端的API测试工具、API文档编写工具、定时任务调度工具
  • 电商秒杀系统设计 Java+MySQL实现高并发库存管理与订单处理
  • 中国建设银行笔试确认网站万网域名在中国电信网站备案系统
  • 个人网站 组建长沙旅游
  • 矩阵的奇异值分解(SVD)及其在计算机图形学中的应用
  • 青海旅游的网站建设公司网站可以免费建吗
  • 镇江网站建设zjmfkj厅网站建设中标公告
  • 高光谱成像用于草地可燃物含水率估测的研究进展
  • Product Hunt 每日热榜 | 2025-10-20
  • C++STL之unordered_map,unordered_set与哈希表
  • 电商税新规下的第三方支付云账户分账解决方案
  • 【Linux指南】冯诺依曼体系结构:现代计算机的基石