当前位置: 首页 > news >正文

蚂蚁数科AI数据产业基地正式投产,携手苏州推进AI产业落地

近日,蚂蚁数科AI数据产业基地在太仓智汇谷·科技创新园正式投产。该基地作为苏州市首个AI数据产业基地,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。

数据被视为AI学习的核心教材。然而,AI在工业等复杂场景落地时,常面临行业知识匮乏、高质量数据稀缺等瓶颈,急需专业人才参与建设。专业的AI数据标注师,被誉为“AI教官”,他们通过精确标注和修正,确保训练数据准确、无偏见,以此提升模型输出的安全性与可靠性,并持续“教导”AI理解语义、更通人情。

赵秋燕是某财经大学金融学本科毕业,曾从事会计工作,擅长纠正AI回答的金融问题。学法律的严冯娜,主要工作是标注大模型输出文字中涉及的“红线”问题,教AI“什么能说,什么不能说”。标注师李宁曾经是个美术老师,他需要面对大量图片数据,标注其中的“内容风险”。医学、外语、旅游等领域的专业人才也正加入各垂类模型的数据标注工作。

“蚂蚁数科AI标注师队伍的平均学历在本科以上,太仓政府在园区建设、人才招募、生态企业入驻等方面提供了强力支持。”蚂蚁数科AI科技事业部总经理张凯介绍,蚂蚁数科已与江苏多所高校开展产教融合、孵化AI实战人才。按计划,基地未来将扩展至300人规模。

技术层面,蚂蚁数科自研的AI数据标注平台可智能推荐标注内容、自动补全标签,结合自动化质检与人工抽检双重保障数据质量。当前其标注服务已覆盖金融风控、内容审核、自动驾驶、智能客服等数十个场景,为多领域大模型产业化提供可靠的数据基石。

http://www.dtcms.com/a/290345.html

相关文章:

  • 使用Python绘制专业柱状图:Matplotlib完全指南
  • 《Linux服务与安全管理》| 安装拼音输入法
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 主页布局实现
  • “hidden act“:“gelu“在bert中作用
  • 经典神经网络(vgg resnet googlenet)
  • 家庭网络怎么进行公网IP获取,及内网端口映射外网访问配置,附无公网IP提供互联网连接方案
  • 03-虚幻引擎蓝图类的各父类作用讲解
  • el-table固定高度,数据多出现滚动条,表头和内容对不齐
  • Eltable tree形式,序号列实现左对齐,并且每下一层都跟上一层的错位距离拉大
  • 深入解析Hadoop MapReduce Shuffle过程:从环形缓冲区溢写到Sort与Merge源码
  • VMware Workstation Pro克隆虚拟机导致网络异常解决方法
  • 深度学习 pytorch图像分类(详细版)
  • 【设计模式】观察者模式 (发布-订阅模式,模型-视图模式,源-监听器模式,从属者模式)
  • HTTP性能优化:打造极速Web体验的关键策略
  • 从实践出发--探究C/C++空类的大小,真的是1吗?
  • 西门子 S7-1500 信号模块硬件配置全解析:从选型到实战
  • 如何快速比较excel两列,拿出不同的数据
  • 在.NET Core API 微服务中使用 gRPC:从通信模式到场景选型
  • 用 STM32 的 SYSTICK 定时器与端口复用重映射玩转嵌入式开发
  • 大模型高效适配:软提示调优 Prompt Tuning
  • The Survey of Few-shot Prompt Learning on Graph
  • AI Agent开发学习系列 - langchain之LCEL(3):Prompt+LLM
  • JavaScript Promise全解析
  • Prompt Engineering(提示词工程)基础了解
  • 【PTA数据结构 | C语言版】列出连通集
  • 归并排序:优雅的分治排序算法(C语言实现)
  • 什么是商业智能BI数据分析的指标爆炸?
  • Leetcode 3624. Number of Integers With Popcount-Depth Equal to K II
  • nerf-2020
  • Python 列表操作—基础和进阶技巧