“人工”智能究竟需要多少人工?
不得不说,在强人工智能出现之前,现有的应用人工智能的训练对数据具有强依赖性。样本量的大小,正负样本的比例等样本特征甚至能够直接决定所训练的机器学习模型的好坏。
在高效的智能服务下,是庞大到不可思议的数据训练库堆砌起的坚实基石,以及隐身于智能背后数量庞大、层次不齐的“人工”。这些人站在时代风口、却做着民工般枯燥的机械工作;他们让每条数据与我们亲密接触、却又让我们无法触及他们的存在。
目前在中国,数据标注已然是一条十分成熟的产业链,下面是一条数据标注专员招聘的公告:
在 2017 年到 2018 年间,有很多大数据标注公司得到了千万轮的融资。
2018 年 5 月,周同科技完成 2000 万人民币A轮融资;
2018 年 3 月,爱数智慧获得A轮融资;
2018 年 1 月,星尘数据获得 1000 万人民币 Pre-A 轮融资
2017 年 11 月,龙猫数据获得 A 轮 3370 万人民币融资;
2017 年 7 月,BasicFinder 完成 1000 万人民币 Pre-A 轮融资;
这些公司的服务企业有百度、小米、京东、今日头条这样的互联网公司,也有出门问问、云从、深鉴等 AI 公司。 另外,像京东、百度、腾讯、阿里其实都有自己的标注平台和工具。