人工智能_大模型数据标注主要做什么_拉框_人工智能训练师_数据标准师介绍---人工智能工作笔记0244
随着大模型的快速发展,数据标注迅速成为比较热门的工作,那么
数据标注,具体干什么呢?
因为现在人工智能在某个领域如果理解,或者识别的越精准,那么 就需要越高质量的数据,
就是因为,模型的训练,大多还是有监督深度学习.给他足够高质量的数据才行有好的效果.
可以看到在AI领域的工作有哪些.
接数据标注可以在以上的平台
数据标注有可能会多次,返修,符合算法要求的时候才能使用.
除了普通的拉框,还可能对视频中的物体标注,以及,打标签,还有高清地图,遥感数据等等
标注,具体标注工具和方法,在文章最后有
这个澳鹏也是一个数据标注可以接任务的平台
数据标注日常工作
数据标注也叫人工智能训练师
收入情况,实际上,数据标注属于人工智能,最低端的工作.
特斯拉后来也解决了一部分的自动标注.复杂的还是不可以.
可以看到一些数据标注的用处,以及收入
数据标注的分类
https://www.longmaosoft.com/recruit
这个是龙猫数据平台,可以在上面自己接也可以的
可以看到,也有很多的免费视频培训等
然后收入情况.
可以看到数据在增长但是大部分都是非结构化数据
可以看到数据的质量很重要
只有把图片,以及视频等中的数据,告诉模型,是什么,机器才能认识.并且知道.
具体说一个项目,可以看到上面是一个项目文档
里面是对各种车的标注,每种车,都写了如何标注.
可以看到每种车都写了如何去标注,要求是什么
然后不确定的具体是什么车,但是知道是车的也是一种.
这里说这个免费的数据标注工具,在线的
cvat可以看到
可以去注册一个账号然后
登录以后去创建项目
然后添加这个项目中都是有什么车,比如car trunk
等等,各种类型的,如果看不清就可以添加一种unknow的
创建以后可以看到就是这样的
然后就可以去创建task任务了
创建任务
写上任务名称.
然后就可以上传待标注的数据了,可以看到
上传待标注数据以后,然后就可以
确定去创建任务,然后 创建以后点击 open task
可以看到 创建出来的,就可以把任务分配了,
可以分配给对应的员工账号或者自己
然后stage是标准阶段,这里annotations是数据需要标注阶段
然后validation是标注以后,需要被验证阶段
然后acceptance就是标注结果可以交付阶段
然后具体标注,就是可以选择左侧的,这里
我们用长方形比较多,然后再去选择shape先选择类型,比如这里是选择car普通轿车
选择shape
然后去拉框标注
标注以后右边也可以修改类型,比如把car改成suv等
然后对于遮挡的也可以拉框,对于看不清可以选择unknown的类型,这个根据具体项目需求
对于如果是一排车在一块还可以,一个框,框住一排车,这个要求要根据项目
并且在对应比如两轮车,中标注上 可以这样做,并且加一个版本
https://www.bilibili.com/video/BV1W85XzCE2n?spm_id_from=333.788.player.switch&vd_source=256c4f1a9096da5622414b9f4d29f1c9
有时间可以看看上面这个,AI方面的工作,有人做了专门的测评
https://www.bilibili.com/video/BV1fZ4y1K7mH?spm_id_from=333.788.videopod.episodes&vd_source=256c4f1a9096da5622414b9f4d29f1c9&p=17
这个上面是一套数据标注的详细教程.