3月,蒙蒙春雨中,黄土高坡的山路上,都是雾,能见度极低。当地司机习以为常,闇练地开启双跳灯,依旧把车开得飞快。
从车窗看出去,只能瞥见前车尾灯发出的红光。潮新闻 谢丹颖 摄
与飞驰的车不同,此行的目的地——山西省临汾市永和县,一贯“走”得很慢。
这里,面积不大,自西汉置县,隋改名“永和”沿用至今,历史悠久。公开数据显示,永和户籍人口不敷5万。迄今为止,也尚未通火车。2016年年底高速正式通车后,从永和去临汾,驾车至少须要两个半小时。
很难想象,就在这个耕地贫瘠、交通闭塞、家当孱弱的县城,AI(人工智能)为当地开了全新的一扇窗。2020年8月3日至今,百余名县城女性加入永和县爱豆科技有限公司,从事数据标注师的事情。一台电脑在手,就成为数字经济中的一环。
数据标注师,是人工智能发展下的全新职业。常日利用智能演习软件,在人工智能产品实际利用过程中,进行数据库管理、人机交互设计、性能测试跟踪及其他赞助作业。
四年过去,这些从事数据注标的偏远县城女工,从样子容貌、衣饰、言语、思想,乃至家庭地位,都发生了翻天覆地的变革。
数据标注师们在2023天下人工智能大会合影 受访者供图
标注
在县城,最稳定的构造是家,最核心的部分也是家。曾经,在永和对女性最大的期许和赞赏,是生儿育女、做贤妻良母。
而现在,主街的尽头,一幢标有“永和人才基地”的矮楼中,坐满了各式妆容精细的女性,面对台式电脑,背挺得笔直,双手合营娴熟。偌大的房间很是安静,只有快速敲打键盘、点击鼠标的“哒哒”声。
永和县爱豆科技有限公司,数据标注师们正在事情。受访者供图
她们从事的职业——数据标注师,也被称为AI演习师,通过贴标签、画框、排序等办法,为笔墨、图像、语音做标注,喂养AI,让AI变得更聪明。
至于数据标注后详细用来做什么,即便是项目经理王丽娜也说不出来,“有些做得多了,能猜出个大概”,比如让舆图更精准定位、自动贩卖机识别更准确等。
这家在县城显得“突兀”的公司,源自2019年蚂蚁集团、浙江蚂蚁公益基金会、中国妇基会等发起的“AI豆操持”数字家当扶贫项目。在国家卫健委果折衷下,永和成为该项目在欠发达县城的第二批试点。项目启动的第二年,数据标注公司落了地。
“主力是宝妈。”第一批员工冯琴是个中之一。今年40岁出头的她,身材姣美。当她用手在屏幕上虚画框线、阐明标注的步骤时,苗条手指、亮色美甲,无不吸引的把稳。
股票、汽车、时尚......冯琴如数家珍,举手投足间,丝毫没有在西部欠发达地区生活的闭塞感。“职业女性”和“两个女儿的妈妈”的气质,在她身上,奥妙地融于一体。
“如果肯干,月入五六千不是问题,不比在外打工差。”冯琴没想到,在永和,人为能达到这个数——数据标注行业少有底薪,以计件人为为主。她记得,自己第一个月业务并不闇练,收入也超过了3000元,“在家门口上班,还有双休,谁不愿意?”
永和县的清晨。潮新闻 谢丹颖 摄
经济根本决定家庭地位。王丽娜创造,事情四年来,他们家夫妻双方地位逐渐平等。家务从不沾手的丈夫,如今也会在她事情繁忙的时候,帮忙带娃、做饭。三年疫情,更是让不少能居家办公的女性数据标注师,第一次成为小家庭的经济支柱。“吵架都吵得少了,没那闲工夫,赢利要紧。”
空隙韶光,她们花在“变美”上——纹眉毛、染头发、做美甲、买新衣......县里没有商业综合体,便约上三五小姐妹,趁着周末或节假日,驱车去临汾“血拼”。
“有时候满载而归,一个月的人为就清了零。”冯琴坦言,有这份事情,让她们敢费钱了,“顶多加几天班,把钱再赚回来。”
在不知不觉中,各种数据标注项目,搭建起她们认知天下的广阔想象——曾做旅游干系标注业务的王兰兰,搜索过大量关于西湖、乌镇等景区的资料。“很美。”坐在电脑屏幕前,她仿佛瞥见了1400公里外浙江的样子容貌,“将来有机会,我想去那里走一走!
”
变身
由于这份事情,2023年4月,王丽娜、冯琴作为“AI豆操持”永和项目代表,受邀参加蚂蚁集团首届“数字木兰”女性发展年会,飞到杭州,“学到不少新东西、认识不少新朋友,也玩了不少地方”。
也正是由于这份事情,平时在幕后标注数据的她们,在2023年7月,赶赴上海世博展览中央,一览天下人工智能大会的盛况。“之前,我只知道自己在为AI做事。这次,我终于知道了最新的大模型都在做什么。”机会来之不易,当时王丽娜已怀胎7月,挺着大肚子,她也没舍得缺席。
2023天下人工智能大会现场,王丽娜(左一)和冯琴(中)正在听干系卖力人的先容 受访者供图
统统,都是之前的永和女性,想都不能想的事。
据当地人先容,山西临汾紧张的产煤区、铁矿资源区、小麦产区,都与永和“擦肩而过”。直到2015年,永和探测出天然气,几个气站成为吸纳当地男性劳动力的紧张用工企业。
走在永和大街上,除了老人,县城里涌现的身影多是妇女儿童。“永和有个最常见的家庭分工:男的出去开大货车,一个月赚七八千;女人留守,照顾孩子。”永和县爱豆科技有限公司卖力人李林峰说。
分开事情、成为家庭妇女,是永和大部分女性角色的缩影。不少女性数据标注员见告,即便家中有老人帮忙带孩子,女性有韶光,但县城本身太小,事情也不好找;超市匆匆销员、饭店做事员等为数不多的事情机会,每月无休,月收入也不超过3000元。
“之前全靠丈夫在外打工挣钱,送完孩子上学后,生活不是打牌便是刷短视频。”王丽娜坦言,那几年,县城里的一些棋牌室乃至直接开到了学校阁下,目标就瞄准这些妈妈群体。
永和姑娘王丹丹,提及成为数据标注员之前的生活,尤其是生完孩子后的生活,眼睛湿漉,“她一天到晚啥也不干!
”,丈夫朋友的一句话让她如鲠在喉,每天做饭、洗衣服、给孩子喂奶,“凭啥说我啥也没干?”
还是那个小县城,听说,它比四五年前“繁荣”了许多。主街上开了家蜜雪冰城,每到周末,附近的中小学生能把店里的冰淇淋买光。到时,主街两边行道树上缠着的红灯笼还未取下,星点赤色,透出小城的喜庆和发达。
行道树尚未长出绿芽,过年的红灯笼高高挂在树上。潮新闻 谢丹颖 摄
“对流动的县城女性来说,她们在身份认同上更加存在困境,面临‘进不了城市,回不去家乡’的尴尬。通过数字就业,她们实现了事情、生活两不误的新型城镇化生活。”蚂蚁集团干系卖力人说。
据悉,永和县爱豆科技有限公司,是一家县属国企,由国家卫健委、永和县政府、人社局,以及蚂蚁集团共同扶持,现有员工110人,是目前永和县最大的用工企业,在岗人均月收入4000元以上。这个公司里,女性员工占比高达90%,超过60%为近两年的外地返村落夫员。
前方
2023年以来,ChatGPT横空出世,AI受到前所未有的关注,全体行业开始提速。但黄土高原上的数据标注女工,依旧在自己的节奏里,紧张又舒适地生活着。
数据标注成为一门行业的韶光并不长,起步期可以追溯到2012年。从一个新观点到2020年被国家正式列为新兴职业,用了8年韶光。
最开始时,数据标注事情的质量哀求不高,对图片进行重复框定就能实现项目需求,一张图的价格不过几分钱,全靠数量获取微薄利润。
近几年自动驾驶的发展,带动了数据标注的市场。据德勤的报告显示,2022年自动驾驶领域的标注需求占全体AI下贱运用的38%,估量到2027年,比例将上涨到52%。
智能驾驶 图源视觉中国
“自动驾驶对数据标注的需求量大,由于它哀求近100%的精准度。”业内人士坦言,大部分人工智能产品对模型精准度的哀求都高于90%,但当精准度想从90%提升到95%,或者从95%再往上提升一点时,对背后数据量的哀求可能是百万乃至千万级。“精准度哀求越高,须要的数据量成倍增加,意味着数据标注数量同样更加。”
今年大模型兴起,给数据标注行业再添一把火。大量基于大模型演习场景的订单朝数据标注公司飞去,为数据标注这个呆板的买卖,再次注入活力。
于是,一些技能公司走向更前列,考试测验利用AI自动合成数据,供AI演习。合成数据是基于少量真实数据,用AI无限天生、无需标注的数据,它不再依赖人工标注。
在他们的畅想中,今后合成数据将取代人工标注。
没有技能、只靠人力的标注公司将被逐步淘汰。一项数据显示,国外用于人工智能的根本数据中,已有70%是合成数据,这条路正在被验证。
王丹丹在做标注事情 受访者供图
李林峰见告,目前公司没有受到太多影响,由于公司本身起源于扶贫项目,有公益性子。过去四年,接到的业务订单比较稳定,大多来自蚂蚁集团内部,或者集团作为枢纽,为这些县级小企业引入其他公司的业务。
“总体上,我们的业务量不断增加,但同时,标注业务的难度也在上升。”在李林峰看来,200个人的标注公司是永和县的天花板。目前,已经开始涌现高学历或有专业背景的员工需求,比如金融、医疗专业的年轻人,但除了极少数的,并不是所有的女工都有自我提升的能力与希望。
“为什么在有的购票软件上搜不到临汾直飞杭州的飞机?”的辗转行程,引起了几位数据标注师的热议。他们近期便在卖力一个文旅项目,通过标注,让导航更灵光、舆图更准确、推举更智能。反复搜索后大家创造,须要精确搜索“尧都”,才能订到一天一趟的直达航班,“看来舆图AI推举精准度有待提高,我们在做的项目还需进一步推进!
”
电脑屏幕上的笔墨、图片、视频一个个闪过,间隔韶光以秒打算,令旁人眼花......
“转载请注明出处”