北欧囚犯在训练AI》作者老k编辑硬AI

日期:2023-09-18 09:50:18 / 人气:115


在一个阳光明媚的星期三早晨,我走进一间没有窗户的白色房间。房间里有一张干净的白色桌子。餐桌旁,有一位四十出头的中年妇女。
她的背很直,金色的头发用浅蓝色的发圈扎在脑后。看到我来了,她把目光从桌上的惠普笔记本上移开,笑着有点疲惫地介绍我:“姑娘们都叫我果酱。”
在工资高的芬兰,这样的数据注释者很少见,直到有公司想出一个“绝妙”的主意——囚犯。
在每三个小时的数据标记轮班中,囚犯可以获得1.54欧元(约合1.67美元)。
这时,Jam女士的电脑屏幕上弹出一篇关于房地产的短文,要求她做“阅读理解”。其中一个问题是:“第一段是关于房地产政策还是买房的建议?”
果酱耸了耸肩。她觉得有点无聊——她不太清楚这项任务的意义。“也许我在训练一只ChatGPT?”她略带挖苦地喃喃自语。
事实上,她正在训练Metroc拥有的一个大型语言模型,Metroc是一家芬兰初创公司,试图创建一个人工智能搜索引擎,以帮助建筑公司找到新批准的建筑项目。
为了做到这一点,Metroc需要招聘精通芬兰语的数据标注工人,以帮助其模型理解相关新闻文章和市政文件。
上一代的“数据标注器”主要集中在“点”和“框”上,教机器什么是“面”,什么是“障碍”。而新一代的数据标注员,他们的主要工作更像是阅读理解,需要帮助大模型查找、修改、评分,教会大模型应该生成什么样的内容。
在全球范围内,数百万“数据注释者”正在训练各种人工智能模型。通常,这些工人位于非洲、印度和其他工资较低的地区。然而,对于芬兰等不想在生成式AI竞赛浪潮中落后的欧洲小国来说,这里的员工并不适合——他们看不懂芬兰语。
这也是Metroc想出监狱这个主意的原因——这里有廉价的芬兰语劳动力,用很少的劳动力成本培养一个AI就能获得大量融资。
同时,监狱系统也乐于为犯人提供这些“不一样”的就业机会,双方一拍即合。
监狱中的“数据注释者”
自被拘留以来,Jam女士一直被关押在meenlinna监狱。
这座建筑很现代,有大窗户和彩色艺术品。如果不是每个出入口都被厚重的灰色防盗门挡住,这些房间很容易被误认为是好大学。
芬兰可能因其开放式监狱而闻名——囚犯可以在附近的城镇工作或学习——但这座监狱并非如此。相反,meenlinna是该国安全级别最高的监狱之一,只关押女囚犯。
Jam女士被判处6年监禁,这在一个囚犯服刑12年后可以申请释放的国家是一个很重的判决。
Jam刚入狱时,经常看着其他女犯人每天早上起床去上班:她们可以自愿做清洁、洗衣服或缝衣服。他们每工作6小时可以得到大约6欧元(6.50美元)。
但Jam不想参与其中——“我觉得会很累,”她说。
因此,她选择长期呆在牢房里。当一位监狱顾问建议她尝试“AI工作”时,她被仅仅三个小时的“短暂”工作时间所吸引,赚的钱总比什么都不做好。“虽然不多,但总比呆在牢房里好,”她说。虽然到目前为止只完成了三班倒,但她说已经很有成就感了。
哈姆林纳是芬兰三所提供“数据注释器”的监狱之一。三个监狱各有三台笔记本电脑,供犯人参与这项AI工作。
工作没有明确的目标,工资按小时发,不按工作的速度或质量发。
坐在贾姆女士旁边的监狱“工作导师”米娜·英根宁(Mina Ingenin)留着一头红色短发,她说,哈姆林纳监狱大约有20名囚犯尝试过这份工作。“有些人肯定比其他人更喜欢这份工作,”她说。
可是到了监狱,发现缝纫室已经很忙了,只有贾姆一个人在艾工作的小房间里。
对此,宁珂解释说,目前只有三名犯人自愿定期参加AI轮班,另外两人目前正在接受法院审判。
“我更喜欢和一群人一起做,”杰姆说。她补充说,她喜欢让门开着,这样她就可以一边回答问题,一边和隔壁缝纫机房的人交谈。
这些问题写于赫尔辛基,在监狱以南100公里处。在那里,我遇到了Metroc的创始人兼首席执行官Yossi Vilnara。
在他们现代、时尚、漂亮的办公室里,他微笑着告诉我,他们刚刚度过了激动人心的一周。该公司刚刚宣布了最新一轮200万欧元(210万美元)的融资,他计划用这笔钱在北欧拓展业务。
他说,在与投资人的交谈中,他感受到了投资人对“芬兰监狱”的热情:
每个人都对这种创新的方式感到兴奋。
我觉得这从产品角度来说也是很有价值的。
利用监狱作为劳动力来源是弗纳拉的主意。如上所述,这家芬兰初创公司需要说芬兰语的注释器来帮助改善其大规模语言模型对特定于建筑的语言的理解。
在芬兰这样的高工资经济体中,要找到这些数据工作者是非常困难的。因为芬兰有“非常慷慨”的失业福利制度,所以很少有芬兰人愿意做一些低工资的外包工作(比如亚马逊的Mechanical Turk)。
“在土耳其机械公司,几乎没有多少讲芬兰语的工人,”维尔纳拉说。他补充说,自动翻译工具对芬兰语这种母语人口只有500万的“小语种”仍然无能为力。
为囚犯提供“多样化”的工作选择
当维尔纳拉向芬兰监狱和缓刑机构智能监狱项目负责人皮娅·普拉卡(Pia Praka)提出自己的建议时,后者立刻表现出了极大的兴趣。
普拉卡说,在新冠肺炎疫情之前,另一家名为Vainu的芬兰科技公司使用囚犯进行数据劳动。但由于联合创始人的分歧和项目负责人的离职,项目告吹。
因此,当2022年Vernara提出自己的建议时,Prakash也非常渴望重启AI工作。普拉卡认为,在监狱中提供这种AI工作的目标不是取代传统的监狱工作,例如制作路标或园艺。而是给犯人提供更多的选择。
数据标注一天只能做三个小时。“如果你每天只做这种工作八个小时,你可能会很累,”她说,并补充说,如果囚犯可以在标记数据的同时参加其他类型的监狱劳动,那将是很好的:
这样的工作才是未来。如果我们想帮助囚犯适应监狱外的生活,这些技能可能至少与监狱提供的传统工作一样重要。
然而,没有人确切知道数据标签能为囚犯出狱后的生活提供多少价值。负责瓦伊努监狱一年的Tuomas lassila承认,他没有证据证明这一点。他说这个项目没有运行足够长的时间来收集证据。
一些专家认为,这种新形式的监狱劳动是剥削廉价劳动力的一部分,而廉价劳动力是人工智能革命的基础。
研究人工智能的高级研究员阿莫斯·托托(Amos Toto)表示,对数据注释器的需求越来越大,这将促使公司越来越多地转向其他选择很少的群体,如“难民、经济危机国家的人口以及现在的囚犯”。
托托也对数据工作者能否帮助囚犯建立数字技能持怀疑态度。他说:
监狱里的人有很多提升自己的方法,比如考取证书,参加教育。
我怀疑以每小时一欧元的价格给公司的数据贴标签是否会带来有意义的进步。
回答哈姆林纳监狱,它确实为囚犯提供人工智能的在线课程,但Jam只是坐在那里,面无表情地看着电脑...
小国艾的“无奈之举”
将监狱与Metroc的办公室相比,女囚犯每小时只能获得1.54欧元,而公司却在庆祝2000万欧元的融资——这有些不协调。我对监狱项目的价值感到有点矛盾。
在赫尔辛基大教堂对面的一家咖啡馆里,我耐心地向赫尔辛基大学的研究员莱提·米妮描述了我的感受。
对此,他表示,相信这些劳动者不是主流社会的普通劳动者。这些人在监狱里,“把我作为一个研究人员得到的钱和囚犯为他们的监狱工作人员得到的钱相比较是没有意义的。”他补充道:
我听到的唯一消极的事情是目前没有足够的工作。只有少数人能做到。
此外,莱提·米妮说,“当我们想到数据劳动时,我们往往会想到机械土耳其人和世界南部或美国农村地区的人。”但这种方式提供了一种独特的本地数据劳动,不仅对社会有益,还为囚犯提供了“脑力劳动”的机会。同时也强化了芬兰语在人工智能革命中的地位。
莱提·米妮担心,如果没有这种做法,非英语语言可能会被排除在下一代技术之外:
智能音响还是很难听懂芬兰语,而且不是所有的芬兰人英语都很流利,所以这些本地数据标签也是必须的。
值得一提的是,Metroc并不是唯一一家不得不寻找芬兰数据工人的公司。
2011年,芬兰国家图书馆创造了一个游戏来鼓励志愿者帮助数字化其档案。2020年,芬兰广播公司YLE与赫尔辛基大学和国家发展公司VAKE合作,寻求志愿者捐赠他们的芬兰语录音。
芬兰模式还是坏先例
有人担心这种做法可能会开“坏先例”,可能会将更多有争议的数据标签类型引入监狱,比如对暴力内容的审查。
人工智能高级研究员阿莫斯·托托说:
即使芬兰目前标记的数据是无可争议的,我们也必须考虑它所开创的先例。
如果公司看到这是一个未开发的劳动力池,有什么能阻止他们把创伤性和不愉快内容的数据标签外包给监狱里的人?
目前,尚不清楚这种“芬兰模式”能否在其他国家复制。
根据民权组织美国公民自由联盟(ACLU)的数据,76%的囚犯报告说监狱劳动是强制性的。拉西拉说:
美国的监狱系统与芬兰或北欧国家完全不同。这是完全不同的想法。
在芬兰,人们对这个项目持完全积极的态度,因为每个人都知道这是自愿的。
人工智能公司将需要更多的数据工人,这将迫使他们不断寻找越来越多的“非常”劳动力,以保持竞争力。
随着Metroc计划扩展到北欧其他地区和芬兰以外的语言,Vilnara正在考虑将监狱劳动计划扩展到其他国家。
“这是我们需要探索的东西,”他说。
本文编译自:
https://www.wired.com/story/prisoners-training-ai-finland/? redirect URL = https % 3A %2F % 2fwww . wired . com % 2f story % 2f囚犯-培训-ai-芬兰% 2F
本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。"

作者:天富注册登录平台




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 天富注册登录平台 版权所有