在ChatGPT时代,数据标注员仍在从事基础工作

首页 热门新闻 最新资讯

在ChatGPT时代,数据标注员仍在从事基础工作

热搜大全 2023-07-27

肯尼亚内罗毕一群年轻人挤在狭小的办公室里,专注地在电脑屏幕上阅读着来自遥远国度OpenAI的英文字符。这些年轻人,热衷于追寻最新的科技发展,既希望拓宽自己的知识视野,也希望能从中获得更多的启发和激励。他们勇敢地挑战着语言和文化的障碍,力求将国际前沿的科技知识带回故土。 在这逼仄的办公室里,年轻人们用他们坚定的目光和忙碌的手指,翻阅着OpenAI的编程代码和技术文档,拼凑出一幅幅前所未有的科技图景。他们自愿承担着严苛的工作压力,毫不畏惧地攀爬技术的高峰。正是这种坚韧不拔的精神,让他们能够跨越时空与国界,将创新的火花传递给肯尼亚乃至整个非洲大陆。 这群年轻人怀揣着对未来充满希望的梦想,在这个遥远而又繁忙的城市里形成了一道革命的风景线。他们相信,在知识与智慧的指引下,非洲的青年们能够创造出具有国际影响力的科技成果。为了实现这个目标,他们不断追求学习和进步,展现出非凡的勇气和敢于创新的精神。 岁月的长河中,肯尼亚内罗毕这一群年轻人与国际科技发展潮流相连,用自己的双手书写着属于非洲大陆的科技时代。他们是未来的使者,为正在快速崛起的非洲科技产业注入了活力与活跃。他们勇往直前,用坚定的脚步和无畏的精神,打破了语言的壁垒,让知识的火炬在这片土地上绽放出耀眼的光芒。

他们工作的 9 小时中,要阅读、标注 150-200 段文字,每段文字在 100-1000 个单词之间。而这群人的薪水是每小时 1.32-2 美元。

当你和 Bard 和 ChatGPT 聊天时或许并不知道,它给出的每一个机智答案背后,都凝聚着无数数据标注员的血汗。

很少有人关注标注员,也很少有人深究他们的工作。然而,标注员是 AI 产业链极其重要的一环。在他们一次次枯燥、乏味的工作后,AI 模型变得越来越聪明。这群人有不同的工资和待遇,共同点是重复着同一份机械、辛劳的工作。他们就是 AI 时代的流水线工人。

近日,谷歌一份内部文件曝光。文件显示,Bard 的标注员要在 3 分钟内审阅、标注完 Bard 的回答。这些数以千计的外包工,在 deadline 重压之下吃力地阅读自己完全不熟悉的专业文字,一个小时挣 14 美元。

" 人们感到害怕、压力大、挣得太少,而且完全不知道正在发生什么。" 一位外包标注员这样形容自己的生活。

数量上百万的标注员遍布全球,很多都是外包工,在零工经济中赚取微薄的薪水。他们参与每一轮 AI 浪潮,又离台前光鲜性感的故事极其遥远。行业人士为 ChatGPT 和大模型将如何革新世界侃侃而谈,而这群标注员生活却没有任何改变,他们仍然 " 隐身 ",甚至生存状况更糟糕。

大战之下的小兵

谷歌正处于久违的危机中。在生成式 AI 竞赛中,谷歌已然落后于 OpenAI。

被颠覆式创新扔到大潮之后的恐惧笼罩谷歌,以至于内部一度发布极其罕见的红色警报(red code )。CEO Sundar Pichai 亲自上阵,全权负责 AI 业务。

在 2 月季度财报的电话会议上,Pichai 告诉投资者:" 接下来你们会很快看到谷歌的动作。"

接着,它们匆忙推出聊天机器人 Bard,5 月又发布了大语言模型 PaLM 2。

谷歌急迫地上马新项目,对 Bard 迭代心急如焚,最终的结果就是压力转移到最底层的数据标注员身上。

有很多个谷歌的合同工说,自从谷歌开始加入 AI 军备竞赛,他们的工作几何增长,内容也更复杂。这群标注员要处理药物剂量说明和法律文书等等专业文件,时间只给了 3 分钟,而他们根本没有经过相关知识的培训。

这种有时间限制,又要求精准的工作让人一直神经紧绷。标注员们的劳动伴随着恐惧,当然会影响工作质量。在一份员工提交的报告中,他们写道:如果一直要求他们这样求快,Bard 会变成一个危险和充斥着错误信息的产品。

然而,在白热化的竞争中,谷歌无暇顾及数据标注员的感受。他们受雇于 AI 数据训练公司澳鹏(Appen)和埃森哲,和谷歌切身利益没有太大关系。

AI 是个彻头彻尾的全球化产业。澳鹏的正式员工只有 1600 人左右,而外包员工数量高达上百万。这家位于澳大利亚悉尼郊区的公司伴随 AI 行业崛起成长为明星,一年收入 6 亿澳元。

可以预想,这一次生成式 AI 的狂欢会催生对标注员更庞大的需求,澳鹏也会从中分得更多利润。

只是,无论 ChatGPT 迭代多少代,硅谷大厂市值上涨多少倍,最底层的标注员不会得到太多好处。

我们可能摆脱标注么?

标注员的工作是纯粹的人类劳动。他们要比较两则新闻,评估哪条新闻相关性更高。他们也要判断 AI 给出的答案中有没有 " 一本正经胡说八道 " 的事实性错误。标注员们都有本守则,会从 6 个角度指导他们做出判断。

以目前 AI 的技术水平,根本无法离开真人训练。AI 标注其实就是不断地动用人类主观性做出常识判断。

AI 行业其实是一个劳动密集型行业,即便在大模型时代也是如此。

国家之间发展不平等的现状客观存在,所有劳动密集型行业要获得超额利润,必须全球分工。

对当地人来说,这种全球分工其实不是坏事。OpenAI 合作的外包公司 Sama 总部虽然位于旧金山,但它的员工来自乌干达、肯尼亚和外包大国印度。在肯尼亚,这些标注员工的工资为每个月 2.1 万肯尼亚先令(约合 1158 元),算当地普通工人的平均水平,而且坐办公室,不用做体力活。

ChatGPT时代,数据标注员还在搬砖

SAMA 公司员工,图片来自官网

澳鹏这样的公司会很精明地将工资定在最低工资基准以上,而且还会给一个月 70 美元的奖金。这对当地人来说是笔不错的收入。

在加尔各答郊区,穆斯林女性因为全球分工获得了工作机会。她们给亚马逊、微软、eBay 等等训练 AR 算法和自动驾驶数据。

一些中国年轻人则很欢迎这样的工作。在贵阳市百鸟河数字小镇,数字标准员中会有刚从高职学校毕业的学生,一个月挣 1500 元。比起送外卖、当服务员,他们其实更喜欢坐在办公室训练 AI。

作者项飚曾经很客观地评估过这种共生关系:" 由于 IT 行业的劳动密集型的特征,如果没有一个巨大的、额外的劳动力储备,该行业或许根本无法快速发展,由此无法向当地工人提供现有的就业机会。"AI 需要发展中国家的廉价标注员,而标注员们也需要这份门槛不高的工作维生。他们从来不是受害者,也不是需要人同情的弱者,而是一群努力、勤奋工作的普通人。

当然,我们不能因此将低工资、高压力的工作合理化。国家和国家之间的不平衡也不是压榨标注工人的借口。即便只是自私地为了 AI 学习数据的质量,这些吝啬的科技公司也应该给标注工人更好的待遇和工作环境。

AI 催生了明星公司、百万富翁,它还将改变各行各业,产生难以想象的收益。只是,这些宏大的愿景和坐在乌干达办公室埋头苦干的标注员无关。当某一天,AI 进化到不需要标注员时,这群从来不被承认的功臣又会被毫不留情地扫去角落。

" 我告诉我的朋友和家人,谷歌、亚马逊、苹果等公司的工程师就像人工智能婴儿的亲生父母和私人教师,而我就是清扫他们的育婴房并给他们洗衣服的女佣之一。" 一位标注工这样形容自己的工作。

或许,即便我们不可能短期内改变经济、知识结构的区域不平等,起码可以看见他们,衷心认可他们的价值,承认他们在 AI 时代的不可或缺。

最受喜欢

数据标注 明星 谷歌 ai 阅读 热点 本地 社区 美图 视频 直播 资讯

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13