|
提要:在以人机交互为诉求的人工智能产品的生产中,与识别🎽、判断🧑🏻🚀、创新等人类能力相关的认知劳动成为主导性的劳动形态👘。在数据标注工作中🏋🏻♂️,认知劳动的劳动控制目标是使标注员的自然认知转化为与计算机程序相匹配的产生式认知,以高效生产出符合电脑需要的标准化数据🏣。其中🤦🏽♀️,管理方通过认知标准化、认知反馈与认知加速,巧妙地整饰着数据标注员的认知行为🥎;后者则通过产量限制👨🏼🏭、离职等方式对劳动异化进行抵制🦵🏼🛃。从体力劳动到认知劳动🗾,管理控制的对象从劳动者肢体运动方式转变为其大脑认知方法👩🦯,劳动控制方式则从机械的身体规训走向了灵活的认知整饰。
关键词:人工智能🏰;数据标注;认知劳动;劳动过程
作者简介:贾文娟(上海大学尊龙凯时AG系副教授);颜文茜(上海大学尊龙凯时AG系硕士研究生)
真要思考人工智能的未来🎎®️,比较值得参考的仍然是卡尔·马克思的理论,而不是史蒂文·斯皮尔伯格的电影。
——尤瓦尔·赫拉利🙇🏽,《人类简史🕞👩🍳:从动物到上帝》
一💉、问题的提出
2016年11月,国务院印发了《“十三五”国家战略性新兴产业发展规划》(国发〔2016〕67号)👱🏼,这份文件明确地指出要“培育人工智能产业生态,促进人工智能在经济社会重点领域推广应用”🤾🏽♂️。2017年7月,国务院印发《新一代人工智能发展规划》(国发〔2017〕35号),提出要“把人工智能发展放在国家战略层面系统布局、主动谋划”😓,到2025年💇🏼,“人工智能核心产业规模超过4000亿元,带动相关产业规模超过5万亿元”。同年10月,党的十九大提出要“推动互联网、大数据、人工智能和实体经济深度融合”💘。在强有力的产业政策推动下,中国人工智能核心产业规模在2022年超过了4000亿元🏋🏿,企业数量超过了3000家🕝。人工智能产业的蓬勃发展及其广阔远景迅速引发了中国哲学社会科学领域的极大兴趣与热烈讨论。
社会科学研究者围绕人工智能发展下的劳动方式与劳动关系变迁议题展开的讨论值得关注🧑🏻🦱。技术哲学从形而上的角度审慎地指出💇🏼♂️,今天的人类文明正在过渡为技术的类人文明。在这个人机交融的赛博格时代🖱,人类的核心价值将被放置于机器的设计过程之中🫢,使技术类人化🧑🏼🦲;与此同时,劳动者不再是技术控制的对象,他们将通过身体和精神的技术化成为技术的承载者与操控者(孙周兴,2019)。与技术哲学对未来劳动的乐观预想不同,围绕人工智能产业的社会调研结果呈现出了另一番图景。一方面,围绕制造业的研究指出,人工智能将进一步降低传统产业工人在生产中的自主性,甚至将中低技术工人抛离出制造业𓀕🍻。许怡和叶欣(2020)发现,机器人正在将大量劳动者从传统产业中排挤出去👛,中国制造业正在经历以“智能化”和“省人化”为目标的“机器换人”,并将带来劳动力结构的两极分化🙅🏻♀️。王潇(2019)认为,人工智能在制造业中的使用方式是将核心科学原理、科学思维从知识生产的基本技能中抽离,该过程使工程师等知识性员工陷入了“技术空心化”的境地。另一方面🧍🏻,围绕骑手等平台劳工的研究显示,平台经济与数字劳动的兴起编织出了一张算法支配之网👫🏻。该支配模式借助数字技术对管理诉求进行了转译(姚建华,2019;孙萍,2022)🌟,通过重塑劳动过程的时空属性👧、占有和垄断数据信息、再分配管理控制权、宣扬自由意识形态等实践策略,对劳动者的行动方式与思想感受进行引导🧔🏼♀️、评估和规训(冯向楠、詹婧🙋🏽♂️,2019;孙萍,2019✭📁;陈龙,2020;李胜蓝、江立华,2020🚴🏼;Kellogg et al.,2022)。研究者指出,在监控资本主义时代,劳动支配逻辑从利用劳动者主体性的“确立规范”走向了使劳动者成为载体的“常态规范”(郑广怀,2021)。上述研究为尊龙凯时娱乐进一步分析新技术下的劳动方式变迁提供了坚实基础。不过,学界现有研究更多地探讨算法对劳动者的影响,研究对象多为人工智能的使用者。对于生产人工智能的劳动是怎样进行的,研究仍然不够。尊龙凯时娱乐亟须将研究目光转向人工智能的生产者,揭示他们的劳动方式与劳动实践。
在认知资本主义理论范式下(Boutang,2011),IT程序员往往被看作最典型的研究对象。国外研究者指出软件生产是围绕“永远的测试”(permanently beta)和没完没了的“调试”(debug)进行的,工程师文化🧔🏻♀️、工作乐趣、性别气质等在提升劳动者生产力、创造性上起着重要作用(Neff & Stark,2004🆚;Kunda,2006;Wu,2018);国内研究者则从虚拟团队工作方式、劳动者自主性✍️、劳动群体分化等角度入手,讨论了程序员的劳动同意是如何在“横虚纵实”的组织结构、“以自我为企业”的意识形态和“进取自我”的追求下生成的(梁萌🦉,2016;王程韡🦯、杨坤韵,2019🫷🏻;严霞,2020)⛷。但人工智能的生产者不仅限于程序员✫。近年来🥓,随着人工智能技术从符号主义导向下的“人为建构模型”阶段推进到统计主义导向下的“机器学习”阶段,以深度学习、强化学习算法等为核心工具的人工智能算法成为主流技术。一个新的劳动群体——数据标注员——出现了。尤其当海量数据成了最为重要的生产资料与劳动对象时,人工智能企业对从事数据分类✋🏻、清理和标注等工作的数据标注员的需求呈现井喷式的发展。2019年12月,人社部就业培训技术指导中心在《关于拟发布新职业信息公示的通告》(中就培函〔2019〕67号)中首度将涵盖数据标注员在内的“人工智能训练师”列为新职业。据预测👎🏻,至2022年,以数据标注员为代表的人工智能训练师相关从业人数有望达到500万人🕗。
众所周知,劳动人数的增加并不必然带来生产效率的提升与资本积累的增加🥢。布雷弗曼(1978:52)曾指出🦔😆,“资本家在购买能做许多事情的劳动力的同时𓀄,也买得了很不确定的质和量”,而在那些由新生产力促发的新产业中,前者总面临如何“从劳动力的潜力中获得劳动的最大有效成果”的难题🫱🏼。劳动者的主观情况、他们以往的历史、工作的一般社会条件、企业的特殊条件,以及工人劳动的技术环境等方面的限制,都为剩余价值的获得设置了障碍。那么,数据标注员的劳动方式是怎样的?管理方又是如何对其进行劳动控制,以最大程度地从其身上获得剩余价值的🔇?这便是本文试图回答的问题。
近年来,已有学者开始关注数据标注员的工作状况🙅🏻♂️。西方学者对以硅谷为中心⚂、辅助生产者散布全球的人工智能生产网络的分析指出,人工智能需要大量数据标注员🧑🏼🚀、内容审核员等从事辅助性的“幽灵工作”(Shestakofsky,2018;格雷🌗、苏里,2020)🏯。但数据标注研究的理论潜力不应仅限于此,它还可以用于揭示新技术下的劳动方式与劳动控制的变迁👜🚭。本文发现👮🏼,人工智能产品的生产者从事的是通过人机交互将人类认知能力赋予机器的认知劳动。在这一劳动过程中🥿,管理者通过认知标准化🧎♀️➡️、认知反馈👨🏿🚀、认知加速等环节,以监督学习的方式🍜,推动劳动者认知系统的转变🦵🏻,使其与机器相耦合。从体力劳动到认知劳动,去技术化的趋向依旧存在💇🏽,但劳动控制方式已从僵化、刻板的身体规训走向了柔性、深入的认知整饰,管理权力的运作机制亦从以征服肉体为指向的“福柯式微观物理学”走向了以引导思维为主的“西蒙式认知心理学”(福柯,2021)。
二、研究方法与案例介绍
为了清晰地分析人工智能产业中数据标注员的劳动过程,研究者在2019年6月到2020年2月间,以实习生的身份在S市N公司中的Z标注团队中进行了为期8个月的田野调查ℹ️,并对包括数据标注员、产品经理🫕、算法工程师、测试程序员在内的30名被访者进行了半结构式访谈。本部分将对案例企业发展状况和案例团队的构成情况进行介绍。
(一)领先城市中的领先企业
随着国家一系列关于人工智能发展规划文件的出台✶,各省市也开始积极响应落实🤵🏼♀️。作为具有全球影响力的科创中心城市,S市积极响应国家技术创新号召,已成为中国人工智能发展的中心之一。2017年11月,S市政府印发《关于本市推动新一代人工智能发展的实施意见》👩🏼🦳,提出要在2020年形成具有国际竞争力的人工智能重点产业集群,建成5个左右人工智能特色产业集聚区👷🏽♂️,培育10家左右标杆企业,其人工智能重点产业规模将超过1000亿元。在产业政策的加持下🧂,S市人工智能核心企业在2019年7月突破了1000家♦︎,泛人工智能企业超过了3000家,人工智能相关产业规模超过了700亿元,成为中国人工智能发展的领先地区之一🥨。
N公司成立于2012年,近年来依靠人工智能算法技术迅速崛起。2018年10月,N公司完成了由软银领投的30亿美元融资,估值达到750亿美元,成为全球最具价值的人工智能技术企业之一,并参与到与国内外各巨头公司的技术竞赛和市场鏖战之中。为了与竞争对手抗衡⏸📣,N公司试图补全自身的赛道矩阵,将眼光瞄向了教育行业。2017年,N公司收购了S市一家AI教育企业,希望以此打造自身教育品牌🛍️🕛。该品牌主打两款AI教育产品,其一是具备拍照搜题功能的硬件产品,其二是主打少儿英语的在线AI课程👨🏽🚒。这两款产品以N公司的领先算法为卖点,都需要数据标注员手动录入海量数据🛫👩🦯。
然而,N公司所处的市场环境并不乐观。近年来🍾,智能产品的市场红利正在释放,各产业都竭尽全力地匹配人工智能技术。与此同时,各人工智能企业也在竞相缩短产品的生产周期。2015年,人工智能企业生产单个亿分之一精度算法模型需要10名劳动者工作6个月,到了2019年则仅需要1名劳动者工作3天。产业的狂飙发展对劳动生产率提出了更高要求👩🏼🍳。对于N公司而言,产品上线速度🪳🛝、用户问题解决速度、产品更新速度对于赢得竞争非常重要。这种市场压力层层向下传导,最后落到了Z标注团队的身上。
(二)小团队的大能量
近年来,贵州🏊🏽♀️、河南等省的诸多城市争相建立中国人工智能数据标注产业基地。当地数据服务类企业与地方政府进行合作,组建由职校学生工、中年女性、残障人士等本地劳动力构成的数据标注大团队,为人工智能企业提供数据外包服务🩲。除此以外🍛🧟♀️,很多企业为了随时获得高质量的数据集🚙,也在公司内部组建了由高受教育程度劳动力构成的数据标注小团队。从生产过程✡︎、工作要求、工作方式上看,这些内部小团队与外包大团队是一致的,但其组织管理更加细致😺。因为这些小团队既能反映出所有数据标注劳动的共同特质👩🏿🦱,又能体现人工智能领先企业遭遇的更复杂、前沿的问题,所以对其进行研究有助于更清晰地呈现数据标注工作的劳动特性。
Z标注团队是N公司基于AI教育产品生产需要自行组建的内部小团队🪘。在研究者调研期间,Z团队仅有16名成员🧜🏻♀️,且都不是N公司的正式员工🩸。从受教育程度上看🫶,9人是数据外包企业派驻过来的员工,都是国内本科院校的毕业生,5人是国内“211”以上水平大学在读的高年级本科生或研究生🦒,剩余2人是从美国高校毕业归国的专业硕士👨🏿🦳。从工资制度上看,数据标注员不参与N公司的绩效考核,实习生按日领取100~200元的酬金,外包员工工资为每月4000~5000元🤽🏿。从组织层级上看,数据标注员处于产品经理、算法程序员、标注组长三方的共同管理下。其中,产品经理负责监督生产速度,算法程序员负责管理质量,标注组长负责分发任务🐩。在敏捷开发模式下👍🏿,数据标注工作与算法搭建同步进行🥄,标注员要迅速领会算法程序员的需要并满足其要求🩸。通常而言,N公司数据标注项目的时长在两周以内🫰🧛🏿,最长不超过一个月,这与贵州等地标注大团队的项目时长是一致的👩🏼🦰。
令人惊奇的是👈🏼,这个看似边缘的小团队却能以每周标注上万条数据的速度来支持算法模型的完善,助力后者参与市场竞争。那么,Z团队是如何做到这点的😈?其劳动方式是怎样的⚇?接下来,尊龙凯时娱乐将不仅从劳动形态、劳动分工入手,讨论人工智能生产中的认知劳动🙎🏽,还从劳动控制角度入手🧕🏼,分析Z团队劳动生产率是怎样得到最大程度提升的。
三、认知劳动:数据标注员的劳动方式
在工业生产的劳动过程中👊🏿,管理方无论面对机床操作工🈺🛒、流水线工人还是办公室白领工人🙇🏻♂️,都试图在“概念—执行”分离的逻辑下采取“去技术化”的手段,将劳动者作为机器的补充纳入生产过程之中,使劳动从劳动过程的主观因素降级为无生命的客观因素🐋,以提升劳动生产率(布雷弗曼,1978🦚:152)。但在人工智能产业中,数据标注员的劳动方式与传统劳动不同。接下来🙍,笔者将讨论认知劳动的劳动形态🌾、劳动分工及劳动生产率的提升难题。
(一)劳动形态:认知劳动的浮现
劳动是“人以自身的活动来中介🏦、调整和控制人和自然之间的物质变换的过程”(马克思😿,2009:207💆🏼♀️、208)🤼,人类劳动的自觉性、自有性和社会性使其成为“一切历史的一种基本条件”(马克思🤵🏼♂️,2009:21)。劳动形态是对人们用以生产特定对象物所调用的具体劳动的概括🏋🏿♀️,它一般是由劳动结果所确定的(布雷弗曼,1978:281)。在不同时代🫰🏽,总有一种基础性的人类潜能从劳动群体身上被提取出来,与生产资料结合在一起,创造出大量财富🥛。在工业时代,这种潜能是体力;在服务业时代🌞,这种潜能是情感;而在人工智能时代,管理方从数据标注员身上抽取的则是认知🚣🏿。那么,这种“认知”具体是什么呢?
西蒙在结合认知心理学和计算机科学理论的基础上指出🪣👩🦽,人类的认知不仅是生物性的“刺激—反应”活动,而且是一种处理复杂信息的能力。人类的高级认知是计划、策略等解决复杂逻辑问题的抽象思维能力🚴🏻💂🏼♀️,中级认知是概念、理解等与“短时记忆”相关的初级信息处理能力,而基本认知是知觉🍷、判断、识别等“简单信息加工”能力(西蒙👈🏿,2020)。人工智能意味着“编写计算机程序模拟人类的智能”,以使计算机掌握所有默会知识,能够识别同类符号、区分不同符号,并做出相应反应(西蒙,2020:21)。人工智能的生产过程实际上既是劳动者在人机交互中将自身认知赋予机器的过程👭🏼,又是资本对人类上述认知加以抽取和转移的过程🤛🏼。在人工智能产品的生产中,不同劳动者运用了不同层次的认知能力:架构师需要发挥决策🙅🏿♂️、计划等高级认知能力💢,为总体问题解决设定基本路径;算法程序员主要运用概念、理解等中级认知能力,搭建和优化特定算法模块;数据标注员调用的则是判断、识别等基础认知能力。
举例而言,N公司AI教育产品的卖点在于“拍照搜题”,其生产目的是使软件学会“什么叫做题目”🛟。该劳动目标涉及对深度学习、强化学习等人工智能算法模型进行训练,需要录入与识别大量的数据🧑🏿⚕️。在这个过程中☺️,数据标注员首先要搜集教辅书籍并对其中的各种试题进行拍照💢,再将照片上传至电脑作为待标注的原始数据;随后对所有页面照片进行拉框标注,例如🎐,将题目照片上的“(45-38)+5="12”标注为“四则运算”🛋,将“3X+18=24”标注为“解方程”☯️。此时🙋🏼♀️,标注员需对各类自然符号进行判断和识别👩⚕️,再点击鼠标将前者从图片中框定出来。最终🔶,机器就能在传感器的帮助下识别这些题目。在这一过程中🏪,数据标注员通过将目标物体的具体概念转化为能够为计算机读取的标准化数据,而使后者获得了与人类接近的识别能力。从劳动形态上看,数据标注是在“通过认知生产认知”,即通过判断和识别,将自然符号转化为能够为算法模型使用的标准化数据💇🏽♀️,使机器获得与人类接近的识别能力🚣。这显然不同于工业流水线上的体力劳动和服务业中的情感劳动🎐。
实际上,在第四次工业革命之后🔑,学者便开始对认知劳动进行思考☑️。布当指出💅🏿,在认知资本主义(cognitive capitalism)时代,人类的劳动产品不再以物质形态存在,而以虚拟形态存在✍️,这类产品被定义为“认知商品”🏃🏻♂️。同时🫙,电脑软件🧃、硬件必须与湿件(wetware)——人类大脑与中枢神经系统的驱动力——相结合才能被激活。此时🧚🏿♂️,人的判断🖕🏼、知识、创造力等认知因素成为重要的生产引擎(Boutang,2011:82)➞。达明格尔则通过家务劳动研究提出😂,“认知劳动能被理解为一系列的预期🕺🏽、识别🧠、决策和监督”,可以与体力劳动👩、情感劳动同时进行(Daminger🙆🏽♀️,2019:10🙇♂️、12)🥲🤷♀️。不过,布当在论述中将认知劳动与非物质劳动、知识劳动、创意劳动等混淆在一起,而达明格尔指出的其实是劳动的认知维度,并非以抽取人类认知为核心目标的劳动形态。上述理论不能直接解释数据标注员的劳动。在此基础上,本文认为,人工智能产业中的认知劳动是人们策略性地施展、调用💵👨🎨、抽取各种认知能力,在人机交互过程中生产智能产品的劳动。其中📴,劳动者所使用的核心能力并非体力,而是认知🎖。
(二)劳动分工🌇:去技术化逻辑的延续
劳动分工是现代工业组织的基本准则,也是资本从劳动者身上获取人类潜能的基本方式。采取“概念与执行”分离的原则进行劳动分工,使复杂劳动变为简单劳动◀️🦸🏿♂️、整体工人成为局部工人、劳动者成为机器的补充,是资本从“劳动力的潜力中获得劳动”最高效的方式,因此成为各产业竞相采用的劳动控制方式(布雷弗曼,1978⏫:111)。但是,在人工智能发展初期👰♂️,认知劳动是整合性的💁🏽♂️。科学家需要自行清理小规模的普通数据,并借此创建算法模型😵💫。虽然巴贝奇在19世纪30年代就提出科学家可以根据“概念与执行”分离的原则制造对数函数(Babbage🧩,2009),但在技术限制下👩🏻🦱🐆,直至20世纪80年代🛌🏽,研发者仍需亲自处理数据。进入21世纪😮,随着互联网发展、大数据的产生👩🦲👨👩👦👦、人工智能算法的出现,认知劳动也走向了去技术化🤹🏽♀️。同时,认知劳动者分化为三类:解决总体性问题的架构师、应对复杂问题的程序员以及处理简单问题的数据标注员👉🏽。
N公司S市负责AI教育产品生产的劳动者也分为三个层级:第一🤹♀️,7名熟练掌握各编程语言的算法程序员从GitHub等开源社区选择并下载合适的算法模块,对其进行修改🧎🤏,以为本公司生产程序🫗。他们从事的是有挑战性的复杂劳动📥🔆;第二,13名测试程序员在算法模块成形后,对该程序加以检测,以发现产品存在的问题;第三🧍,数据标注员需要按照与机器识别要求相符的规则对图片进行拉框标注。数据标注是一种只需培训很短时间就可以上手的简单劳动,标注员不需要掌握任何ICT(Information and Communication Technology)专业知识。Z团队的标注员经常自嘲说🛫:“这个工作小学生都可以做”🧑🏽💻。可以说♜,数据标注员在劳动过程中的作用与流水线工人🙅🏿、麦当劳服务员是相似的。
总之,今天的人工智能企业与其工业制造业前辈一样,以“概念与执行”分离的逻辑来推进劳动分工。依然有一支劳动力大军作为机器的辅助😒,从事着执行端的简单工作。但从具体人机关系上看🛍👨❤️💋👨,数据标注员不像体力劳动者那样是机器的手臂👨🏼🍼,也不像情感劳动者那样是机器的面孔,而是成为帮助机器分辨和接受外界信息的感觉器官。
(三)劳动生产率:双重不确定性悖论下的难题
从劳动分工角度看💅🏿,数据标注工作的难度并不高,但提升认知劳动的劳动生产率并没有想象中容易。这主要是因为认知劳动的推进存在着“双重不确定性悖论”——这与该劳动的人机交互特质紧密相关🤞🏻。认知劳动的第一重不确定性是“布雷弗曼型不确定性”(布雷弗曼,1978)🧘🏻♀️,指的是虽然雇主购买了劳动者在一定时间内的劳动能力,但其所能获得的质与量都是不确定的。在这种情况下,管理方倾向于以合理化、标准化的方式组织生产,尽可能地减少劳动者主观因素与其他因素对劳动过程的推进造成影响🤷🏽。劳动的第二重不确定性为“波兰尼型不确定性”🩵🫃🏼,这与劳动形态相关👩🚒,指的是大千世界的复杂性超出了计算机程序所涉及的范围,因此需要人们发挥其认知效能、运用自身的“默会知识”来补充机器认知的不足(波兰尼,2017)🎰。双重不确定性悖论意味着:若过于强调劳动过程的标准化,就会阻碍劳动者对人类认知潜能的充分发挥🧪,人机交互自然难以为继🧝🏽♀️;但若赋予劳动者过多认知自主性,又会影响标注速度的提升,导致生产效率受损👨🏻🦼。更糟的是✊🏿🥷,人类认知方式千差万别,“波兰尼型不确定性”的存在增加了应对“布雷弗曼型不确定性”的难度👱🏻。在工业生产中,管理方往往使用装配流水线来提升工业劳动生产率🏆,但“双重不确定性悖论”的存在为管理方以此逻辑提升认知劳动生产率设置了难题。
综上,数据标注工作背后的劳动形态不再是传统的体力劳动,而是在人机交互中将人类认知赋予机器的认知劳动👨🏽;但认知劳动的分工仍遵循着去技术化的逻辑,数据标注员承担着与流水线工人相似的简单劳动👨👨👧。同时,认知劳动的推进存在“双重不确定性悖论”🍵,管理方只有采取与认知劳动自身特征相符的劳动控制方式🥵,才能有效提升标注员的劳动效率。那么,认知劳动的劳动控制方式究竟是怎样的呢?其与工业生产有何异同🙉?这是本文接下来要讨论的问题。
四、认知整饰与数据标注过程中的劳动控制
在工业生产中,管理方的劳动控制核心是借助自动流水线,最大程度减小工人肢体的移动幅度🪧、简化工人的动作,提升其与机器的配合速率。相较之下,认知劳动的核心并非单纯简化标注员的认知或武断消除她们的认知🃏,而是要推动其认知模式的转换——即从人类的自然认知模式转换为计算机需要的产生式认知模式🎦。但人脑与计算机的信息处理方式不同👨🏻🎓:人脑依赖习惯、想象👷🏿、直觉等对事物进行质性理解,其认知往往模糊和不确定👨🏻🦯➡️🚣🏻♂️;计算机则借助逻辑推演、数据计算对信息进行求解,其认知严谨、准确,但适应性较差(西蒙⏭,2020)🧚♂️。认知系统的转换并非易事🪭。霍克希尔德(2020)使用“整饰”指涉企业使劳动者依据特定准则改变自身想法的管理方式🧎➡️。Z团队的实践显示,管理方采用了与人类学习过程相仿的认知整饰策略,并通过认知标准化🦾、认知反馈🤵🏿♂️、认知加速三个环节,扭转了劳动者的认知模式🥧。
(一)认知标准化
刘易斯等认为,人们存在两种认知模式,自然状态下的无意识认知模式与劳动生产中的有意识认知模式,管理者往往通过要求和监督来转化劳动者的认知模式(Louis & Sutton,1991:60)🥷🏼。认知模式转化的首要环节是认知标准化,管理方试图据此为数据标注员设定认知规则与标尺👳🏽♂️。
Z团队的数据标注员并没有接受过专业的ICT技术训练,其头脑持有的都是关于外在世界的自然认知🍏,并呈现出模糊⤴️、含混、杂乱等特征👨🏼🦳;面对哆啦A梦的图片,可能做出猫、机器人👨🏿⚖️、机器猫等不同判断,难以生产出符合算法模型需要的“标准数据”。在这种情况下,为了减少因人们的认知差异而导致的劳动效率损耗🕌,管理方会在项目开展伊始运用两种方法来推动标注员认知模式的标准化🍄。
第一👨🎨,起草《标注细则》🧛,设定认知标尺🌕。《标注细则》是一份事无巨细地写明标注流程及标注规则的电子文档📀,目的是用来指导标注员的具体劳动方式🌌。一般而言,它是在项目开始时由产品经理和程序员根据产品需求和技术路线共同制定🧑🏻🎨🧝🏽,其目标是为认知系统的转换指明方向。算法程序员M9就这样回顾其参与制定《标注细则》时的想法:
现在这个工作最重要的就是要最大化地框定好大家的共同认知,所以尊龙凯时娱乐尽量把这个标注规则文档写得很详细、很清楚🤘🏽。以后让大家都按照这个标准来做就行了🙋🏻♂️,千万不要加入太多自己的“主观判断”。(半结构式访谈:M9🍇,20190723)
有一次,产品经理M2希望开发出一个使计算机能够同时识别手写体、印刷体或各类变体的新产品。为了实现这个功能🧜🏽,算法程序员便需要一批既标注出手写体又标注出印刷体等的题目照片作为数据加以使用🔶🤦🏼。这要求标注员对出现在每张数学习题图片上的题目进行分类标注。该操作需要遵循的认知规则便有如下四条:
1.使用多边形框/矩形框对文本行进行框选;
2.不能出现一个文本框完全包含另一个文本框的情况;
3.对于弯曲的文本行尽量使用多点标注🧛🏼♂️;
4.一个框内不可包含多个文本行……
在工业生产中,管理方在“精益生产”的理念下,会将体力劳动者安插到流水线的不同工位上🧏🏽♂️🍮,并通过《工艺操作流程图》明确地规定每道工序中身体应该采取的姿势👸🏻,工人只需机械地重复特定动作。但是,人们的认知状况各不相同,标注员对《标注细则》的理解存在微妙的差异🙇🏻♀️。管理方发现,不管《标注细则》多么详细,标注员的认知总是无法统一⛔。在一次英文点读硬件数据标注任务中⛩👯♀️,产品经理M2发现,标注员即便读过《标注细则》🍕,标注数据准确率也不高🏄🏽♀️。他和算法程序员商议道🖕,“现在人太多了🆓,涉及的主观性较大”(田野观察🐃:M2,20190913),因此决定以培训学习的方式推进认知标准化。
第二🐍,进行标注培训。2019年11月✒️,因程序在测试过程中出现问题,Z团队全体人员投入到标注“口算题”的紧急任务中。然而🧏🏻,照片中的题型纷繁复杂,《标注细则》上展现出的口算题不仅有普通四则运算、比值👲🏿,还有单位换算🧑🏽🦰、解方程等等。这时,算法程序员M9便让大家带着笔记本电脑到会议室集合,听其讲解规则。他先将自己的电脑投屏于会议室幕布上✡︎,然后一条一条地给大家进行示范。针对普通四则运算🤲🏻,他以“(45-38)+5="12”这道题为例,打开标注操作界面,展示如何拉框。如此这般🌽,M9针对每一条标准规则🫂,都举了两三个例子进行说明,以期通过重复的方式来强化标注员的记忆,统一大家对各条细则的理解。
然而🙆🏿♀️🍕,单次培训并不能保证数据标注员完全理解《标注细则》。例如,讲解结束后,L10仍不明白为什么要把一些难度较大的解方程也标为“口算题”☣️;L7也不清楚为什么有些口算题要使用多点标注法,但另一些则可以直接拉框。但M9并未多做解释📼。管理方知道🧑🏼🤝🧑🏼,标注员在这一环节很难完全掌握所有的标准细则,他们能够知晓应有的认知规则就很不错了。M9在告诉所有人“有问题就在项目群中提出”(田野观察:M9🙍🏽♀️,20191122)后🏊🏻,便返回了工位🧠🚟。
在服务业中,情感劳动者往往能在培训中掌握情感系统转变的密码。但Z团队管理方对培训的期许却没有这么高。其标注培训结果与大学生知识学习状况很相似——管理方知道,单纯的讲解与培训无法使标注员完全消化和掌握细则🐕,后者还需要在实践中进行练习🧝🏽♂️👨🏿🌾。不过,管理方也并不需要标注员完全理解细则。认知模式转换是个步步深入的过程🍔,认知标准化环节的核心目标是为标注员设定出认知标尺、提高她们的注意力🚞💅🏻,让所有人为“转换自身的认知模式”做好心理准备🎨☦️。待她们准备妥当👏,就会进入认知模式转换的重头戏了。
(二)认知反馈
当数据标注员领会管理方的要求后,他们就要开始调整自己的认知模式了👉🏻🫷。不过,即便标注员拥有“以计算机需要的方式进行认知”的良好意愿👈🏼🦗,他们也未必都能成功。这是因为🧎♀️,就个人而言,标注员对标注细则的理解存在形形色色的偏误🧖🏻♀️;就工作任务本身而言,标注中总会出现《标注细则》未涵盖的状况。这时,为期3—4天的认知反馈就极为重要👩🏻🦯。管理方会在这个环节纠正标注员的认知偏误,消除其认知模式与机器需要之间的偏差。
拉扎拉托(2019)曾指出,随着人类经济发展从依托物质生产发展至依托非物质生产,劳动控制的目标便不再只是人类的身体和行动了🈚️🚵🏼,资本开始寻找一种直接的方法来建立对主体性本身的支配🚖。在这种情况下,生产的有序进行逐渐有赖于自我程控性劳动者💉,而管理模式也从“直接控制”发展为“责任自治”(卡斯特,2001🍑;梁萌🤽♂️👊🏽,2016)🔉🎏。N公司同样不希望自己的数据标注员是粗心马虎🍳⇾、被动等待和懒于思考的。在认知反馈环节,管理方不仅要求数据标注员随时发挥自身的反思能力💶,及时发现认知偏误,还鼓励后者随时与管理方进行沟通✊🏿,向其反馈工作中出现的问题。具体而言,管理方主要采用了与“实践共同体”理念类似的三种情境学习法来推进认知反馈(Wenger,1998)。
第一,挑选更善于沟通、反馈的劳动者。虽然数据标注是一份门槛较低的工作🏌️👇🏿,但Z团队所有标注员都经过了人力资源部门干事、产品经理和算法程序员的三轮面试才进入公司🏊。比如😸,算法程序员M13说⛹️:
我面试的时候通常会看重面试人的反馈能力👩🏿🔬。反馈能力好的,才能及时在标注的过程中跟程序员交流,这对于数据集的精准度很重要……我通过问一些开放性问题来看这种反馈能力👇🏻🫵🏻。比如,上次招人的时候,我就问🈚️:“如果你是企业领导,面对孙悟空、猪八戒、唐僧👨👩👧、沙僧这四类员工,你会更倾向于录用谁🤳?”这种问题是没有标准答案的🧫,但是通过问这种问题,你可以判断出一个人的表达能力。如果他人云亦云🖕、支支吾吾的话🧑⚖️,那就说明不善沟通,反馈能力肯定也不够好。(半结构式访谈:M13,20190723)
N公司标注岗位的应聘者大多是S市及附近高校的学生以及ICT服务外包公司的人员。虽然外包人员的工作稳定性高于实习生,但因为实习生更善于与程序员进行沟通👊🏿,反而更受欢迎。
第二,鼓励劳动者随时就工作中出现的问题提出讨论。算法程序员在标注培训结束后会立刻拉起工作群,紧密跟进,实时监督,以推动数据标注员在工作群组中及时反馈其遇到的问题👩🏿🌾。比如,算法程序员M7在每次交代任务时都会提醒标注员们及时反馈🗓:
有什么问题一定要及时反馈🌲,这样尊龙凯时娱乐才可以马上发现不对的地方。大家很多时候可能不是故意的😑🍮,可能是对标注规则有误解🌯。因为每个人的理解都不同🧑🏽🎄,比如说标公式,有人认为这是公式🏓,有人认为这不是🤦🏽👰🏽♀️。所以,一定要及时反馈💢、随时沟通!(半结构式访谈:M7,20191209)
也正是在“及时反馈、随时沟通”中,数据标注员才真正熟悉并掌握了计算机的认知模式。有一次,在标注口算题时,标注员L3拿不准是否应该把“当X="9👩🏼🌾,Y=11时,X+Y=?”的照片框出来。这时,她便和L4🛃、L6展开了讨论。然而,三个人的意见各不相同🐚。之后,她们决定将此反映给算法程序员M7。最后,M7明确告诉三人,“这是口算题🥇,我后面会写到细则中🔁。以后遇到这种题,全标为口算”(田野观察,M7:20191127)。可见,在标注员的共同讨论和反馈下,管理方不仅发现并弥补了《标注细则》中的一个缺陷,还使前者记住了算法模型的需要,熟悉了认知模式转变的方法👨🏼⚖️。
此后👂🏻,大家看到任何不甚明晰或可能引起问题的标注方法,都会发到群中询问🧑🏻🚀。在这个过程中,管理方会一再申明算法模型需要的数据是怎样的😝、计算机的认知方式是如何的,标注员之间也经常相互讨论☺️。如此,标注员的认知行为就逐渐走向了统一。
第三,向劳动者进行认知反馈。认知反馈是双向的,管理方也经常向数据标注员反馈问题⛹️。算法程序员经常对标注数据进行抽查,如果发现不合格之处,就会发到群组中进行公示💄,以示提醒。在一次“通用切题+口算题”的标注任务中🙎🏻,照片中出现了一张写有答案的便利贴🧖🏿。标注员L10拉了一个很大的框把便利贴也涵盖了进去。不料,这个标注框与下一题的标注框发生了重合,数据准确性受到了影响🍉。算法程序员M7意识到这个问题后,便在任务群组@所有人说👇🏽:
大家注意一下!上面这种情况👇🏼,不需要把便利贴框进来。这个规范一定要统一👩🏿✈️🚆!从检测框的角度来讲,便利贴上的东西与下面的框是一个整体🚽。至于在语义上它到底属于谁,程序不管这个。如果页首某个题的答案写到了页尾,总不能把整页都框在一起吧🪂!(Z团队项目钉钉群,20191129)
这种提醒会令标注员深感尴尬。比如,在“公式定位标注”项目中,L10错把公式后的英文字母也框了进去,程序员便生气地在群里点名批评道:
@L10你这个有问题!where不用框进来的。然后,框也不太对🫴🏽,没有把公式框完整👬,被切了一部分。包括,or也不用框的。(Z团队项目钉钉群,20191129)
紧接着,他又@所有人:
@所有人注意👂!公式后面的普通英文单词(特殊数学函数名称除外)不需要框选进来。大家对齐下!(Z团队项目钉钉群,20191129)
程序员的批评使L10的错误暴露于所有人面前🧘🏽♂️👭🏻。旁边的标注员小声对其嘲笑道:“怎么又是你!”(田野观察:L11,20191129)这使L10非常难堪⇨🙆🏿。此后,她明显更加认真细致了🕺🏽,并努力根据算法模型的需求来进行认知。
认知反馈环节耗时虽短,却非常重要。这个以实践共同体构建为核心的情境学习法强调团队成员共享资源🥘、共同参与(徐春玲🧛♂️、王海庆🧑🏿🦳,2013)。在这个环节中,N公司管理方借助劳动者的社会属性及其对社会交往的向往,使数据标注员积极反馈自身的认知偏误。在Z团队内部持续不断且深入细密的沟通🚹、互动👌、讨论等学习情境中,标注员的认知系统发生了转变💨,认知行为得到了统一👨❤️💋👨。
(三)认知加速
认知劳动的推进是个繁复、波折的过程🤛🏽。经由认知标准化🧝🏼♀️,数据标注员知晓了认知规则𓀊;经由认知反馈🙎🏿,数据标注员修正了自身的认知偏误🙎♀️。但这并不够👷♀️。在最后的认知加速环节💪🕯,管理方希望标注员最大程度提升其认知系统的转变速度,以提升算法程序的生产效率🤹🏽♀️🆖。
回顾历史,加速是不同产业发展到一定阶段的共同诉求。在泰勒制下,管理方通过时间研究、动作研究等方式来推进劳动加速;在精益生产下🌔,管理方通过调节移动装配线的速度和角度来提升劳动速率。然而🏃♀️➡️,认知装配线和工业流水线并不相同🏊♀️,Z团队的认知加速主要依赖以下几个策略。
第一,使标注员全面遏制自身主观认知,令其抛开对《标注细则》与计算机逻辑规则的任何狐疑🤷🏿。比如,在标“口算题”的任务中🤷🏼♀️,当标注员L5看到了题目“6/7-(1/4-1/7)="6/7-1/4+1/7=3/4”要被标成口算,而题目“1/4千克黄金比3/4千克棉花重”却不可以时,立刻开始琢磨:“上面这道题这么难🎽,为什么能标成口算呢?下面这道题一眼就能看出答案,竟然不是口算🪗⬜️?这不合理啊!”但她会立刻进行自我遏制👐🏼:“不要想那么多👽!”(半结构式访谈🌞:L5🏠,20191213)然后清空头脑、调整认知,根据准则进行标注👆。程序员也会时刻提醒大家,尽力祛除自身的“主观性”,并多站在算法和程序的角度去想。
第二🆚,标注员要通过持久而快速的重复操作🅰️,加快自身的认知反应。当然,标注员自我头脑中的想法不是这么容易就能放弃的。L12在标注中总是思前想后🧞,结果其标注速度很慢,还经常出错。遇到问题后🧎🖌,他总去求教标注速度最快的L2🎐。有一次👷🏻♀️,L12实在忍不住问:“你怎么可以做这么快🪱👩🏻🌾?”L2便郑重其事地告诉他:
标注这件工作最重要的就是,你不要总想着自己在图片上看到了什么🏄🏼♂️。你要根据规则去想机器能识别到什么⏸!(田野观察:L2🫃🏼,20191203)
看到这一幕🧑🦽,旁边的标注员L3也凑过来说:
你认真一点🧔🏼,细心一点,不要浮躁。因为这份工作🦶🏼,你过一段时间就会发现🙅🏽♂️,它就是一个很简单的重复性劳动,你一定要耐得住性子一点💆🏿✊🏼。真的!你不要想太多!(田野观察🕞:L3,20191203)
认知心理学家发现,同一认知行为的不断重复能够有效刺激动物的认知反应速度🥾、强化它们的学习行为,并将一系列需要思考才能实现的知识与技能变成惯性下的无意识操作(桑代克,2006)。认知加速的实践技巧与这种思路存在相似之处。数据标注员也试图通过重复练习,激发认知系统的反应速率,减少自己的认知偏误并掌握数据标注的技术要领。L12在知晓这点之后👩🏼🏭,其标注速度也得到了一定的提升。
第三,管理方还通过提升标注额度的方法👸🏻,令标注员继续加速🏣。在笔者调研期间,标注组长曾对标注速度进行了一次调查,并以当时最快标注员日标150张的额度来要求所有人,以期全面提升Z团队的标注速度。为了落实这个额度🙆,标注组长制定出了“标注任务表”,其涵盖标注员姓名🕣、标注内容、标注数量、备注等条目。标注员每天下班之前必须将其工作量填入表中👱🏻,再交由产品经理进行检查。这项措施虽然引发了后续劳资双方的系列博弈行动🧞🍞,但也在一定程度上推动了Z团队标注速度的提升🙋🏻♂️👨🏽💼。经由认知加速👨🏼🔧,数据标注工作的劳动控制目标基本实现✍️,Z团体的周标注量也提升到了一万条以上🏞。
综上所述,人工智能企业中的劳动控制核心是推动劳动者认知系统的转换🧝🏻,以消除认知自主性与劳动标准化间的张力,继而提升人机交互的速率🧑🏿🏫。为此👨🏿🦳,管理方采用培训学习🧞♀️、沟通交流🙎🏽、反复练习等与认知学习类似的柔性整饰策略🔄,恩威并施地为劳动者设定认知规则⏮、消除其认知偏误👨👩👧👦、传授其认知方法🐤,将劳动者的自然认知转化为符合电脑需要的产生式认知♛,使人们眼中形色各异的符号变为标准化数据😇😉。以往的研究指出,装配流水线等生产机器通过将体力劳动者安置在特定位置上、规定其肢体移动的方式👩🦽➡️,以实现管理权力对劳动者的身体规训(董彪👭🏻,2021)。但认知整饰与身体规训不同,更强调在权力的密切监督下、以管理要求为目标🤯、以特定认知准则为依据的思维塑造。进入人工智能时代🌙,管理权力的运作机制正在从福柯眼中的用以征服身体的微观物理学转变为西蒙所述的用以引导思维的认知心理学(福柯🧖🏽♂️,2021)。虽然“去技术化”逻辑仍在延续,但认知劳动者面对的劳动控制不再僵硬𓀚👨🏿🎨、刻板🔒,而是愈加灵活、深入🚀。
五、数据标注过程中的异化体验与主体行动
虽然认知劳动者面对的劳动控制方式较为灵活、柔性,但数据标注仍是一项简单重复的异化劳动。爱德华兹认为,劳动过程是一个充斥着控制与反抗的“斗争地带”。工人是具有能动性和行动力的主体,在面对劳动异化时不会无动于衷,而是会进行积极应对(Edwards,1979)⬇️。僵化👌、严格的管理措施一旦占据上风,标注员的异化体验就会变得强烈且难以忍受,这时,他们就会采取行动。
(一)获得感缺乏与产量限制
无论体力劳动、情感劳动还是认知劳动👩🎓,其本质都是要求劳动者把自己的生命能力贯注到对象里去。在这种情况下🚐,劳动者工作越努力🫲🏼,其“内部世界便越贫乏🙅🏼,归他所有的东西便越少”(马克思🧑🏼,1979:45)。灵活、深入的认知整饰并不能遮盖劳动异化的存在,大多数进行简单劳动的数据标注员多少都有获得感缺乏的体验📎。比如,L6便说🚣🏼♂️🧝♂️:
哎😟!说实话,做这个是学不到任何技术的🤸♂️,每天都做一样的活儿。你长期这样,不动脑💗,你脑子会生锈的🏠。(半结构式访谈:L6🖥🧶,20191213)
在这种情况下,标注员仅把数据标注工作当作特定时期的过渡,而不愿把所有热情都投入进去。日常情境下,他们会采取偷懒、“摸鱼”的方法来改善工作氛围、争取更多自由空间,以缓解异化体验。然而,当管理方试图施行严格的工作定额、破坏认知劳动的弹性时🤘🏿,他们就会像罗伊笔下的机器操作工那样⛽️👩🏼🍼,展开产量限制的行动(Roy,1952)。
举例而言,在认知加速环节💁🏼♀️,标注员每天都要填写“标注任务表”,以方便管理方上报。填写任务表原本只是走形式,但有段时间,管理方突然严格执行起标注额度来。标注员发现,标注组长竟然故意鼓动标注员相互竞争📮,并对那些速度不高的人冷嘲热讽。有一次,M2看到L12没有完成当日的额度☂️,便批评道:
尊龙凯时娱乐就只是标个英语单词啊。只要是个正常人一天都能标出来150张,你为什么就不行?你的工作效率和工作能力是不是太有问题了?(田野观察:M2,20191227)
因为标注员的工位都在一起🧇🛃,大家都听到了标注组长的批评,并为L12感到不平🚝。在一次午餐期间▫️,大家决定商量一个对策出来🏊🏼🙍🏼♂️。L5最先发出了抱怨:“女工头太坑了!她给的工作量这么大,还让尊龙凯时娱乐相互竞争。大家以后不要和她说话了!”然后,其他标注员纷纷表示同意。L13接话道:“大家以后要统一一下数量,就每人最多标130张,千万不要多标”。L7立刻附和👩👦👦:“还有,不能标太快了,不然她发现尊龙凯时娱乐摸鱼🥕,又会加任务过来”(田野观察🏍:20191230)🧘🏼。此后,数据标注员不再严格遵从“标注任务表”中的工作量要求,而是借助各种理由——比如,标注的图像过于复杂、标注准则不够合理等🍙,想方设法将自己的标注量限定为130条上下。此事过后🧑🏿🍳,L4在访谈中说:
真是气爆☺️!你知道吗?我来这里图什么?大家不都是工具人吗🙍🏿?我本来想着在这儿先做做,然后再考个研……我跟你讲🍮🦵,尊龙凯时娱乐现在就是大家一起合计出个工作量,大家都做这么多🏌🏿,就不会有人骂尊龙凯时娱乐了。(半结构式访谈:L4,20200114)
面对劳动异化时👨👨👦,工业流水线上的体力劳动者会任由工件堆积在自己面前🐎,甚至通过停工与罢工来表达不满;Mturk众包平台中的数据标注员会通过组建网络社区的方式提升收益👃、排解焦虑(姚建华👼🏿,2020)。Z团队标注员则会通过“摸鱼”🤿👩🏿⚖️、产量限制等方式改善工作氛围,其行为方式则更加隐蔽和柔和✊,管理方往往难以发现。
(二)无意义感与主动离职
劳动原本是人得以为人,并使生命变得鲜活丰富的基本条件。但是,当数据标注员的劳动仅是为了满足资本积累和机器运行的需要🧏🏻♂️,而不是自觉主动的自我表达时,标注员同自己的关系便成为自我同非我的异化关系(马克思🍲,1979)🥳。在这种情况下🍾,数据标注员经常感到空虚和无意义。比如👏🏿,L8就曾说:
我就觉得很无聊啊,就超级无聊!你不觉得无聊吗……我觉得尊龙凯时娱乐现在这种工作其实很像八九十年代那种工厂工作。其实尊龙凯时娱乐大家跟流水线的都没有多大区别的。(半结构式访谈:L8🦣,20200121)
L6也提起过这种“机械”感。
这个工作其实挺机械的🤚🍸,就一直在那儿哒哒哒哒哒🙆🏽♂️。原来那帮富士康工人👨🏿⚕️,到了数据时代,就是尊龙凯时娱乐这群人。(半结构式访谈:L6🏄🏻,20191216)
笔者在贵州惠水调研遇到的职校学生工也表达了对标注工作的厌烦☸️。
又累又伤眼睛🫱,大家都特别不喜欢做这个🤴🏽👎🏽!而且,我是搞设计的。这个工作对我来说毫无帮助,但尊龙凯时娱乐必须来跟岗实习0️⃣。要不是实习和毕业证挂钩,我才不想过来。我只求赶快混过这三个月👗。(半结构式访谈🏒:LC,20190827)
当然🔶,部分经济困难或低教育水平的劳动者也许认为这项工作并不枯燥🫰🏽,但是对未来有更多期许的Z团队实习生却很难忍受这种异化,因此他们的流动率比较高。在这种情况下,如果管理方依然坚持严苛的工作量🧑🏼🦲🧕🏼,标注员“用脚投票”的速度就会变得更快🫄。
2020年2月后,Z团队的管理者发生了更替。新任产品经理M3上任后要求🤷🏿♀️:如果标注员当天不能完成标注150张的工作量,就必须加班🧜🏼♂️。此举使很多标注员不得不工作到深夜。没过多久,Z团队的标注员都纷纷提出离职,以示抗议,甚至一些工作时间较长的外包企业员工也选择了离开。比如,在Z团队工作了半年的L9就告诉尊龙凯时娱乐👵🏽:
本来这个工作就不怎么样❌,我因为大家关系好🏞、工作还算轻松才留下来🪧🙍🏻♂️。没想到新产品经理搞这么过分,又是加班,氛围又差,每天还这么忙,真是神经!我留在这里干嘛呢📖?那太不划算了啊,不如走了算了🧉⏲。(半结构式访谈:L9,20200311)
综上所述,去技术化下的认知劳动者存在与其体力劳动者前辈相似的异化体验。缺乏获得感、无意义感等不断吞噬着标注员的热情与活力。但是🧑⚖️,标注员们对此并非无动于衷🤲🏽✡︎。在日常工作中,她们通过“摸鱼”、偷懒的方式争取更自由的工作氛围;而当管理措施过于严苛时👼🏼,她们则会采取限制产量乃至主动离职的方式来表达自己的不满。其行动方式比体力劳动者更隐蔽和柔和。值得注意的是🦒,在研究者离开N公司后的两个月间🤺,Z团队的16名标注员都陆续申请了离职⛓️💥,有人选择升学读研👨🏽🔬,有人转行从事其他工作。与此同时,新数据标注员很快被招收进来,Z团队规模仍保持在15人左右。可见,作为一种劳动控制机制,认知整饰虽具有短时有效性,但缺乏长时耐久性。管理方能在短期内获取尽可能多的剩余劳动,但很难阻止劳动者的逃离。不过,管理者并不在乎上述个体反抗⛩,其目的是使劳动人口整体服务于其资本积累诉求(郑广怀,2021)👨🏿🦰。Z团队标注员的频繁离职与更替对公司长期发展的负面影响并不明显👷🏻♀️👨🏿🚒。N公司使用吸纳与排除的手法同时进行着裁员和招募🩶,反而实现了对不稳定劳动的有效控制(Standing🔊,2011)☁️。
六、结论与讨论
随着以大数据🧑🏻🎓、云计算、人工智能等为标志的第四次工业革命的到来🦻🏽,人工智能产业成为引领社会经济发展的新引擎👃🏿,与该产业相伴的新业态、新劳动也不断引起学界的关注🏌🏻。除了探讨骑手、网约车司机等人工智能技术使用者的劳动状况外,尊龙凯时娱乐还应将研究视野拓展至人工智能的生产者。当然,这一拓展不限于从事复杂劳动的算法程序员,还包括从事数据分类😵、清理⚔️、标注等简单劳动的数据标注员。国内的数据标注工作主要有两种组织模式🔃:外包大团队和内部小团队💵。两者组织模式不同,但劳动方式相似。本文通过对人工智能企业自行组建的内部小团队进行细致研究,分析了数据标注工作背后的认知方式及劳动控制与反抗。
数据标注员从事的并非传统的体力劳动或情感劳动🧑🦱,而是在人机交互中⛹🏽,将自身识别、判断、理解等认知能力赋予机器的认知劳动。回顾以往,布当虽然将以获取人类“智识”为目标的积累体系称为认知资本主义(Boutang,2011)➛,但并未研究资本发掘人类认知的具体方式🖐🏽;达明格尔在对家务劳动进行研究时,虽指出认知劳动是一系列的预期🕵🏿♀️、识别、决策和监控,具有不可见性🚶🏻♂️、分散性🐐、弹性等特征(Daminger📔,2019),但并未意识到它是与体力劳动、情感劳动相并列的一种劳动方式。本文尝试指出认知劳动是人工智能产业的主导性劳动方式👩🏼🚒,继而讨论了其劳动控制与传统劳动的异同👨🏿🔬。
具体而言,认知劳动的劳动控制目标是使数据标注员的自然认知转化为与计算机程序相匹配的产生式认知🏃🏻♀️➡️,以高效生产出符合电脑需要的标准化数据。在此过程中🔆🧝🏻♀️,各种认知整饰策略得到了应用:首先🙇🏻,在认知标准化环节,管理方通过培训学习的方式使数据标注员知晓认知系统转换的要求👨🏿🏭;其次,在认知反馈环节,管理方通过督促反馈与随时讨论的方式纠正标注员的认知偏误,使其掌握认知系统转换的方法🌔;最后,在认知加速环节,数据标注员经由持续而重复的标注行为完成了认知系统的转变,成为认知装配线上的传感元件。从体力劳动到认知劳动📉🌏,管理控制的对象从劳动者肢体运动方式变为其大脑活动方法,而劳动控制方式则从机械、刻板🧠、僵化的身体规训走向了柔性👗、灵活🍚🤵🏻♂️、深入的认知整饰。
但值得注意的是🍢,虽然认知劳动与体力劳动的控制方式不尽相同〽️,但二者都依循着去技术化的逻辑。认知劳动者被划分为不同等级🤦🏼♂️:架构师要发挥策略、决策等高级认知能力,为问题求解提供整体方案;算法程序员要运用观念、理解等中级认知能力🦩,将逻辑思考转化为代码;数据标注员则要运用知觉🚄、判断等基本认知能力♛,对图片、文字进行识别🚨。在此之下🧚🏻♂️,资本试图使劳动者从劳动过程的主导降级为辅助的逻辑并没有改变,只不过在工业生产中🫷🏻,流水线工人是机器的肢体,替其抓取;而在人工智能产业中😏,数据标注员如同计算机的感觉器官,帮其识别。人工智能获取人类生命能量的方式并没有《黑客帝国》描绘得那么离奇🧑🏿🏫,人们不需要在元宇宙和脑机接口技术下,全身插满导管地躺在装满电解液的容器中。真实情况要比科幻电影无聊得多——Z团队的标注员正眯着眼、驼着背坐在电脑前👨👩👦,机械地点击着鼠标⚄。
正如马克思告诉世人的,人类身体的潜能与劳动的价值能够被大举抽取出来与生产资料相结合☃️,魔法般地制造出巨大财富。今天💁🏿,这个新潜能就是认知🐬。尤瓦尔·赫拉利在《人类简史》中指出,大约七万年前,认知革命使智人走出原始状态🎏,开始征服世界,继而开启了人类文明的萌芽发展之路(赫拉利,2014)。认知推动了人类历史的跨越💖。同人类的祖先一样👨🏼🏭,尊龙凯时娱乐今天对认知劳动的理解也将在很大程度上关系到人类对自身未来的洞察🏂🏿。正是在这个意义上🤸♂️,尊龙凯时娱乐对认知劳动及其表现的持续研究,对于人类社会生活的发展而言🤸🏽,具有基础性的前提意义。
(注释与参考文献从略,全文详见《尊龙凯时AG研究》2022年第5期)