- +1
城市與社會 | 人工智能數(shù)據(jù)標(biāo)注,標(biāo)注的是誰的未來?
人工智能時代,數(shù)據(jù)標(biāo)注已經(jīng)成為一個新興產(chǎn)業(yè),其上下游相關(guān)業(yè)務(wù)涉及機(jī)器學(xué)習(xí)、虹膜識別、人臉識別、無人駕駛等技術(shù)。然而數(shù)據(jù)標(biāo)注真正的核心是大量人力投入的標(biāo)框工作。
目前關(guān)于數(shù)據(jù)標(biāo)注行業(yè)的研究還較為缺乏,更多的是媒體調(diào)查報告對該行業(yè)的描述。比如,諸多媒體都將該產(chǎn)業(yè)定義為勞動密集型,也通常將它與富士康進(jìn)行類比,稱其為“人工智能領(lǐng)域的富士康”。
作為長期觀察中國互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的一員,我對這個“人工智能領(lǐng)域的富士康”中的從業(yè)者群體產(chǎn)生了極大的興趣:他們究竟是誰?他們真的是人工智能時代的流水線工人嗎?

在對貴州的“未來”數(shù)據(jù)標(biāo)注公司進(jìn)行為期一周的前期田野調(diào)查過程中,我發(fā)現(xiàn),未來公司的從業(yè)群體畫像與已有媒體報道有所不同:未來公司的高級管理層以未來職業(yè)學(xué)院的老師為主;中級管理層以該校畢業(yè)的學(xué)生為主,其中少部分是來自貴州其他院校的本科畢業(yè)生;公司里的標(biāo)注員基本上是來自貴州二十幾個院校“產(chǎn)教融合”的實習(xí)生以及部分社招人員,其中以未來學(xué)院“產(chǎn)教融合”的實習(xí)生為主。
標(biāo)注員一般分為四類:全職的中層管理者,頂崗的實習(xí)生,跟崗的實習(xí)生和半工半讀的學(xué)生。頂崗實習(xí)生大多是因應(yīng)教育部的產(chǎn)教融合模式而產(chǎn)生的為期一年的大三實習(xí)生。跟崗的多為僅三個月實習(xí)的大二學(xué)生。半工半讀的實習(xí)生多為未來學(xué)院的少數(shù)民族貧困生。
據(jù)未來公司的一個項目組長小劉介紹,一條數(shù)據(jù)標(biāo)注一般由數(shù)據(jù)標(biāo)注員、初審員、終審員三個人共同完成。系統(tǒng)會隨機(jī)派發(fā)詞條給數(shù)據(jù)標(biāo)注員,標(biāo)注員完成標(biāo)框以后,會由對應(yīng)的初審員審核,再交由終審員審核,最后提交系統(tǒng)。這三者的比例是5:1:1或6:1:1。
也就是說,一個終審員對應(yīng)一個初審員和五到六個數(shù)據(jù)標(biāo)注員。三者之間存在連帶關(guān)系:初審員和終審員的薪資按照他們手下標(biāo)注員平均工資來計算;如果其中一個詞條連續(xù)三次出現(xiàn)錯誤的話,系統(tǒng)會自動回收詞條,負(fù)責(zé)的組長也會找小團(tuán)隊談話。
數(shù)據(jù)標(biāo)注實習(xí)生的身份認(rèn)同:90后?少數(shù)民族?
在去往貴州的路上,我不可避免地充滿了許多關(guān)于少數(shù)民族的想象,甚至一度將它作為田野觀察中的一個重要標(biāo)簽。有趣的是,盡管未來公司過半的實習(xí)生是少數(shù)民族學(xué)生,在為期一周的前期觀察中,我居然有一種未能抽離日常教學(xué)工作的觀感:似乎我面對的仍是上海的大學(xué)課堂上的那班95后學(xué)生。不管是對于工作的認(rèn)知與自我定位,還是對于未來的想象,這些少數(shù)民族的95后學(xué)生自始至終將“90后”的身份認(rèn)同優(yōu)先于民族身份認(rèn)同。

未來公司的另一個項目組長小回告訴我,“現(xiàn)在80后是社會頂梁柱,90后賺錢資歷不夠,有點(diǎn)心高氣傲的,就業(yè)和擇業(yè)選擇性比較強(qiáng),所以比較尷尬……其實我們現(xiàn)在90后除了錢還是錢……情懷是什么東西就不知道了。你看以現(xiàn)在的物價,結(jié)婚就是二三十萬,我要工作多久才能賺到20萬?……不管你是哪個民族,目前我們最重要的目標(biāo)就是賺錢。”
“為自己干”是我在訪談過程中聽過最多的未來公司的文化。比如公司的標(biāo)注員小布就不斷強(qiáng)調(diào)公司并不要求實習(xí)生加班,大家都是“自愿”加班:有些女孩子為了拿到一個月一萬多的計件工資,甚至?xí)x擇每周工作七天,每天工作11個小時。
批判學(xué)研究往往會將這類敘事方式看作典型的“自我剝削”(self-exploitation)的一種外在形式——公司或管理者通過授予文化工作者一定程度的創(chuàng)作自由和空間,諸如掌握自己的工作時間、地點(diǎn)和形式等,并對員工進(jìn)行“自我管理”的培訓(xùn),用以控制他們。公司和管理者往往通過這種方式將風(fēng)險和責(zé)任下放到個人身上。
此類方式見諸于社會各個領(lǐng)域,上至美國社會典型的“個人成功論”,下至互聯(lián)網(wǎng)公司的靈活上班制度,同樣地,也得到了這些90后少數(shù)民族青年的認(rèn)同——類似于“談話”和“為自己干”的心理疏導(dǎo)與情感交流成為了管理這些學(xué)生的主要方式。
和我在上海高校面對的95后大學(xué)生一致,這些90后的少數(shù)民族青年也對創(chuàng)業(yè)充滿了熱情。雖然創(chuàng)業(yè)的內(nèi)容與上海的群體有些許不同,比如因應(yīng)貴州當(dāng)?shù)靥厣嗲嗄甑膭?chuàng)業(yè)夢想集中于農(nóng)村淘寶、電子商務(wù)層面,希望通過將當(dāng)?shù)剞r(nóng)產(chǎn)品互聯(lián)網(wǎng)化來實現(xiàn)助農(nóng)脫貧。
但是,這些青年對于通過創(chuàng)業(yè)實現(xiàn)自由的渴望與大城市中的90后創(chuàng)業(yè)青年們并無不同。與上述“為自己干”這類虛幻的“自我控制”類似,這種對通過創(chuàng)業(yè)來掌控自我命運(yùn)的自由的追尋使得這些青年更為鞏固了90后的身份認(rèn)同。
關(guān)于民族身份認(rèn)同,小布表示,他們這一代的少數(shù)民族往往已經(jīng)不會說本族語言,對本族的文化儀式也沒有太多參與感。對于這些青年來說,區(qū)分他們的已不是民族身份,而是教育程度。
“如果沒有受過比較好一點(diǎn)的教育的話,他可能會比較死板……接觸新東西都感覺有點(diǎn)恐懼……你受過這些教育的話,和他(沒有受過高等教育的同民族小伙伴)就交流不了多少。交流的話,他就講那幾樣……你在公司里面發(fā)現(xiàn),小伙伴之間還是有很多可以交流的。”
當(dāng)身為布依族的小布用堅定的眼神告訴我“教育真的能改變?nèi)松钡臅r候,我決定臨時改變行程,在之后的幾天走訪少數(shù)民族村寨去實地了解這些青年所處的文化氛圍。正是因為受教育程度的分化,使得這些90后少數(shù)民族青年,相較于他們的長輩來說,更歡迎這些和人工智能相關(guān)的企業(yè)入駐當(dāng)?shù)兀哺敢馔ㄟ^這份工作標(biāo)簽他們的 “90后青年”這一身份。
“我在為人工智能添磚加瓦”
大部分現(xiàn)有媒體報道將數(shù)據(jù)標(biāo)注工作類比于富士康工作的一大原因是認(rèn)為前者的勞動過程出現(xiàn)了異化(alienation):勞動者即數(shù)據(jù)標(biāo)注員失去對工作的控制,對工作內(nèi)容和成果毫無參與感。
與之相反,我所接觸到的青年們對這份工作的認(rèn)知是“人工智能工程的一個基礎(chǔ)建設(shè)性工作”,對自我身份的認(rèn)知是“智能人工”、“人工智能背后的訓(xùn)練師”。而“無人工不智能”也是這群青年常掛在嘴邊的一句話。盡管很多青年從事這份工作的動力之一是在當(dāng)?shù)叵鄬?yōu)渥的報酬,但是對于自己能加入到人工智能的大潮,為未來人工智能的實現(xiàn)做出一份貢獻(xiàn)的自豪感也是他們繼續(xù)這份工作的動力。
小劉告訴我,“比如說我們做百度的工作之后,看到百度無人車在路上行駛的時候,確實會有一些自豪感。因為這個東西有我參與的一部分,能影響人類社會。”其他受訪者也表示了類似的想法。
這種參與到人工智能發(fā)展過程中的自豪感或多或少也讓這些青年將自己有意識的區(qū)分于富士康的同齡人。在他們看來,富士康更像是傳統(tǒng)高職院校學(xué)生們會加入的、和電子廠類似的工廠。也許這種區(qū)分感在日復(fù)一日的標(biāo)框工作中顯得并不那么明顯,但是真正有所區(qū)分的,或許是這些青年言談間流露出來的對于人工智能發(fā)展的高度期許以及對自身價值的肯定。
小回說,“機(jī)器越發(fā)達(dá),就會讓勞動力流失越嚴(yán)重……比如我們現(xiàn)在研究無人車,以后無人車研究成功了,就很少用人工了,但是其他項目就會發(fā)出來……需要我們的學(xué)弟學(xué)妹去處理這些數(shù)據(jù)……我覺得機(jī)器不能完全取代人。”
未來公司的一個中層管理者小天也表示,“之前我特別迷茫,覺得每天做勞動性、重復(fù)性的工作和流水線有什么區(qū)別……了解接觸多了之后就會發(fā)現(xiàn)其實AI它能夠?qū)崿F(xiàn)數(shù)據(jù)初步的信息識別,能夠完成60%、70%,但還不夠精準(zhǔn),需要人工去校對和標(biāo)注。未來,當(dāng)它達(dá)到一定的高度之后,我們簡單重復(fù)性的工作肯定會被替代,同時又會產(chǎn)生很多新的工作崗位。”
和已有的媒體報道有所區(qū)別的是,這些從事數(shù)據(jù)標(biāo)注第一線工作的青年們對于未來并不茫然,大多數(shù)人都堅信人工智能發(fā)展的未來會衍生出其他新的工種,而他們還是會有一席之地。正如小布所說,數(shù)據(jù)標(biāo)注不過是一份自己正在從事的工作,“機(jī)器換人”的未來與自己換工作并不構(gòu)成直接的因果關(guān)系。
留守的童年,智能的未來?
事實上,在小劉提及他作為留守兒童的經(jīng)歷對他擇業(yè)的影響之前,我的研究計劃中并不涉及貴州的留守兒童這一特殊現(xiàn)象。當(dāng)小劉提及數(shù)據(jù)標(biāo)注這類與人工智能掛鉤的工作也許可以在未來改變貴州青壯年勞力常年外出打工的現(xiàn)狀,以此減少未來留守兒童的人數(shù)時,我決定臨時更改研究計劃,前往當(dāng)?shù)貛讉€少數(shù)民族村寨。
我驚訝地發(fā)現(xiàn)這些村寨的青壯年勞力幾乎處于缺席的狀況:三三兩兩的孩童在街頭、水庫邊、山路上玩耍,并沒有任何大人監(jiān)管;十幾歲初中生年紀(jì)的苗族、布依族少年少女們大多騎著摩托車或是電瓶車載著更小的孩子在村道上快速飛馳。


在去往一個村寨的半山腰上,我遇到了放假留守的三個苗族小學(xué)生,健談的小學(xué)生告訴我,他們的苗寨目前大概還有十幾戶人家,很多孩子都被送到鎮(zhèn)上的親戚家,村寨現(xiàn)在只剩下五個小孩。平時他們寄宿在近兩百公里以外的學(xué)校里,現(xiàn)在放假才被接回村中給家里放羊。
在又路遇了放假在家修房子的苗族初中少年們以后,我才得知,一直以來在媒體報道中看到的“小候鳥”(暑假被接去父母打工所在地和父母團(tuán)聚的留守兒童們)在貴州的這些山區(qū)中并不普遍。一個原因是在外地打工的父母經(jīng)濟(jì)上無法負(fù)擔(dān)接送孩子來回并且臨時照顧孩子可能產(chǎn)生的誤工費(fèi)等等。另一個原因則是,這些孩子們在假期往往需要留在家中幫年邁的爺爺奶奶們做家務(wù),比如割豬草、放羊、喂豬等等。
正如小回所說,即便這些父母知道留守兒童存在很多問題,會對孩子的未來造成影響,但是他們也沒有選擇:如果留在當(dāng)?shù)兀邢薜氖杖牒芸赡茏屗麄儫o法維持生計,甚至因為當(dāng)?shù)仄毡榈耐獬龃蚬がF(xiàn)狀,留家務(wù)農(nóng)還會導(dǎo)致鄰里取笑父母沒有上進(jìn)心這類輿論壓力。
從教于貴州當(dāng)?shù)刈畲蟮墓⒙殬I(yè)院校之一的洪老師反映,目前國家對當(dāng)?shù)氐姆鲐氻椖吭诨A(chǔ)建設(shè)方面已經(jīng)頗有成效,比如我一路上所見的修建完善的盤山公路和房屋整潔的村寨。
當(dāng)?shù)啬壳罢嬲媾R的問題是,如何引科技企業(yè)入駐,培養(yǎng)相應(yīng)的人才,進(jìn)而實現(xiàn)讓當(dāng)?shù)厝嗽诋?dāng)?shù)鼐蜆I(yè)。小回、小布和小天都提及,貴州在政策上成為大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的熱土以后,類似數(shù)據(jù)標(biāo)注這種和大數(shù)據(jù)、人工智能密切掛鉤的工作成為他們對于未來的期許:也許他們這一代能因為新產(chǎn)業(yè)的進(jìn)駐與發(fā)展而留在故鄉(xiāng),也許他們的下一代不會成為留守兒童。
未來也許可期?
不可否認(rèn),產(chǎn)教融合的模式在數(shù)據(jù)標(biāo)注這個行業(yè)中還有很長的路要走,實施過程也需要更多第三方的監(jiān)督。這些也將成為我們接下來的研究重點(diǎn)。然而,與簡單粗暴的將這些青年等同于富士康工人或是高科技時代的流水線工人不同的是,我們更應(yīng)該看到他們的內(nèi)部動態(tài)結(jié)構(gòu):他們對這份工作的認(rèn)同感;他們從事這份工作背后的社會動態(tài)因素;他們對人工智能的認(rèn)知與預(yù)期。他們清醒地意識到自己在從事一份什么樣的工作,也明白未來可期的是什么。
作為長期從事批判研究的一員,此次前期田野調(diào)查也幫我突破了長久以來的研究瓶頸:批判研究并不是單純的找問題、挖掘問題,也許我們也需要反思,關(guān)于我們能做些什么來解決這些問題。
數(shù)據(jù)標(biāo)注行業(yè)、人工智能、扶貧、留守兒童等等,亟待我們解決的,更多的也許是政策落地實施過程中出現(xiàn)的問題,以及如何切實地解決這些落地問題。
(文中的公司、學(xué)院與人物均為化名。作者夏冰青系華東師范大學(xué)傳播學(xué)院晨暉學(xué)者。作者特別感謝為此次田野調(diào)查提供任何幫助的所有人。)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司