頭圖:參觀者在貴州大數(shù)據(jù)展示中心的時(shí)光隧道自拍留念,。近幾年,, 位于西南貧困地區(qū)的貴州把重心放在發(fā)展大數(shù)據(jù)上,致力打造 成中國的“硅谷“,。在人工智能的背后是數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的支撐,, 這里有著眾多大數(shù)據(jù)采集者,他們是“人工智能背后的人工”
?
“嗒嗒嗒”的鼠標(biāo)敲擊聲在偌大的辦公室里交匯著,,一個(gè)眼圈發(fā)紅的女孩眼睛牢牢地盯住電腦屏幕,,她需要做的是把圖片中放置在冰箱里的飲料名稱和類別一一對(duì)應(yīng)起來。面對(duì)不太常見的飲料,,她在右下角的菜單欄里不停地翻閱著“碳酸飲料,、乳制品、涼茶”等類別,。一輪過后,,還是沒能找到這瓶飲料的名稱。她開始有點(diǎn)焦急,,抬起頭來看了看周圍的人,,然后又埋頭搜尋。不久后,,她分類,、標(biāo)注出來的這些數(shù)據(jù)將用于智能冰箱的物體識(shí)別。
大山包圍中的百鳥河數(shù)字小鎮(zhèn),。數(shù)字小鎮(zhèn)在 2017 年 12 月曾召開人工智能服務(wù)論壇,,吸引了不少外地的科技公司進(jìn)駐
近幾年,隨著AlphaGo擊敗人類頂尖圍棋選手李世石,、柯潔等一系列事件,,人工智能逐漸走紅。而人工智能需要大量的數(shù)據(jù)來供機(jī)器深度學(xué)習(xí),,這些數(shù)據(jù)正是出自這群隱形者手中,,他們是“人工智能背后的人工”。
從貴陽市區(qū)沿著剛修好的公路駕車五十多公里,,就到了百鳥河數(shù)字小鎮(zhèn),。小鎮(zhèn)四面環(huán)山,人跡罕至,。2017年12月,,這里召開了人工智能服務(wù)論壇,漸漸為人所知。這里有一個(gè)能容納四百多人的數(shù)據(jù)工場(chǎng),,三百多臺(tái)電腦前坐滿了來自附近一家扶貧高職的學(xué)生,,他們流程化地框圖或處理語音,,這些大量標(biāo)注好的數(shù)據(jù)將用于“人臉識(shí)別,、無人駕駛、語音識(shí)別”等高科技項(xiàng)目,。
小純每天從學(xué)校來到辦公室的第一件事就是打開電腦,,那里有著兩千多個(gè)圖片拉框任務(wù)等著她完成。桌面上擺著一盆萬年青,,旁邊的蘋果已經(jīng)開始腐爛,。鄰座的胖子對(duì)她說話的時(shí)候,她還是一動(dòng)不動(dòng)地保持姿勢(shì)回答,,不想讓說話影響了自己的進(jìn)度,,右手拖動(dòng)鼠標(biāo)為道路圖片中的車輛、摩托車,、自行車和行人打上邊框,,并標(biāo)注行進(jìn)方向和是否有遮擋,這類圖片多用來訓(xùn)練智能安防攝像頭和自動(dòng)駕駛的識(shí)別能力,。一邊是一線大城市的自動(dòng)駕駛研發(fā),,一邊是貧困山區(qū)中坐在電腦前框圖的小純,他們之間存在著被忽視的數(shù)據(jù)折疊,。
小鎮(zhèn)上一個(gè)容納四百多人的數(shù)據(jù)工場(chǎng),,電腦前坐滿了來自附近一家扶貧高職的學(xué)生,他們來這里主要進(jìn)行數(shù)據(jù)標(biāo)注的實(shí)習(xí),。所謂數(shù)據(jù)標(biāo)注,,即是把人工智能需要識(shí) 別的數(shù)據(jù),通過分類,、畫框等方式標(biāo)注出來
雖然一進(jìn)公司就被分配到道路標(biāo)注小組,,但來自山區(qū)的小純對(duì)被自己框住的汽車一概不了解,好奇地問著SUV到底長什么樣,、無人駕駛是不是真的安全等問題,。小純的家鄉(xiāng)屬于貧困幫扶地區(qū),網(wǎng)絡(luò)閉塞,,4G信號(hào)還沒延伸到那里,。
小純利用寒假時(shí)間兼職,每天上班七八個(gè)小時(shí),,一個(gè)月能掙兩千元,,這對(duì)她來說是筆不錯(cuò)的收入,省點(diǎn)用還能給家里80歲的奶奶買些新衣服。她一直夢(mèng)想著,,有朝一日能夠通過自己的努力,,走出大山。
與小純不同,,即將畢業(yè)的小廣希望自己能留下來,。小廣是數(shù)據(jù)工場(chǎng)的元老級(jí)員工,見證了工場(chǎng)從幾十人增至幾百人的歷程,。2015年10月,,他加入了學(xué)校的電子商務(wù)俱樂部,做著跨境電商的產(chǎn)品詳情分類,。三個(gè)月后,,大數(shù)據(jù)工場(chǎng)成立,他也隨著實(shí)踐團(tuán)隊(duì)移到數(shù)據(jù)標(biāo)注部,。
小廣說,,加入數(shù)據(jù)標(biāo)注公司最大的改變是性格。自懂事以來,,父母就外出打工,,把自己一個(gè)人放在外婆家生活,每當(dāng)遇到煩惱,,自己就躲在房里,,慢慢地變得有點(diǎn)自閉。來到這里,,開始和同學(xué),、老師有了更多工作的交流、生活煩惱的傾訴,,開始談了第一次戀愛,。
從一開始的數(shù)據(jù)標(biāo)注員到質(zhì)檢員再到標(biāo)注組長,小廣用了整整一年的時(shí)間,。指定組員標(biāo)注的任務(wù)量,、定期抽檢質(zhì)量和向主管匯報(bào)進(jìn)度,如今小廣處理起來已經(jīng)得心應(yīng)手,?!耙郧绊?xiàng)目不穩(wěn)定,收入也時(shí)多時(shí)少,,一般能拿到五六百,。” 小廣說?,F(xiàn)在項(xiàng)目產(chǎn)量多的時(shí)候,,他一個(gè)月能賺五千多塊,。最近,他給在浙江打工的媽媽買了一部價(jià)值1300元的手機(jī),。
隨著人工智能深入更多垂直行業(yè),,需要的數(shù)據(jù)也持續(xù)增加。數(shù)據(jù)工場(chǎng)現(xiàn)有的四百多人已經(jīng)不能夠滿足甲方的要求,。在緊鄰工場(chǎng)的地方,,他們又租下了一幢三層高的大樓,待裝修好就繼續(xù)擴(kuò)招標(biāo)注員工,。在那里,,小廣看到公司的招牌被換成了“數(shù)據(jù)工廠”,,他以為公司搞錯(cuò)了:“怎么變成了工廠呢,,不應(yīng)該是操場(chǎng)的場(chǎng)嗎?”
在人工智能的熱潮背后,,小廣和他的同學(xué)也在擔(dān)心著,,他們教會(huì)了機(jī)器人學(xué)習(xí)工作,未來的機(jī)器人會(huì)不會(huì)取代他們,。
數(shù)據(jù)標(biāo)注部接到了一個(gè)新項(xiàng)目,,需要采集不同場(chǎng)景下的32套動(dòng)作,學(xué)生們按照?qǐng)D紙中的指定姿勢(shì)拍下照片,。數(shù)據(jù)標(biāo)注是實(shí)踐的項(xiàng)目,,也是勞動(dòng)密集型行業(yè),門檻并不高,,吸引了大批學(xué)生前來,。一般經(jīng)過幾天的培訓(xùn),學(xué)生們很快就能上手
吃過午飯后,,小純和堂姐,、村里的小伙伴一起上山去摘蕨菜。堂姐因下個(gè)月舉行婚禮回到老家,,平時(shí)像他們一樣的年輕人大多出外打工
小純和奶奶,、大伯母在閣樓里燒臘肉。小純家買了半頭豬熏成臘肉,,平常奶奶一人在家舍不得吃,,等小純回家才切來吃
小廣通過自己一年多的努力,從一個(gè)標(biāo)注員升為了道路標(biāo)注組長,,主要負(fù)責(zé)檢查,、指導(dǎo)組員的標(biāo)注質(zhì)量,并向主管匯報(bào)標(biāo)注進(jìn)度
從學(xué)校到數(shù)字小鎮(zhèn)上班需要走兩公里的山路,,每天他們?cè)谶@條路上往返于學(xué)校和公司之間
近兩年來,,隨著人工智能技術(shù)突飛猛進(jìn),盛華職業(yè)學(xué)院也開始設(shè)置了相關(guān)課程。唯一能擔(dān)任此課程的老師是數(shù)據(jù)標(biāo)注服務(wù)部的負(fù)責(zé)人
中午,,沒有課上的學(xué)生都留在公司里休息,。每天八九個(gè)小時(shí)對(duì)著電腦下來,對(duì)眼睛考驗(yàn)極大
貴陽,,一家企業(yè)正在建設(shè)隱藏在山體隧道里的大數(shù)據(jù)中心,。建成后,這將是全國最大的數(shù)據(jù)中心,。兩年時(shí)間內(nèi),,騰訊、阿里,、華為,、蘋果等企業(yè)相繼在貴州挖山洞 建立數(shù)據(jù)中心
?