▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶(hù)端

登錄

  • +1

AI落地:被忽視的數(shù)據(jù)標(biāo)注、最隱秘的數(shù)據(jù)標(biāo)注

2019-09-06 08:14
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

看點(diǎn):AI在改變?nèi)祟?lèi),而數(shù)據(jù)則在改變AI。

 
人類(lèi)創(chuàng)造了AI,但AI也同時(shí)改變了人類(lèi)。 從AlphaGo 初出茅廬大殺四方,到Zero絕跡江湖卻攪起圍棋行業(yè)的腥風(fēng)血雨開(kāi)始,人們對(duì)于這個(gè)聚光燈下的行業(yè)所抱有的期望就一直在不斷上升。

而將目光轉(zhuǎn)移到聚光燈外,作為AI技術(shù)的底層支撐,數(shù)據(jù)采集與標(biāo)注相較算法研究、數(shù)據(jù)挖掘等AI領(lǐng)域的其他工種,似乎一直以來(lái)都是被邊緣化乃至低視的一個(gè)存在。

盡管,在通常情況下,人工投喂數(shù)據(jù)的質(zhì)量往往直接影響著智能的精度。

而摘掉廉價(jià)勞動(dòng)力的帽子,我們會(huì)發(fā)現(xiàn),在被忽視的角落之中,AI數(shù)據(jù)服務(wù)行業(yè)也在進(jìn)行著日新月異的變化。

小到用數(shù)據(jù)爬蟲(chóng)抓取互聯(lián)網(wǎng)現(xiàn)存數(shù)據(jù),并進(jìn)行拉框,大到根據(jù)用戶(hù)定制化的硬件以及場(chǎng)景需求,去完成數(shù)據(jù)的采集與多維度數(shù)據(jù)標(biāo)注。這個(gè)行業(yè),如今正朝著專(zhuān)業(yè)化、細(xì)分化、場(chǎng)景化的方向不斷演進(jìn)。 而在這一過(guò)程中,一批諸如百度數(shù)據(jù)眾包、云測(cè)數(shù)據(jù)等更加專(zhuān)業(yè)、更具備實(shí)踐經(jīng)驗(yàn)的團(tuán)隊(duì)與企業(yè)也正應(yīng)運(yùn)而出成為行業(yè)中的佼佼者。

他們的誕生一方面是這個(gè)行業(yè)前行的見(jiàn)證者,同時(shí)也是開(kāi)拓者。

那么他們是如何成長(zhǎng)起來(lái)的?

這個(gè)一直被忽略、被邊緣化的行業(yè)究竟又發(fā)展到了哪個(gè)階段?

最后,從他們的角度出發(fā),AI又經(jīng)歷了怎樣的發(fā)展與變遷?

通過(guò)深度走訪(fǎng)AI數(shù)據(jù)服務(wù)行業(yè)的頭部玩家云測(cè)數(shù)據(jù)以及多位AI數(shù)據(jù)服務(wù)行業(yè)從業(yè)者,了解他們的故事與對(duì)這個(gè)行業(yè)的看法,我們得以看到數(shù)據(jù)行業(yè)最真實(shí)的一面,也進(jìn)一步從另一個(gè)角度看到了AI發(fā)展過(guò)程之中最隱秘的變化與成長(zhǎng)。

爆發(fā)初始:最基礎(chǔ)的數(shù)據(jù)服務(wù),被忽視的數(shù)據(jù)服務(wù)

作為谷歌首席架構(gòu)師、谷歌人工智能團(tuán)隊(duì)谷歌大腦(Google Brain)的負(fù)責(zé)人,Jeff Dean曾在公開(kāi)場(chǎng)合這樣強(qiáng)調(diào)數(shù)據(jù)對(duì)于人工智能算法的重要性:

以上橫軸為數(shù)據(jù)量,縱軸為準(zhǔn)確率,藍(lán)色以及綠色線(xiàn)條分別代表深度學(xué)習(xí)以及傳統(tǒng)算法。 根據(jù)Jeff Dean的預(yù)判,隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大,未來(lái)深度學(xué)習(xí)算法的精度也將不斷提升。

也就是說(shuō),處在技術(shù)大爆發(fā)與數(shù)字洪水階段,誰(shuí)掌握了更多的數(shù)據(jù)、更精準(zhǔn)的數(shù)據(jù),那么誰(shuí)的算法精度也就會(huì)更領(lǐng)先一步。

但一直以來(lái),在AI的發(fā)展中,數(shù)據(jù)的采集與標(biāo)注卻始終在有意或者無(wú)意的被忽視著,乃至被邊緣化。

但是在云測(cè)數(shù)據(jù)的總經(jīng)理賈宇航看來(lái),對(duì)于算法落地來(lái)說(shuō),“數(shù)據(jù)不僅充當(dāng)飼料,同時(shí)也在逐漸充當(dāng)嬰兒的奶粉,運(yùn)動(dòng)員的優(yōu)質(zhì)蛋白一樣,擁有了就可以更好的成長(zhǎng)具備競(jìng)爭(zhēng)力”而想要為算法提供足夠優(yōu)質(zhì)的嬰兒奶粉,并沒(méi)有那么容易。

舉個(gè)簡(jiǎn)單的例子,如果只是人臉檢測(cè),那么開(kāi)源數(shù)據(jù)集或平臺(tái)眾包就可以很快滿(mǎn)足需求。 但隨著技術(shù)要求的提升,AI不僅僅是做人臉檢測(cè),而是視線(xiàn)追蹤、或是微表情檢測(cè)。 很顯然,這類(lèi)需求很難通過(guò)互聯(lián)網(wǎng)或者眾包用戶(hù)采集完成。

那么如何解決這個(gè)問(wèn)題? 或許只有更專(zhuān)業(yè)的數(shù)據(jù)采集與標(biāo)注團(tuán)隊(duì)才能完成這一任務(wù)。

也正是基于這樣的市場(chǎng)需求, 2017年,云測(cè)旗下AI數(shù)據(jù)服務(wù)品牌云測(cè)數(shù)據(jù)成立 。 基于此前對(duì)于To B行業(yè)的深刻理解以及專(zhuān)業(yè) 化的團(tuán)隊(duì)搭建,云測(cè)數(shù)據(jù)成立不久就躋身國(guó)內(nèi)一流的AI數(shù)據(jù)服務(wù)解決方案提供商。

那么云測(cè)數(shù)據(jù)如何解決上面所說(shuō)的問(wèn)題?

賈宇航表示,云測(cè)數(shù)據(jù)的辦法是自建數(shù)據(jù)采集基地,搭建專(zhuān)門(mén)的場(chǎng)景實(shí)驗(yàn)室。 目前,云測(cè)數(shù)據(jù)已經(jīng)有了200多人的研發(fā)與產(chǎn)品經(jīng)理,以及近千人的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),在規(guī)模以及質(zhì)量上都處在行業(yè)前列。

以多角度多姿態(tài)的動(dòng)作采集為例,賈宇航表示,云測(cè)數(shù)據(jù)專(zhuān)門(mén)在橫店建了一個(gè)數(shù)據(jù)采集基地,根據(jù)客戶(hù)訂單需求,進(jìn)行特定動(dòng)作、表情和表情的捕捉。

當(dāng)然,這些不僅是有趣或者單一客戶(hù)需求所驅(qū)動(dòng)的成果,而是整個(gè)AI數(shù)據(jù)服務(wù)行業(yè)從粗放的勞動(dòng)密集型時(shí)代走向精耕細(xì)作所必須的過(guò)程。

走到如今,AI數(shù)據(jù)服務(wù)行業(yè)已經(jīng)邁向場(chǎng)景化與復(fù)雜化,而以眾包用戶(hù)進(jìn)行數(shù)據(jù)采集的服務(wù)形態(tài),已經(jīng)不能滿(mǎn)足AI企業(yè)往下一個(gè)階段進(jìn)化的需求。

賈宇航解釋?zhuān)F(xiàn)如今,一個(gè)完整的數(shù)據(jù)服務(wù)工作流程是由可行性評(píng)估到執(zhí)行,到審核,再到交付四個(gè)環(huán)節(jié)組成。 這中間,如何分工,審核與執(zhí)行之間又該如何形成反饋閉環(huán),怎樣能夠提升工作效率都是需要經(jīng)驗(yàn)摸索以及成本投入的。

以云測(cè)數(shù)據(jù)為例,在進(jìn)行數(shù)據(jù)服務(wù)時(shí),云測(cè)會(huì)有專(zhuān)門(mén)的研發(fā)投入以及不少于350個(gè)小時(shí)的團(tuán)隊(duì)培訓(xùn)流程。

通過(guò)研發(fā)團(tuán)隊(duì)搭建的協(xié)同分工流程平臺(tái)以及諸如快速框選、快速選點(diǎn)等小工具的開(kāi)發(fā),可以將數(shù)據(jù)采集以及標(biāo)注的速度與效率成倍的提升。以法令紋的采集標(biāo)注為例,有時(shí)候客戶(hù)不僅需要將其準(zhǔn)確的框選出來(lái),還需要將其進(jìn)行均勻的四點(diǎn)等分,如果單純的通過(guò)手工作業(yè),那么無(wú)論效率還是精確度都將受到極大的影響。 但是通過(guò)工具的開(kāi)發(fā),就可以在框選之后,快速的進(jìn)行自動(dòng)等分標(biāo)注。

而針對(duì)特定的用戶(hù)需求,云測(cè)還搭建了專(zhuān)門(mén)的場(chǎng)景實(shí)驗(yàn)室,可以基于客戶(hù)算法模型定制化搭建采集場(chǎng)景,以達(dá)到覆蓋盡可能多的實(shí)際場(chǎng)景及邊際場(chǎng)景的目的,保證采集數(shù)據(jù)契合算法模型,為客戶(hù)提供高精度的采集數(shù)據(jù)。

從網(wǎng)絡(luò)爬取到場(chǎng)景化采集,數(shù)據(jù)服務(wù)行業(yè)的三場(chǎng)戰(zhàn)事

在AI的落地中,數(shù)據(jù)服務(wù)行業(yè)也在不斷自我演進(jìn),同時(shí)也見(jiàn)證與反哺著下游AI企業(yè)的成長(zhǎng)與變化。

如果回顧數(shù)據(jù)服務(wù)行業(yè)這二十年來(lái)的發(fā)展,我們會(huì)發(fā)現(xiàn)在這個(gè)行業(yè)一定經(jīng)歷了三大階段的戰(zhàn)事,每一場(chǎng)中都有其代表性的玩家出現(xiàn),每一階段,也都印證著AI行業(yè)發(fā)展的腳步。

第一階段,可以簡(jiǎn)單概括為免費(fèi)階段。

這一時(shí)期,AI也基本還停留在初步的實(shí)驗(yàn)室階段,對(duì)于數(shù)據(jù)本身的精確度要求并不算高。 比如有企業(yè)需要人臉數(shù)據(jù),只要把來(lái)自社交網(wǎng)絡(luò)或者對(duì)搜索引擎圖片進(jìn)行簡(jiǎn)單的爬取就能夠滿(mǎn)足基本的需求。

進(jìn)一步演化出,以ImageNet等開(kāi)源數(shù)據(jù)集為代表,企業(yè)不再需要自己爬取網(wǎng)絡(luò)數(shù)據(jù),而是直接使用網(wǎng)上開(kāi)源的現(xiàn)成數(shù)據(jù),進(jìn)而可以減少很多時(shí)間以及精力成本。 但是這種數(shù)據(jù)偏通用,無(wú)法滿(mǎn)足定制化需求。 AI的發(fā)展也在這一時(shí)期進(jìn)入一個(gè)小高潮,但是距離產(chǎn)業(yè)化應(yīng)用卻還有一定距離。

第二階段,數(shù)據(jù)服務(wù)行業(yè)開(kāi)始有了初步的商業(yè)化,眾包成為了這一階段行業(yè)的代表性服務(wù)形態(tài)。

但是相應(yīng)的,專(zhuān)業(yè)性也成為這一時(shí)期行業(yè)的代表性問(wèn)題。 首先,是眾包用戶(hù)無(wú)法滿(mǎn)足客戶(hù)對(duì)于諸如疲勞駕駛檢測(cè)、情緒捕捉等方面的復(fù)雜需求; 其次,對(duì)于客戶(hù)需求的理解方面,眾包用戶(hù)由于沒(méi)有經(jīng)受專(zhuān)業(yè)的訓(xùn)練,可能會(huì)出現(xiàn)質(zhì)量參差不齊或者理解不到位的情況。 因此整體所能做的事情相對(duì)簡(jiǎn)單,無(wú)法滿(mǎn)足AI企業(yè)往下一個(gè)階段進(jìn)化時(shí)的數(shù)據(jù)需求。

發(fā)展至如今,數(shù)據(jù)服務(wù)已經(jīng)走入第三階段。這一時(shí)期,AI落地已經(jīng)成為行業(yè)發(fā)展的一大重要階段,AI+5G+IoT催化了數(shù)據(jù)大爆炸,帶來(lái)了廣闊的行業(yè)機(jī)遇,相應(yīng)的數(shù)據(jù)服務(wù)也走入了場(chǎng)景化以及精細(xì)化時(shí)代。

相對(duì)應(yīng)的,云測(cè)數(shù)據(jù)對(duì)自身的定位也進(jìn)一步明確,針對(duì)數(shù)據(jù)的安全性、定制化和精細(xì)化提出了更高要求。

針對(duì)高安全性,賈宇航總結(jié),云測(cè)數(shù)據(jù)針對(duì)客戶(hù)“可復(fù)用的只有經(jīng)驗(yàn),但絕不包括數(shù)據(jù)。 ”對(duì)此,云測(cè)數(shù)據(jù)建立了一套數(shù)據(jù)隔離機(jī)制: 可以將數(shù)據(jù)封閉在標(biāo)注平臺(tái)之內(nèi),全程采取專(zhuān)業(yè)化設(shè)備,以保證數(shù)據(jù)的采集、標(biāo)注者只有數(shù)據(jù)的操作權(quán),但是沒(méi)有拷貝、轉(zhuǎn)移的權(quán)利。

而針對(duì)場(chǎng)景化,云測(cè)數(shù)據(jù)目前在華東、華北、華南都設(shè)有數(shù)據(jù)交付中心和數(shù)據(jù)采集基地,可以滿(mǎn)足方言采集,特定目標(biāo)采集等定制化客戶(hù)需求。

最后是精細(xì)化,據(jù)賈宇航表示,在數(shù)據(jù)采集環(huán)節(jié),云測(cè)數(shù)據(jù)可以通過(guò)定制化場(chǎng)景搭建、專(zhuān)業(yè)人員實(shí)戰(zhàn)來(lái)滿(mǎn)足用戶(hù)特定需求; 而在數(shù)據(jù)標(biāo)注環(huán)節(jié),則會(huì)通過(guò)對(duì)員工培訓(xùn)以及專(zhuān)門(mén)開(kāi)發(fā)例如法令紋標(biāo)注等專(zhuān)業(yè)化工具,以使得框選、標(biāo)注的精度進(jìn)一步提升。

而隨著場(chǎng)景化、細(xì)分化的不斷發(fā)展,對(duì)客戶(hù)進(jìn)行專(zhuān)家式服務(wù)也成了當(dāng)前行業(yè)發(fā)展的一大特色。

賈宇航向我們講述了一個(gè)案例,曾經(jīng)有一家自動(dòng)駕駛企業(yè)前來(lái)云測(cè)數(shù)據(jù),表示想要針對(duì)自動(dòng)駕駛場(chǎng)景,對(duì)激光雷達(dá)以及攝像頭數(shù)據(jù)進(jìn)行采集標(biāo)注。 客戶(hù)要求將攝像頭拍到的車(chē)輛,在激光雷達(dá)的捕捉的數(shù)據(jù)中全部標(biāo)記出來(lái)。

但實(shí)際上,對(duì)于激光雷達(dá)捕捉到的數(shù)據(jù)中,10個(gè)點(diǎn)以下的內(nèi)容,實(shí)際上在標(biāo)注的時(shí)候可以直接忽略,否則反而會(huì)影響最終算法的識(shí)別精度。 這也就是專(zhuān)業(yè)化的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),對(duì)于客戶(hù)需求的進(jìn)一步增益。

換一個(gè)角度看人工智能,細(xì)分、多模態(tài)、專(zhuān)業(yè)化

我們不難發(fā)現(xiàn),作為AI的基石,AI數(shù)據(jù)服務(wù)的發(fā)展其實(shí)也正從一個(gè)獨(dú)特的角度,對(duì)AI的發(fā)展形成側(cè)寫(xiě)。

從云測(cè)數(shù)據(jù)的角度來(lái)看,賈宇航發(fā)現(xiàn)當(dāng)前的AI發(fā)展出現(xiàn)了三大特征: 細(xì)分化、多模態(tài)以及專(zhuān)業(yè)化,相應(yīng)的,對(duì)于AI數(shù)據(jù)服務(wù)行業(yè)也形成了一定的影響與方向指引。

首先是細(xì)分化,當(dāng)前AI已經(jīng)進(jìn)入技術(shù)落地階段,行業(yè)發(fā)展的主力已經(jīng)由此前的技術(shù)流AI專(zhuān)家主導(dǎo)變成了由行業(yè)專(zhuān)家與技術(shù)流AI專(zhuān)家共同合作完成技術(shù)落地。 他們一方面擁有著豐富的細(xì)分領(lǐng)域行業(yè)經(jīng)驗(yàn),另一方面又具備著深厚的技術(shù)研發(fā)實(shí)力,兩相結(jié)合將AI從象牙塔帶進(jìn)了安防、金融、家居、交通等各大行業(yè)。

進(jìn)一步影響到數(shù)據(jù)服務(wù)行業(yè),賈宇航發(fā)現(xiàn),在進(jìn)行數(shù)據(jù)標(biāo)注時(shí),通常有駕駛經(jīng)驗(yàn)的工作人員在標(biāo)注自動(dòng)駕駛的時(shí)候也會(huì)有很好的工作效率。 而未來(lái),在數(shù)據(jù)標(biāo)注行業(yè),玩家們也將隨著AI行業(yè)而一同進(jìn)入定位與細(xì)分市場(chǎng)追逐階段。 以云測(cè)數(shù)據(jù)為例,目前,他們集中于智能安防、智能駕駛、智慧金融、智慧家居,并在這幾個(gè)領(lǐng)域中建立了較高的行業(yè)壁壘。

其 次是多模態(tài),所謂多模態(tài),即是對(duì)多維時(shí)間、空間、環(huán)境數(shù)據(jù)的感知與融合。 比如當(dāng)前的自動(dòng)駕駛需要雷達(dá)+攝像頭才能跑的更穩(wěn),安防行業(yè)需要攝像頭+雷達(dá)紅外RFID才能感知的更精準(zhǔn)、更真實(shí)。 相應(yīng)的,在數(shù)據(jù)服務(wù)的時(shí)候,企業(yè)也要跟上客戶(hù)需求,掌握好對(duì)多維傳感器融合的數(shù)據(jù)采集與標(biāo)注。

最后則是專(zhuān)業(yè)化,盡管當(dāng)前AI技術(shù)已經(jīng)進(jìn)入落地階段,但是頭部AI企業(yè)相較傳統(tǒng)行業(yè)的AI落地,在技術(shù)上會(huì)有前沿性的領(lǐng)跑。 而這些算法企業(yè)的一些先進(jìn)技術(shù)研究也很有可能成為未來(lái)數(shù)據(jù)服務(wù)行業(yè)的一大發(fā)展方向,相應(yīng)的數(shù)據(jù)服務(wù)企業(yè)也要有前瞻性,才能在行業(yè)競(jìng)爭(zhēng)中建立長(zhǎng)期的壁壘。

結(jié)語(yǔ):脫離刀耕火種,數(shù)據(jù)服務(wù)進(jìn)入精細(xì)化運(yùn)營(yíng)時(shí)代

從貴陽(yáng)、河南農(nóng)村走向北京城里,理念更先進(jìn)、技術(shù)更硬核、服務(wù)更專(zhuān)業(yè)的AI數(shù)據(jù)服務(wù)企業(yè)正將數(shù)據(jù)采集與標(biāo)注帶入精細(xì)化運(yùn)營(yíng)時(shí)代。

一方面,AI落地,讓技術(shù)脫離實(shí)驗(yàn)室刷榜走向?qū)嶋H場(chǎng)景,也讓數(shù)據(jù)服務(wù)行業(yè)從幕后走到臺(tái)前,成為這一過(guò)程之中最隱秘的見(jiàn)證者。

另一方面,5G+AI+IoT時(shí)代來(lái)臨,為市場(chǎng)帶來(lái)新的爆發(fā)機(jī)遇,臺(tái)前是百花齊放的AI產(chǎn)品,背后則是默默無(wú)聞的數(shù)據(jù)服務(wù)產(chǎn)業(yè),正是他們托起了AI發(fā)展的基石。

在這片藍(lán)海市場(chǎng)中,未來(lái)機(jī)遇廣闊,但是淘汰也在持續(xù)進(jìn)行,可以肯定的是專(zhuān)業(yè)化、場(chǎng)景化、定制化將成為行業(yè)趨勢(shì)。

閱讀原文

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪(fǎng)問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶(hù)端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 广安市| 清远市| 远安县| 新巴尔虎左旗| 嫩江县| 桐梓县| 舟曲县| 柘城县| 天等县| 班戈县| 鲜城| 牡丹江市| 西平县| 冕宁县| 丽江市| 鸡东县| 米脂县| 宝清县| 安溪县| 义乌市| 枞阳县| 昌图县| 九台市| 呼和浩特市| 雷波县| 南木林县| 合阳县| 余庆县| 夏津县| 合肥市| 桦甸市| 历史| 东莞市| 榆树市| 江孜县| 娄底市| 尤溪县| 航空| 韶关市| 尚志市| 平泉县|