日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

數據標注師 數據標注師是干什么的( 三 )


年初,劉夢緣單獨接了一個“私單”,賺了2萬元 。
那是一個大廠“丟”出來的單子,做無人駕駛的數據標注工作,由于公司手頭上的人員都撲在另一個項目上,她拉了之前的一些老同事和10個兼職學生,干了個“包工頭”的活 。
已經快1年沒有親自上陣標注文件的劉夢緣,只能硬著頭皮和所有人一樣移著鼠標,頭頂、脖子、肘部、手腕、膝蓋……都要一個個地標出來 。整整一周,一群人完成了幾萬個點位的標注——他們看似在科技的潮頭,干的卻是苦力活 。
本以為這單生意之后,可以繼續(xù)接小單,可好景不長 。“4月份開始,很多新團隊出現,壓價特別狠,原來是標注的報價按毛算,現在報價單上都出現幾分錢了” 。
數據標注行業(yè)有一套分工流程:巨頭把任務交給中游的數據標注公司,再由中游包給下游的小公司、小作坊 , 有的小作坊還會進一步眾包給“散戶”:比如兼職學生 。一單生意幾經轉手,就造成了行業(yè)眾包中介層疊越來越嚴重,利潤所剩無幾 。
“AI 肯定是未來的大趨勢,但我們這些小公司很迷茫,聽說很多公司都不干了 ?!眲艟壉鞠胫八絾巍弊龅貌畈欢嗔酥缶统鰜韱胃?,可這樣的行業(yè)情況下,她能感受到的只有壓力 。
困境、掙扎盡管目前的情況不樂觀 , 劉夢緣依舊相信,數據標注行業(yè)最終會大浪淘沙,而他們,是走到最后的那一批 。
從好的局面來看,下游市場陷入混戰(zhàn)的同時,上游的 AI 市場從未停止過發(fā)展 , AI正在成為人們進入這個社會的“入口”,這讓劉夢緣和其他從業(yè)者們感到充滿希望 。

但行業(yè)也顯露出嚴峻的一面,數據標注在迭代:大模型慢慢替代標注師,一些門檻更高、學科更細分的領域正露出頭角 。比如,醫(yī)療健康領域需要對病理切片等進行標注 , 以腰椎間盤突出的 CT 片為例,標注員必須準確識別并標注出間盤的輪廓 。不過,很多醫(yī)療專家并沒有時間和精力做數據標注 , 而這類工作又是普通的標注師無法勝任的,通常需要請醫(yī)生或醫(yī)學院的學生來做,結果就是成本居高不下 , 這些專業(yè)人員的成本是普通標注員的10倍 。
像劉夢緣之前那樣手把手教人工智能學習的方式,被稱為“有監(jiān)督”的機器學習 。但當人工智能被逐漸成熟,它自身的識別能力與模型擬合準確度將不斷提高,進入人機協(xié)作模式 。直至人工智能會在模型的注準確度與效率上完全超過人類,此時它便要離開人工標注 , 進入無監(jiān)督機器學習 。
理論上說,每一個垂直場景隨著技術發(fā)展,人工智能都有可能進入無監(jiān)督學習狀態(tài) 。AI的核心在于預測 , AI的下一個變革是無監(jiān)督學習、常識學習 。也就是說,“老師”們正在努力讓 AI 不依賴人類訓練,自己去觀察世界是如何運轉的 , 并學會預測,最終AI要甩掉“老師” 。
但劉夢緣并沒有很強的危機感:“我?guī)ьI我們的人在做一件最有意義的事,在將每一個個體的智慧轉化為 AI 。我能保證,如果未來 AI 取代人類,他們也會是最后一批被取代的 ?!?br /> 為什么是最后一批?“因為總會有一個新的行業(yè)需要引入 AI,需要我們(標注師)為他們來做數據準備 ?!?br />
劉夢緣一直認為:“最大的一塊市場是審核” 。隨著 AI 技術的發(fā)展,早年一些基本的標注工作正被逐漸被淘汰 。以自動駕駛模型為例:以前靠人工來識別車、行人,如今則是由機器先標出來,然后人再去檢查標注是否正確 。

推薦閱讀