數(shù)據(jù)挖掘工程師之中,也分很多不同的類(lèi)型,比如做特征工程的、數(shù)據(jù)倉(cāng)庫(kù)的、數(shù)據(jù)平臺(tái)支持的、算法工程師、數(shù)據(jù)科學(xué)家等,他們的工作職責(zé)各有不同,職業(yè)技能也各有側(cè)重 。對(duì)于大多數(shù)數(shù)據(jù)挖掘工程師來(lái)說(shuō),編程技能是必不可少的,但是針對(duì)不同挖掘工程師的性質(zhì),需要掌握不同的編程技能 。一般來(lái)說(shuō),Python、Java、Scala是常用的大數(shù)據(jù)挖掘語(yǔ)言,有一些數(shù)據(jù)科學(xué)家喜歡用R;最常用的大數(shù)據(jù)平臺(tái)是Hadoop平臺(tái)和Spark平臺(tái),常用的結(jié)構(gòu)化數(shù)據(jù)庫(kù)是MySQL或其他關(guān)系型數(shù)據(jù)庫(kù),非結(jié)構(gòu)化數(shù)據(jù)庫(kù)中MongoDB較為常用 。
對(duì)于數(shù)據(jù)挖掘工程師來(lái)說(shuō),必要的Linux知識(shí)也必不可少 。因?yàn)閿?shù)據(jù)挖掘工程師絕大多數(shù)的工作都是在遠(yuǎn)程的服務(wù)器上完成的,不能流暢地在命令行中操作各種Linux系統(tǒng)(常用的有CentOS、Ubuntu等),工作的效率會(huì)大大降低 。另外Shell在數(shù)據(jù)處理上也很強(qiáng)大,sed awk簡(jiǎn)直是數(shù)據(jù)處理的神器 。以上并不是非常系統(tǒng)的對(duì)比,但是是我在工作中最實(shí)際的體驗(yàn),我并非碼農(nóng)出身,這個(gè)轉(zhuǎn)型過(guò)程中遇到了很多挑戰(zhàn),但是他們之間并沒(méi)有天塹一樣的區(qū)別,很多地方是共通的,如果你編程基礎(chǔ)較差,那么可以從數(shù)據(jù)分析師入手,之后在考慮轉(zhuǎn)型數(shù)據(jù)挖掘;如果編程基礎(chǔ)較好,可以考慮數(shù)據(jù)挖掘,但是數(shù)據(jù)挖掘工程師一般情況下不會(huì)接觸太多的業(yè)務(wù) 。
推薦閱讀
- 剛買(mǎi)的t2求解決方法
- 英語(yǔ)導(dǎo)課的方法有哪些,新課改背景下英語(yǔ)導(dǎo)課技巧.doc
- 以下哪些是操作風(fēng)險(xiǎn)管理的方法,操作風(fēng)險(xiǎn)管理應(yīng)遵循哪些原則
- 美縫劑多少錢(qián)一瓶,凡東尼美縫劑加盟多少錢(qián)
- 如何提高學(xué)校方法,學(xué)校如何提高學(xué)生素質(zhì)
- 如何進(jìn)行利潤(rùn)質(zhì)量分析,利潤(rùn)質(zhì)量分析方法
- 賽爾號(hào)2精靈怎么生級(jí),手機(jī)玩賽爾號(hào)網(wǎng)頁(yè)版的三種方法
- 抓好基層風(fēng)氣建設(shè)的方法,如何搞好單位風(fēng)氣建設(shè)
- T1有沒(méi)有什么省電的方法
- 芡實(shí)糕的功效與作用及食用方法
