日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

如何使用數(shù)據(jù)挖掘 技術(shù),數(shù)據(jù)挖掘崗位分析( 二 )


相對(duì)SAS、SPSS來(lái)說(shuō)R語(yǔ)言更適合科研人員The R Project for Statistical Computing , 因?yàn)镽軟件是完全免費(fèi)的 , 而且開放的社區(qū)環(huán)境提供多種附加工具包支持 , 更適合進(jìn)行統(tǒng)計(jì)計(jì)算分析研究 。雖然目前在國(guó)內(nèi)流行度不高 , 但是強(qiáng)烈推薦 。可以嘗試改進(jìn)一些主流算法使其更加快速高效 , 例如實(shí)現(xiàn)Hadoop平臺(tái)下的SVM云算法調(diào)用平臺(tái)--web 工程調(diào)用hadoop集群 。
需要廣而深的閱讀世界著名會(huì)議論文跟蹤熱點(diǎn)技術(shù) 。如KDD , ICML , IJCAI , Association for the Advancement of Artificial Intelligence , ICDM 等等;還有數(shù)據(jù)挖掘相關(guān)領(lǐng)域期刊:ACM Transactions on Knowledge Discovery from Data , IEEE Transactions on Knowledge and Data Engineering , Journal of Machine Learning Research Homepage , IEEE Xplore: Pattern Analysis and Machine Intelligence, IEEE Transactions on等 。
可以嘗試參加數(shù)據(jù)挖掘比賽培養(yǎng)全方面解決實(shí)際問(wèn)題的能力 。如Sig KDD  , Kaggle: Go from Big Data to Big Analytics等 。可以嘗試為一些開源項(xiàng)目貢獻(xiàn)自己的代碼 , 比如Apache Mahout: Scalable machine learning and data mining ,myrrix等(具體可以在SourceForge或GitHub.上發(fā)現(xiàn)更多好玩的項(xiàng)目) 。
經(jīng)典圖書推薦:《機(jī)器學(xué)習(xí)》 《模式分類》《統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)》《統(tǒng)計(jì)學(xué)習(xí)方法》《數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)》《R語(yǔ)言實(shí)踐》 , 英文素質(zhì)是科研人才必備的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等 。
三、以下是個(gè)人對(duì)數(shù)據(jù)挖掘崗位的感受真正從數(shù)據(jù)挖掘項(xiàng)目實(shí)踐的角度講 , 溝通能力對(duì)挖掘的興趣愛好是最重要的 , 有了愛好才可以愿意鉆研 , 有了不錯(cuò)的溝通能力 , 才可以正確理解業(yè)務(wù)問(wèn)題 , 才能正確把業(yè)務(wù)問(wèn)題轉(zhuǎn)化成挖掘問(wèn)題 , 才可以在相關(guān)不同專業(yè)人才之間清楚表達(dá)你的意圖和想法 , 取得他們的理解和支持 。所以我認(rèn)為溝通能力和興趣愛好是個(gè)人的數(shù)據(jù)挖掘的核心競(jìng)爭(zhēng)力 , 是很難學(xué)到的;而其他的相關(guān)專業(yè)知識(shí)誰(shuí)都可以學(xué) , 算不上個(gè)人發(fā)展的核心競(jìng)爭(zhēng)力 。
說(shuō)到這里可能很多數(shù)據(jù)倉(cāng)庫(kù)專家、程序員、統(tǒng)計(jì)師等等都要扔磚頭了 , 對(duì)不起 , 我沒有別的意思 , 你們的專業(yè)對(duì)于數(shù)據(jù)挖掘都很重要 , 大家本來(lái)就是一個(gè)整體的 , 但是作為單獨(dú)一個(gè)個(gè)體的人來(lái)說(shuō) , 精力有限 , 時(shí)間有限 , 不可能這些領(lǐng)域都能掌握 , 在這種情況下 , 選擇最重要的核心 , 我想應(yīng)該是數(shù)據(jù)挖掘技能和相關(guān)業(yè)務(wù)能力吧(從另外的一個(gè)極端的例子 , 我們可以看 ,  比如一個(gè)迷你型的挖掘項(xiàng)目 , 一個(gè)懂得市場(chǎng)營(yíng)銷和數(shù)據(jù)挖掘技能的人應(yīng)該可以勝任 。
這其中他雖然不懂?dāng)?shù)據(jù)倉(cāng)庫(kù) , 但是簡(jiǎn)單的Excel就足以勝任高達(dá)6萬(wàn)個(gè)樣本的數(shù)據(jù)處理;他雖然不懂專業(yè)的展示展現(xiàn)技能 , 但是只要他自己看的懂就行了 , 這就無(wú)需什么展示展現(xiàn);前面說(shuō)過(guò) , 統(tǒng)計(jì)技能是應(yīng)該掌握的 , 這對(duì)個(gè)人的迷你項(xiàng)目很重要;他雖然不懂編程 , 但是專業(yè)挖掘工具和挖掘技能足夠讓他操練的;這樣在迷你項(xiàng)目中 , 一個(gè)懂得挖掘技能和市場(chǎng)營(yíng)銷業(yè)務(wù)能力的人就可以圓滿完成了 , 甚至在一個(gè)數(shù)據(jù)源中根據(jù)業(yè)務(wù)需求可以無(wú)窮無(wú)盡的挖掘不同的項(xiàng)目思路 , 試問(wèn)就是這個(gè)迷你項(xiàng)目 , 單純的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)專家、單純的一個(gè)程序員、單純的一個(gè)展示展現(xiàn)技師、甚至單純的一個(gè)挖掘技術(shù)專家 , 都是無(wú)法勝任的) 。

推薦閱讀