日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

如何系統(tǒng)地學(xué)習(xí)數(shù)據(jù)挖掘,數(shù)據(jù)挖掘教程( 三 )


可以嘗試參加數(shù)據(jù)挖掘比賽培養(yǎng)全方面解決實際問題的能力 。如Sig KDD  , Kaggle: Go from Big Data to Big Analytics等 。可以嘗試為一些開源項目貢獻自己的代碼 , 比如Apache Mahout: Scalable machine learning and data mining ,myrrix等(具體可以在SourceForge或GitHub.上發(fā)現(xiàn)更多好玩的項目) 。
經(jīng)典圖書推薦:《機器學(xué)習(xí)》 《模式分類》《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》《統(tǒng)計學(xué)習(xí)方法》《數(shù)據(jù)挖掘?qū)嵱脵C器學(xué)習(xí)技術(shù)》《R語言實踐》 , 英文素質(zhì)是科研人才必備的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等 。
三、以下是個人對數(shù)據(jù)挖掘崗位的感受真正從數(shù)據(jù)挖掘項目實踐的角度講 , 溝通能力對挖掘的興趣愛好是最重要的 , 有了愛好才可以愿意鉆研 , 有了不錯的溝通能力 , 才可以正確理解業(yè)務(wù)問題 , 才能正確把業(yè)務(wù)問題轉(zhuǎn)化成挖掘問題 , 才可以在相關(guān)不同專業(yè)人才之間清楚表達你的意圖和想法 , 取得他們的理解和支持 。所以我認為溝通能力和興趣愛好是個人的數(shù)據(jù)挖掘的核心競爭力 , 是很難學(xué)到的;而其他的相關(guān)專業(yè)知識誰都可以學(xué) , 算不上個人發(fā)展的核心競爭力 。
說到這里可能很多數(shù)據(jù)倉庫專家、程序員、統(tǒng)計師等等都要扔磚頭了 , 對不起 , 我沒有別的意思 , 你們的專業(yè)對于數(shù)據(jù)挖掘都很重要 , 大家本來就是一個整體的 , 但是作為單獨一個個體的人來說 , 精力有限 , 時間有限 , 不可能這些領(lǐng)域都能掌握 , 在這種情況下 , 選擇最重要的核心 , 我想應(yīng)該是數(shù)據(jù)挖掘技能和相關(guān)業(yè)務(wù)能力吧(從另外的一個極端的例子 , 我們可以看 ,  比如一個迷你型的挖掘項目 , 一個懂得市場營銷和數(shù)據(jù)挖掘技能的人應(yīng)該可以勝任 。
這其中他雖然不懂數(shù)據(jù)倉庫 , 但是簡單的Excel就足以勝任高達6萬個樣本的數(shù)據(jù)處理;他雖然不懂專業(yè)的展示展現(xiàn)技能 , 但是只要他自己看的懂就行了 , 這就無需什么展示展現(xiàn);前面說過 , 統(tǒng)計技能是應(yīng)該掌握的 , 這對個人的迷你項目很重要;他雖然不懂編程 , 但是專業(yè)挖掘工具和挖掘技能足夠讓他操練的;這樣在迷你項目中 , 一個懂得挖掘技能和市場營銷業(yè)務(wù)能力的人就可以圓滿完成了 , 甚至在一個數(shù)據(jù)源中根據(jù)業(yè)務(wù)需求可以無窮無盡的挖掘不同的項目思路 , 試問就是這個迷你項目 , 單純的一個數(shù)據(jù)倉庫專家、單純的一個程序員、單純的一個展示展現(xiàn)技師、甚至單純的一個挖掘技術(shù)專家 , 都是無法勝任的) 。
這從另一個方面也說明了為什么溝通能力的重要 , 這些個完全不同的專業(yè)領(lǐng)域 , 想要有效有機地整合在一起進行數(shù)據(jù)挖掘項目實踐 , 你說沒有好的溝通能力行嗎?數(shù)據(jù)挖掘能力只能在項目實踐的熔爐中提升、升華 , 所以跟著項目學(xué)挖掘是最有效的捷徑 。國外學(xué)習(xí)挖掘的人都是一開始跟著老板做項目 , 剛開始不懂不要緊 , 越不懂越知道應(yīng)該學(xué)什么 , 才能學(xué)得越快越有效果 。
我不知道國內(nèi)的數(shù)據(jù)挖掘?qū)W生是怎樣學(xué)的 , 但是從網(wǎng)上的一些論壇看 , 很多都是紙上談兵 , 這樣很浪費時間 , 很沒有效率 。另外現(xiàn)在國內(nèi)關(guān)于數(shù)據(jù)挖掘的概念都很混亂 , 很多BI只是局限在報表的展示和簡單的統(tǒng)計分析 , 卻也號稱是數(shù)據(jù)挖掘;另一方面 , 國內(nèi)真正規(guī)?;瘜嵤?shù)據(jù)挖掘的行業(yè)是屈指可數(shù)(銀行、保險公司、移動通訊) , 其他行業(yè)的應(yīng)用就只能算是小規(guī)模的 , 比如很多大學(xué)都有些相關(guān)的挖掘課題、挖掘項目 , 但都比較分散 , 而且都是處于摸索階段 , 但是我相信數(shù)據(jù)挖掘在中國一定是好的前景 , 因為這是歷史發(fā)展的必然 。

推薦閱讀