參考文獻別太水,大數據參考文獻有什么區別

8.《數據之巔》對大數據追根溯源 , 提出當前信息技術的發展 , 已經讓中國獲得了后發優勢 , 中國要在大數據時代的全球競爭中勝出 , 必須把大數據從科技符號提升成為文化符號 , 在全社會倡導數據文化 。6.《大數據:互聯網大規模數據挖掘與分布式處理》主要內容包括分布式文件系統、相似性搜索、搜索引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統 。
想要學習大數據 , 應該看些什么書?

參考文獻別太水,大數據參考文獻有什么區別


推薦的學習書單1.《統計學習基礎 數據挖掘、推理與預測》盡管應用的是統計學方法 , 但強調的是概念 , 而不是數學 ?!督y計學習基礎:數據挖掘、推理與預測》內容廣泛 , 從有指導的學習(預測) , 到無指導的學習;從神經網絡、支持向量機 , 到分類樹、提升等主題 , 應有盡有 , 許多例子還附以彩圖 , 是同類書籍中介紹最全面的 。計算和信息技術的飛速發展帶來了醫學、生物學、財經和營銷等諸多領域的海量數據 。
【參考文獻別太水,大數據參考文獻有什么區別】理解這些數據是一種挑戰 , 這導致了統計學領域新工具的發展 , 并延伸到諸如數據挖掘、機器學習和生物信息學等新領域 。2.《模式分類》第二版除了保留了第1版的關于統計模式識別和結構模式識別的主要內容以外 , 讀者將會發現新增了許多近25年來的新理論和新方法 , 其中包括神經網絡、機器學習、數據挖掘、進化計算、不變量理論、隱馬爾可夫模型、統計學習理論和支持向量機等 。
3.《推薦系統實踐》過大量代碼和圖表全面系統地闡述了和推薦系統有關的理論基礎 , 介紹了評價推薦系統優劣的各種標準(比如覆蓋率、滿意度)和方法(比如AB測試) , 總結了當今互聯網領域中各種和推薦有關的產品和服務 。4.《深入搜索引擎–海量信息的壓縮、索引和查詢》理論和實踐并重 , 深入淺出地給出了海量信息數據處理的整套解決方案 , 包括壓縮、索引和查詢的方方面面 。
其最大的特色在于不僅僅滿足信息檢索理論學習的需要 , 更重要的是給出了實踐中可能面對的各種問題及其解決方法 。5.《概率論與數理統計》這本書不用過多介紹了吧 , 普遍大學里大一時期的教科書 , 只恨當年沒聽課啊 , 現在正在慢慢啃 。6.《大數據:互聯網大規模數據挖掘與分布式處理》主要內容包括分布式文件系統、相似性搜索、搜索引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統 。
7.《Web數據挖掘》信息檢索領域的書籍 , 該書深入講解了從大量非結構化Web數據中提取和產生知識的技術 。書中首先論述了Web的基礎(包括Web信息采集機制、Web標引機制以及基于關鍵字或基于相似性搜索機制) , 然后系統地描述了Web挖掘的基礎知識 , 著重介紹基于超文本的機器學習和數據挖掘方法 , 如聚類、協同過濾、監督學習、半監督學習 , 最后講述了這些基本原理在Web挖掘中的應用 。
《Web數據挖掘》為讀者提供了堅實的技術背景和最新的知識 。8.《數據之巔》對大數據追根溯源 , 提出當前信息技術的發展 , 已經讓中國獲得了后發優勢 , 中國要在大數據時代的全球競爭中勝出 , 必須把大數據從科技符號提升成為文化符號 , 在全社會倡導數據文化 。9.《深入淺出統計學》本書涵蓋的知識點包括:信息可視化、概率計算、幾何分布、二項分布及泊松分布、正態分布、統計抽樣、置信區間的構建、假設檢驗、卡方分布、相關與回歸等等 , 完整涵蓋AP考試范圍 。

推薦閱讀