HDFS是一個文件系統(tǒng),用于存儲文件,通過統(tǒng)一的命名空間–目錄樹來定位文件;其次,它是分布式的,由很多服務器聯(lián)合起來實現(xiàn)其功能,集群中的服務器有各自的角色 。
HDFS設(shè)計思想:分而治之:將大文件、大批量文件,分布式存放在大量服務器上,以便于采取分而治之的方式對海量數(shù)據(jù)進行運算分析 。?
在大數(shù)據(jù)系統(tǒng)中作用:為各類分布式運算框架(如:mapreduce,spark,tez,….)提供數(shù)據(jù)存儲服務? 。
重點概念:文件切塊,副本存放,元數(shù)據(jù) 。

HDFS重要特性:
- HDFS中的文件在物理上是分塊存儲(block),塊的大小可以通過配置參數(shù)(dfs.blocksize)來規(guī)定,默認大小在hadoop2.x版本中是128M,老版本中是64M;
- HDFS文件系統(tǒng)會給客戶端提供一個統(tǒng)一的抽象目錄樹,客戶端通過路徑來訪問文件,形如:hdfs://namenode:port/dir-a/dir-b/file.data;
- 目錄結(jié)構(gòu)及文件分塊信息(元數(shù)據(jù))的管理由namenode節(jié)點承擔——-namenode是HDFS集群主節(jié)點,負責維護整個hdfs文件系統(tǒng)的目錄樹,以及每一個路徑(文件)所對應的block塊信息(block的id 。及所在的datanode服務器);
- 文件的各個block的存儲管理由datanode節(jié)點承擔———–namenode是HDFS集群從節(jié)點,每一個block都可以在多個dataname上存儲多個副本(副本數(shù)量也可以通過參數(shù)設(shè)置dfs.replication);
HDFS原理篇
工作機制:
工作機制的學習主要是為加深對分布式系統(tǒng)的理解,以及增強遇到各種問題時的分析解決能力,形成一定的集群運維能力 。注:很多不是真正理解hadoop技術(shù)體系的人會常常覺得HDFS可用于網(wǎng)盤類應用,但實際并非如此 。要想將技術(shù)準確用在恰當?shù)牡胤剑仨殞夹g(shù)有深刻的理解 。
1 概述
- HDFS集群分為兩大角色:NameNode、DataNode
- NameNode負責管理整個文件系統(tǒng)的元數(shù)據(jù)
- DataNode負責管理用戶的文件數(shù)據(jù)塊
- 文件會按照固定的大小(blocksize)切成若干塊后分布式存儲在若干臺datanode上
- 每一個文件塊可以有多個副本,并存放在不同的datanode上
- DataNode會==定期==向NameNode匯報自身所保存的文件block信息,而namenode則會負責保持文件的副本數(shù)量
- HDFS的內(nèi)部工作機制對客戶端保持透明,客戶端請求訪問HDFS都是通過向namenode申請來進行
客戶端要向HDFS寫數(shù)據(jù),首先要跟namenode通信以確認可以寫文件并獲得接收文件block的datanode,然后客戶端按順序?qū)⑽募饌€block傳遞給相應datanode,并由接收到block的datanode負責向其他datanode復制block的副本 。
這里說明文件的切割是在客戶端實現(xiàn)的,而不是NameNode 。文件的傳輸也是由客戶端傳到指定datanode上,副本由datanode傳給其他datanode 。?
詳細步驟(重要):
- 跟namenode通信請求上傳文件,==namenode檢查目前文件是否已存在,父目錄是否存在==
- namenode返回是否可以上傳
- client請求第一個block該傳輸?shù)侥男ヾatanode服務器上(副本)
- namenode返回3個datanode服務器ABC(假如副 本數(shù)為3 。優(yōu)先找同機架的,其次不同機架,再其次是同機架的再一臺機器 。還會根據(jù)服務器的容量,)
- client請求3臺datanode中的一臺A上傳數(shù)據(jù)==(本質(zhì)上是一個RPC調(diào)用,建立pipeline)==,A收到請求會繼續(xù)調(diào)用B,然后B調(diào)用C,將整個pipeline建立完成,逐級返回客戶端
推薦閱讀
- excel程序在哪個文件 excel基礎(chǔ)知識筆記
- 如何使用電腦打印文件 電腦初學者入門教程
- linux新建文件命令 linux基礎(chǔ)入門知識
- 愛奇藝上傳視頻怎么賺錢 愛奇藝號自媒體平臺注冊
- ps筆刷放在哪個文件夾里 ps鋼筆工具摳圖教程
- iso鏡像文件是什么 蘋果電腦安裝雙系統(tǒng)教程
- 正在獲取文件名稱下載失敗 為什么下載不了圖片
- 手機qq怎么改文件傳輸設(shè)置 qq文件為什么下載不了
- 刪除程序是什么 文件屬性修改方法
- exe是什么格式的文件 手機exe文件打開器使用方法
