日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

文章圖片

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

文章圖片

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

文章圖片

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

文章圖片

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

文章圖片

什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!

文章圖片

文章分為兩大部分 , 第一部分介紹元數(shù)據(jù)概念 , 第二部分從幾個方面說明元數(shù)據(jù)管理的應用 , 最后一部分總結一下元數(shù)據(jù)的重要性 , 僅代表我的一些個人觀點 , 還請各位前輩們不要見笑 。
01 元數(shù)據(jù)什么鬼?我入職的時候剛好趕上公司的元數(shù)據(jù)產(chǎn)品升級換代 , 同事們的研發(fā)氣氛正火熱 , 作為新入職菜鳥 , 總得先了解一下元數(shù)據(jù)概念 , 不然日后怎么和小伙伴們愉快地玩耍 , 于是查找國內(nèi)外相關材料:
一段時間之后有了一些知識積累 , 才發(fā)現(xiàn)用“關于數(shù)據(jù)的數(shù)據(jù)”來給元數(shù)據(jù)下定義確實再準確不過了 , 但同時也略微抽象 , 新人難于快速理解 , 待到上周我們數(shù)據(jù)治理專家從心理學的角度來闡述元數(shù)據(jù)之后 , 我終于也算理解了元數(shù)據(jù)到底是個啥 , 今天也算是站在“巨人”的肩膀上 , 用一種更簡單的方式來回答“元數(shù)據(jù)究竟是什么”這個問題…



元數(shù)據(jù)是關于數(shù)據(jù)的描述 , 存儲著關于數(shù)據(jù)的信息 , 為人們更方便地檢索信息提供了幫助 。 咦?檢索信息?小蝌蚪找媽媽的過程也是一個檢索信息的過程 , 是不是看懂這個故事就能懂元數(shù)據(jù)是什么了?
池塘里有一群小蝌蚪 , 他們看見鯉魚媽媽在教小鯉魚捕食 , 就迎上去 , 問:“鯉魚阿姨 , 我們的媽媽在哪里?”
此時蝌蚪們意識到 , 不對啊 , 我們的數(shù)據(jù)庫里不是應該存在著一張Mother表嗎 , 但是蝌蚪們竟然對這張表一無所知 , 不知道有什么字段 , 也不知道各個字段對應的具體數(shù)值:
鯉魚媽媽說:“你們的媽媽有四條腿 , 寬嘴巴 。 你們到那邊去找吧!”
鱷魚笑著說:“你們的媽媽有兩只大眼睛 , 披著綠衣裳 。 你們到那邊去找吧!”…
烏龜笑著說:“我不是你們的媽媽 , 你們的媽媽肚皮是白的 , 到前面去找吧 。 ”…
青蛙聽了“咯咯”地笑起來 , 說“唉!傻孩子 , 我就是你們的媽媽呀!”
整個過程可以看成是Mother這張表逐步完善的過程 , 數(shù)據(jù)來源分別是鯉魚媽媽、鱷魚媽媽和烏龜媽媽 , 如下圖所示:

對蝌蚪們最終獲取到的信息進行進一步抽象 , 就可以形成一種“元數(shù)據(jù)” , 該元數(shù)據(jù)描述了Mother這張表的結構:


剛才不是說元數(shù)據(jù)能為檢索信息提供幫助嗎 , 那是不是也說明元數(shù)據(jù)能為小蝌蚪找媽媽提供幫助?我們將在第二部分試著對這個故事進行改編 , 詳細介紹小蝌蚪利用元數(shù)據(jù)快速找到媽媽的過程 。
02 元數(shù)據(jù)管理的應用通常一款元數(shù)據(jù)管理工具應具備元模型設計、元數(shù)據(jù)采集、元數(shù)據(jù)分析、數(shù)據(jù)地圖展現(xiàn)等核心功能 , 我們試著改編小蝌蚪找媽媽這個故事 , 在改編的過程中理解這幾個核心功能 , 前提是我們假設所有動物共同構成了一個龐大的數(shù)據(jù)體系 , 小蝌蚪們Mother的具體數(shù)據(jù)已經(jīng)存在于此體系之中(鯉魚系統(tǒng)、鱷魚系統(tǒng)、烏龜系統(tǒng)) 。
1、元模型設計
先解釋一下元模型 。 如果說元數(shù)據(jù)是對數(shù)據(jù)的描述 , 那么元模型就是對元數(shù)據(jù)的描述 , 是對元數(shù)據(jù)的進一步抽象 , 三者的關系如下圖所示:

再講一下元模型設計的過程 。 首先獲取到系統(tǒng)中的所有元數(shù)據(jù) , 將這些元數(shù)據(jù)匯總并進行合理規(guī)劃 , 進一步抽象成元模型 , 從一定角度來說 , 可以把這個抽象的過程看成元模型設計的過程 。
元模型定義了各種元數(shù)據(jù)的結構以及元數(shù)據(jù)之間的關系 , 是元數(shù)據(jù)管理的基礎 , 也就是說 , 如果我們想用元數(shù)據(jù)幫助小蝌蚪找媽媽 , 需要先設計出合理的元模型 。 下圖是我試著給它們設計出的元模型(對于企業(yè)來說 , 真正的元模型設計過程非常復雜 , 受多方面因素影響):
【什么是元數(shù)據(jù),全網(wǎng)最通俗易懂解釋!】
我們認為小蝌蚪的媽媽(Mother)由若干個屬性(Property)組成 , 每個屬性的名稱用Name表示 , 每個屬性的類型用Type表示 。
現(xiàn)在元模型有了 , 下一步就是按照這個設計好的元模型采集小蝌蚪們需要的元數(shù)據(jù)信息 , 也就是我們常說的元數(shù)據(jù)采集 。
2、元數(shù)據(jù)采集
設計好元模型之后 , 元數(shù)據(jù)管理工具能通過全自動的方式采集到企業(yè)所需要的元數(shù)據(jù) , 在這個故事中 , 按照我設計好的元模型 , 元數(shù)據(jù)管理工具的元數(shù)據(jù)采集結果應該如下圖所示:

小蝌蚪們拿著這份元數(shù)據(jù)再去針對性地檢索關于媽媽的信息 , 就能一步到位 , 將目標直接鎖定到青蛙 , 整個故事將因元數(shù)據(jù)的出現(xiàn)而成功改寫 。

說明:在真實的企業(yè)數(shù)據(jù)環(huán)境中 , 數(shù)據(jù)與元數(shù)據(jù)是已經(jīng)存在于系統(tǒng)之中的 , 元數(shù)據(jù)管理就是根據(jù)企業(yè)現(xiàn)有的元數(shù)據(jù)設計出適合企業(yè)的元模型 , 然后將系統(tǒng)之中的元數(shù)據(jù)按照元模型集中匯總并關聯(lián)到一起 , 達到企業(yè)對數(shù)據(jù)統(tǒng)一管理與應用的目的 。
3、元數(shù)據(jù)分析
a、血緣分析
假設動物園園長慢羊羊正管理著整個動物園的數(shù)據(jù)信息 , 有一天園長發(fā)現(xiàn)自己這里有個數(shù)據(jù)不對 , 需要找出錯誤數(shù)據(jù)的提供者并追究責任 , 那么這個錯誤數(shù)據(jù)來自于哪個動物家庭呢?挨家挨戶去敲門核對數(shù)據(jù)顯然不夠高效 , 元數(shù)據(jù)管理工具的血緣分析功能會自動幫助園長分析這個錯誤數(shù)據(jù)的上游路徑 , 比如這個數(shù)據(jù)是由鯉魚媽媽交給鱷魚媽媽 , 鱷魚媽媽再提交給園長的 , 那么此時園長只需要去敲鯉魚和鱷魚家的門就可以了 。

b、影響分析數(shù)據(jù)終于更正了 , 此時園長需要及時提醒大家這個數(shù)據(jù)的更正信息 , 只需要通知這個數(shù)據(jù)影響到的動物家庭就可以了 , 這讓園長十分苦惱 , 整個動物園的數(shù)據(jù)傳遞這么復雜 , 怎么判斷哪個家庭會受到這個數(shù)據(jù)的影響呢 , 元數(shù)據(jù)管理工具的影響分析功能會分析出這個數(shù)據(jù)的影響范并能用可視化的方式展現(xiàn)出來 , 園長只需要通知受影響的動物家庭就可以了 。
c、數(shù)據(jù)地圖展現(xiàn)隨著動物園規(guī)模的日益擴大 , 入住的動物種類日益增多 , 有一天園長想了解動物園的整體情況 , 有多少動物家庭 , 哪個家庭和哪個家庭比較要好 , 哪個家庭和哪個家庭又從來沒有聯(lián)系 , 此時元數(shù)據(jù)管理工具的數(shù)據(jù)地圖可以幫助園長獲取到他想要的信息 , 數(shù)據(jù)地圖展現(xiàn)功能可以通過可視化的方式 , 讓園長對整個動物園的情況了如指掌 , 幫助它更好地觀察整個動物園的情況 。

03 元數(shù)據(jù)的重要性
在大數(shù)據(jù)時代的背景下 , 數(shù)據(jù)即資產(chǎn) , 元數(shù)據(jù)實現(xiàn)了信息的描述和分類的格式化 , 從而為機器處理創(chuàng)造了可能 , 它能幫助企業(yè)更好地對數(shù)據(jù)資產(chǎn)進行管理 , 理清數(shù)據(jù)之間的關系 。 元數(shù)據(jù)管理是企業(yè)提升數(shù)據(jù)質量的基礎 , 也是企業(yè)數(shù)據(jù)治理中的關鍵環(huán)節(jié) 。 元數(shù)據(jù)管理不當 , 信息很容易被丟失 , 進而不能對業(yè)務進行有效支撐 , 企業(yè)內(nèi)部業(yè)務人員要識別相關信息就會變得十分困難 , 最終用戶也將失去對數(shù)據(jù)的信任 。


文章來自美女程序員(龔菲)

    推薦閱讀