日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

如何構(gòu)建知識(shí)圖譜,知識(shí)圖譜構(gòu)建( 二 )


其次,在完成了以上步驟之后,接下來(lái)就是本體抽取 。比如說(shuō)公司是一個(gè)機(jī)構(gòu),它是有這種上下流的關(guān)系的 。對(duì)于平級(jí)的也需要計(jì)算一個(gè)他們的相識(shí)度,比如比爾蓋茨和喬布斯在實(shí)體層面,他們是比較相似的 。他們都屬于人這個(gè)實(shí)體 。他們跟公司的差別還是挺大的,所以需要一個(gè)相似度的計(jì)算 。在以上步驟完成之后需要對(duì)知識(shí)庫(kù)進(jìn)行質(zhì)量評(píng)估 。
如何構(gòu)建健康知識(shí)圖譜?

如何構(gòu)建知識(shí)圖譜,知識(shí)圖譜構(gòu)建


可將醫(yī)學(xué)知識(shí)圖譜構(gòu)建技術(shù)歸納為五部分,即醫(yī)療知識(shí)的表示、抽取、融合、推理以及質(zhì)量評(píng)估 。通過(guò)從大量的結(jié)構(gòu)化或非結(jié)構(gòu)化的醫(yī)學(xué)數(shù)據(jù)中提取出實(shí)體、關(guān)系、屬性等知識(shí)圖譜的組成元素,選擇合理高效的方式存入知識(shí)庫(kù) 。1)醫(yī)學(xué)知識(shí)表示 。知識(shí)表示是為描述世界所做的一組約定,是知識(shí)符號(hào)化、 形式化、模式化的過(guò)程,主要研究計(jì)算機(jī)存儲(chǔ)知識(shí)的方法,其表示方式影響系統(tǒng)的知識(shí)獲取、存儲(chǔ)及運(yùn)用的效率 。
在醫(yī)療領(lǐng)域,實(shí)體維度包括疾病、癥狀、檢查、檢驗(yàn)、體征、藥品等等醫(yī)學(xué)名詞,甚至醫(yī)生、科室、醫(yī)院也可以納入范疇 。關(guān)系是指實(shí)體間的關(guān)系,比如,針對(duì)疾病和癥狀,關(guān)系可有“包含關(guān)系”,“不包含關(guān)系”,甚至“金標(biāo)準(zhǔn)關(guān)系”(比如,所有炎癥都會(huì)帶來(lái)發(fā)熱,這就是金標(biāo)準(zhǔn)) 。疾病和醫(yī)生可以定義“醫(yī)生擅長(zhǎng)治療疾病”,醫(yī)生和醫(yī)院可以定義“歸屬于關(guān)系”等等 。
這些都是知識(shí)圖譜的構(gòu)成 。2)醫(yī)學(xué)知識(shí)融合 。在醫(yī)療領(lǐng)域,Dieng-Kuntz 等人將醫(yī)療數(shù)據(jù)庫(kù)轉(zhuǎn)換為醫(yī)療本體,然后對(duì)其他文本語(yǔ)料使用半自動(dòng)的語(yǔ)言工具進(jìn)行語(yǔ)義提取,在人工控制下對(duì)本體進(jìn)行擴(kuò)展和補(bǔ)全,并用啟發(fā)式規(guī)則自動(dòng)建立知識(shí)的概念層次 。Baorto 等人將數(shù)據(jù)源添加到臨床信息系統(tǒng)時(shí)先確定數(shù)據(jù)的控制術(shù)語(yǔ)是否已經(jīng)存在,然后將新術(shù)語(yǔ)添加到 MED( Medical Entities Dictionary),同時(shí)建立審計(jì)流程以保證引入數(shù)據(jù)的一致性 。
3)醫(yī)學(xué)知識(shí)推理 。醫(yī)學(xué)知識(shí)圖譜必須處理大量重復(fù)矛盾的信息,這就增加了構(gòu)建醫(yī)學(xué)推理模型的復(fù)雜性 。傳統(tǒng)的知識(shí)推理方法有基于描述邏輯(Description Logic,DL)推理,基于規(guī)則推理(Rule-based Reasoning,CBR)與基于案例推理(Case-based Reasoning,CBR)等等 。
Bousquet C 等人使用基于 DAML OIL 描述邏輯執(zhí)行術(shù)語(yǔ)推理來(lái)改進(jìn)藥 物警戒系統(tǒng)中信號(hào)檢測(cè);Chen R 等人采用 RBR 方法開(kāi)發(fā)出糖尿病診斷系統(tǒng)以提供用藥建議;CARE-PARNER 系統(tǒng)則是基于CBR給出診斷結(jié)果與治療方案等等 。4)質(zhì)量評(píng)估 。醫(yī)學(xué)領(lǐng)域,本體評(píng)估方法因應(yīng)用場(chǎng)景而異:Clarke 等人使用基于任務(wù)評(píng)估方法來(lái)分析基因本體的從 2004 至 2012 年的性能;Bright 等使用本體設(shè)計(jì)原則和領(lǐng)域?qū)<覍彶橐庖?jiàn) 作為指標(biāo)來(lái)評(píng)估本體在抗生素決策支持系統(tǒng)中的效果;Gordon 等通過(guò)將電子病歷,診斷案例和臨床實(shí)踐等來(lái)構(gòu)造“黃金標(biāo)準(zhǔn)”來(lái)評(píng)估,改進(jìn)傳染疾病本體 BCIDO等 。
為方便用戶進(jìn)行本體評(píng)估和加快本體評(píng)估自動(dòng)化進(jìn)程,本體評(píng)估工具封裝了評(píng)估方法 。不同的工具從不同的視角對(duì)本體的不同指標(biāo)進(jìn)行評(píng)估 。針對(duì)評(píng)估的側(cè)重點(diǎn),選擇合適的工具才能對(duì)本體作出 符合應(yīng)用要求的評(píng)估 。比較常用的本體評(píng)估工具有:ODEval,OOPS,OntoManager,Core等 。除了醫(yī)學(xué)本體,醫(yī)學(xué)知識(shí)圖譜還涵蓋其他復(fù)雜多樣的信息,因此,質(zhì)量評(píng)估還包括對(duì)數(shù)據(jù)質(zhì)量,專(zhuān)家信息,知識(shí)庫(kù)等方面進(jìn)行評(píng)估 。
中文知識(shí)圖譜的構(gòu)建思路是什么?
首先,你需要收集數(shù)據(jù),一般來(lái)說(shuō),知識(shí)圖譜都用在相對(duì)應(yīng)的領(lǐng)域內(nèi),比如說(shuō)醫(yī)療知識(shí)圖 。數(shù)據(jù)是阻礙構(gòu)建圖譜的最大絆腳石,只要有了數(shù)據(jù),利用neo4j或其他一些工具就能比較簡(jiǎn)單的構(gòu)建出圖譜 。數(shù)據(jù)一般有兩種獲取方式,如果你是研究人員,在你的研究領(lǐng)域內(nèi)對(duì)應(yīng)的結(jié)構(gòu)化大數(shù)據(jù)就是主要的數(shù)據(jù)來(lái)源;如果只是興趣,找到你想要構(gòu)建的圖譜的領(lǐng)域的相關(guān)網(wǎng)站,利用爬蟲(chóng)工具對(duì)數(shù)據(jù)進(jìn)行爬取,清洗,整理成比較干凈的數(shù)據(jù)形式,可以存放在關(guān)系數(shù)據(jù)庫(kù)、.csv、.txt等文件中,再利用圖數(shù)據(jù)庫(kù)工具建立知識(shí)圖譜 。

推薦閱讀