• 作者:
    霍朝光
  • 出版時間:
    2021-12-01
  • 出 版 社 :
    清華大學出版社
  • 專著簡介:
    本研究在梳理知識演化、知識生命周期等知識進化理論和思想的基礎上,介紹了引文網絡、Meta-path、PageRank等網絡分析理論和方法,闡述了Word2vec、Doc2vec、Node2vec等深度表示學習模型以及ARIMA、SVM等時間序列模型,以期為科學主題的演化和熱度預測提供理論基礎和方法支撐;以生物醫學與生命科學領域PubMed Central數據全集為例,基于知識圖譜技術構建了一種面向計量相關研究和應用的垂直領域知識圖譜——計量知識圖譜;創新計量指標,計算計量實體的熱度,用熱度值反應主題所處的演化狀態;采用一系列深度學習等方法挖掘科學主題在計量知識圖譜中的特征,分析科學主題的演化規律;基于SVM、ARIMA、LSTM等一系列時間序列模型構建學科主題預測模型,優化、驗證模型,并進行應用研究。讀者對象:高等學校信息科學、情報學、信息管理等相關專業的學生,以及從事科技情報、知識管理、知識服務的實際工作者
  • 專著目錄:

    目錄



    第一章緒論1

    1.1研究背景與意義1

    1.1.1研究背景1

    1.1.2研究意義5

    1.2國內外研究現狀6

    1.2.1主題模型研究6

    1.2.2主題演化研究7

    1.2.3主題預測研究9

    1.2.4知識圖譜11

    1.2.5表示學習13

    1.2.6現狀述評19

    1.3研究內容與方法20

    1.3.1目標與內容20

    1.3.2研究方法26

    1.3.3研究難點28

    1.4研究貢獻29


    第二章理論基礎31

    2.1知識進化論31

    2.1.1知識演化32

    2.1.2知識生命周期33

    2.2網絡分析理論與方法34

    2.2.1引文網絡34

    2.2.2Metapath35

    2.2.3PageRank38

    2.3深度表示學習模型40

    2.3.1Word2vec模型41

    2.3.2Doc2vec模型44

    2.3.3Node2vec模型46

    2.4時間序列模型49

    2.4.1ARIMA模型49

    2.4.2支持向量機模型50


    第三章知識圖譜構建53

    3.1計量知識圖譜內涵53

    3.1.1計量知識圖譜53

    3.1.2動態計量知識圖譜57

    3.2計量實體與關系58

    3.2.1數據下載58

    3.2.2計量實體抽取59

    3.2.3計量實體消歧62

    3.2.4計量實體關系75

    3.3MeSH中的實體與關系77

    3.3.1MeSH知識庫77

    3.3.2MeSH解析78

    3.4計量實體與MeSH實體關聯84

    3.4.1全文檢索Lucene84

    3.4.2基于pylucene的計量實體與MeSH實體關聯85

    3.5計量知識圖譜時間劃分與構建89

    3.6本章小結95


    第四章實體熱度計算97

    4.1熱度計算98

    4.1.1熱度內涵98

    4.1.2基于加權PageRank的熱度計算方法100

    4.2論文熱度計算101

    4.2.1論文熱度內涵101

    4.2.2基于PaperRank的論文熱度計算102

    4.3學科主題熱度計算105

    4.3.1學科主題熱度內涵105

    4.3.2學科主題引證網絡構建106

    4.3.3基于TopicRank的學科主題熱度計算107

    4.4作者熱度計算112

    4.4.1作者熱度內涵112

    4.4.2作者引證網絡構建113

    4.4.3基于AuthorRank的作者熱度計算115

    4.5期刊熱度計算117

    4.5.1期刊熱度內涵117

    4.5.2期刊引證網絡構建118

    4.5.3基于VenueRank的期刊熱度計算120

    4.6本章小結121


    第五章學科主題演化分析123

    5.1學科主題演化123

    5.2學科主題分布126

    5.2.1學科主題的總體分布情況126

    5.2.2有副主題限定詞的主題分布127

    5.2.3無副主題限定詞的主題分布127

    5.3學科主題表示學習129

    5.3.1基于網絡結構的學科主題表示學習129

    5.3.2基于文本內容的學科主題表示學習136

    5.4學科主題聚類和演化分析139

    5.4.1聚類方法概述與選取140

    5.4.2基于Jaccard系數的相似度計算方法142

    5.4.3Methods類主題演化規律144

    5.4.4Drug effect類主題演化規律147

    5.4.5Epidemiology類主題演化規律151

    5.5本章小結155


    第六章學科主題熱度預測157

    6.1學科主題熱度預測157

    6.2學科主題特征選擇159

    6.2.1池化模型159

    6.2.2基于Node2vec和池化模型的學科主題特征選擇162

    6.3基于SVM的學科主題熱度預測168

    6.3.1問題描述169

    6.3.2研究設計169

    6.3.3結果分析172

    6.4基于ARIMA和SVM的學科主題熱度預測179

    6.4.1問題描述179

    6.4.2研究設計179

    6.4.3結果分析181

    6.5本章小結183


    第七章總結與展望184

    7.1研究總結184

    7.2研究不足與展望186


    附錄A動態計量知識圖譜187


    附錄B圖表目錄188


    參考文獻192