抄襲檢測研究

定　價：￥98.00

作　者：	孔蕾蕾著
出版社：	科學(xué)出版社
叢編項：
標　簽：	暫缺

購買這本書可以去

ISBN：	9787030601971	出版時間：	2019-06-01	包裝：	平裝
開本：	16開	頁數(shù)：	215	字數(shù)：

內(nèi)容簡介

　　《抄襲檢測研究》以文本的抄襲檢測為研究對象，探索了抄襲檢測的語料庫構(gòu)建、Web環(huán)境下的抄襲源檢索和高模糊抄襲檢測的文本對齊的問題、數(shù)據(jù)、架構(gòu)和模型?！冻u檢測研究》共9章，第1～3章介紹了抄襲檢測的概念、類型和框架，綜述了抄襲檢測的方法；第4章介紹了現(xiàn)有抄襲語料構(gòu)建方法，提出了基于自然標注的抄襲語料構(gòu)建方法；第5和第6章對抄襲源檢索開展研究，描述了基于排序?qū)W習(xí)的源檢索查詢生成模型和關(guān)注檢索結(jié)果聚合性的源檢索過濾模型；第7～9章，對抄襲檢測的文本對齊開展研究，提出了基于排序?qū)W習(xí)的抄襲文本匹配模型、句法和語義交互的釋義文本深度匹配模型以及基于序列標注的文本對齊模型。

作者簡介

暫缺《抄襲檢測研究》作者簡介

圖書目錄

目錄
前言
第1章緒論 1
1.1 研究背景及意義 1
1.2 抄襲檢測的研究現(xiàn)狀及發(fā)展趨勢 2
1.2.1 抄襲檢測任務(wù)簡介 2
1.2.2 抄襲語料構(gòu)建 3
1.2.3 源檢索的查詢生成 5
1.2.4 源檢索的檢索結(jié)果過濾 6
1.2.5 釋義抄襲文本匹配 7
1.2.6 抄襲片段對齊 10
1.3 研究的主要目標、內(nèi)容和結(jié)構(gòu) 12
參考文獻 14
第2章抄襲檢測的概念、類型和框架 20
2.1 引言 20
2.2 文本復(fù)用的概念和方式 20
2.2.1 文本復(fù)用的概念 20
2.2.2 文本復(fù)用的方式 21
2.3 抄襲的概念和歷史 22
2.3.1 抄襲的概念 22
2.3.2 抄襲的歷史 23
2.4 抄襲的類型 24
2.5 抄襲檢測的框架 26
2.5.1 外部抄襲檢測的一般檢索過程 27
2.5.2 抄襲源檢索的過程框架 27
2.5.3 文本對齊的過程框架 29
2.5.4 內(nèi)部抄襲檢測的過程框架 29
2.5.5 跨語言抄襲檢測的過程框架 30
2.6 本章小結(jié) 32
參考文獻 32
第3章抄襲檢測的方法綜述 35
3.1 引言 35
3.2 基于指紋的抄襲檢測方法 35
3.2.1 指紋的生成 36
3.2.2 指紋的匹配 40
3.3 基于詞袋模型的抄襲檢測方法 41
3.4 基于TFIDF模型的抄襲檢測方法 46
3.5 基于n-gram模型的抄襲檢測方法 48
3.6 基于句法的抄襲檢測方法 52
3.7 基于語言連續(xù)表示的抄襲檢測方法 53
3.7.1 基于跨語言明確語義分析的跨語言抄襲檢測方法 53
3.7.2 基于跨語言潛在語義分析的跨語言抄襲檢測方法 54
3.8 本章小結(jié) 55
參考文獻 55
第4章基于自然標注的抄襲語料構(gòu)建方法 60
4.1 引言 60
4.2 現(xiàn)有抄襲語料構(gòu)建方法和問題分析 60
4.2.1 Webis系列抄襲檢測語料庫 61
4.2.2 CPSA語料庫 68
4.2.3 METER語料庫 69
4.2.4 其他語料 71
4.2.5 抄襲檢測語料庫構(gòu)建總結(jié) 77
4.3 基于自然標注的抄襲語料構(gòu)建 80
4.3.1 自然標注的基本思想 80
4.3.2 基于自然標注構(gòu)建抄襲語料的可行性 80
4.3.3 抄襲語料構(gòu)建算法 82
4.3.4 抄襲文本對齊的評價標準 87
4.4 語料質(zhì)量分析 89
4.4.1 數(shù)據(jù)的收集和參數(shù)的設(shè)置 90
4.4.2 數(shù)據(jù)集的統(tǒng)計信息 90
4.4.3 數(shù)據(jù)集質(zhì)量的評價 91
4.5 本章小結(jié) 93
參考文獻 93
第5章基于排序?qū)W習(xí)的源檢索查詢生成模型 98
5.1 引言 98
5.2 查詢對源檢索性能影響分析 99
5.3 基于排序?qū)W習(xí)的源檢索查詢生成框架 101
5.4 構(gòu)建訓(xùn)練數(shù)據(jù) 102
5.5 構(gòu)建查詢生成模型 104
5.5.1 排序備選查詢的學(xué)習(xí)算法 105
5.5.2 排序模型的特征 107
5.6 實驗與分析 109
5.6.1 數(shù)據(jù)集 109
5.6.2 評價指標 109
5.6.3 實驗設(shè)置 111
5.6.4 實驗結(jié)果與分析 113
5.6.5 實驗結(jié)果的進一步討論 118
5.7 本章小結(jié) 119
參考文獻 120
第6章關(guān)注檢索結(jié)果聚合性的源檢索過濾模型 122
6.1 引言 122
6.2 源檢索過濾問題分析 123
6.2.1 源檢索中分類模型和排序模型的判別能力分析 123
6.2.2 源檢索結(jié)果的聚合性分析 124
6.3 基于聚合性的源檢索過濾 126
6.3.1 源檢索過濾的排序?qū)W習(xí)框架 126
6.3.2 基于邏輯回歸的排序?qū)W習(xí)算法 127
6.3.3 關(guān)注檢索結(jié)果聚合性的源檢索過濾模型 129
6.4 實驗與分析 131
6.4.1 數(shù)據(jù)集 131
6.4.2 評價指標 131
6.4.3 實驗設(shè)置 132
6.4.4 實驗結(jié)果與分析 136
6.5 本章小結(jié) 141
參考文獻 142
第7章基于排序?qū)W習(xí)的抄襲文本匹配模型 143
7.1 引言 143
7.2 抄襲文本匹配的問題分析 144
7.3 基于排序?qū)W習(xí)的抄襲檢測文本匹配 145
7.3.1 抄襲文本匹配模型 145
7.3.2 抄襲文本匹配的排序?qū)W習(xí)算法 148
7.3.3 基于METEOR評價指標的特征 149
7.4 實驗與分析 150
7.4.1 數(shù)據(jù)集 151
7.4.2 評價指標 151
7.4.3 實驗設(shè)置 152
7.4.4 實驗結(jié)果與分析 153
7.5 本章小結(jié) 163
參考文獻 164
第8章句法和語義交互的釋義文本深度匹配模型 166
8.1 引言 166
8.2 釋義文本匹配分析 167
8.3 句法和語義交互的釋義文本深度匹配 171
8.3.1 釋義文本深度匹配模型概述 171
8.3.2 基于張量交互句法和語義的句子表達 172
8.3.3 基于卷積神經(jīng)網(wǎng)的釋義句匹配 173
8.3.4 融合詞匯特征的釋義文本深度匹配模型 176
8.4 實驗與分析 177
8.4.1 數(shù)據(jù)集 177
8.4.2 評價指標 180
8.4.3 實驗設(shè)置 181
8.4.4 實驗結(jié)果與分析 184
8.5 本章小結(jié) 188
參考文獻 188
第9章基于序列標注的文本對齊模型 192
9.1 引言 192
9.2 抄襲文本對齊問題分析 193
9.3 基于序列標注的文本對齊 196
9.3.1 文本對齊的機器學(xué)習(xí)框架 196
9.3.2 模型選擇 197
9.3.3 基于條件隨機場的抄襲文本對齊模型 199
9.4 實驗與分析 203
9.4.1 數(shù)據(jù)集 203
9.4.2 實驗設(shè)置 204
9.4.3 實驗結(jié)果與分析 205
9.5 本章小結(jié) 209
參考文獻 209
結(jié)論 212
彩圖