注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)計(jì)算機(jī)科學(xué)理論與基礎(chǔ)知識(shí)文本挖掘中若干關(guān)鍵問(wèn)題研究

文本挖掘中若干關(guān)鍵問(wèn)題研究

文本挖掘中若干關(guān)鍵問(wèn)題研究

定 價(jià):¥20.00

作 者: 陸旭 著
出版社: 中國(guó)科學(xué)技術(shù)大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)理論

ISBN: 9787312022807 出版時(shí)間: 2008-12-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 117 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  介紹了文本分類和偏最小二乘回歸,提出了基于變量投影重要性指標(biāo)的文本分類特征選擇方法,論述了偏最小二乘Logistic文本分類模型,闡述了CHTC層次文本分類模型的研究工作,《文本挖掘中若干關(guān)鍵問(wèn)題研究》可供相關(guān)領(lǐng)域科研工作者、大學(xué)高年級(jí)學(xué)生和研究生閱讀。

作者簡(jiǎn)介

暫缺《文本挖掘中若干關(guān)鍵問(wèn)題研究》作者簡(jiǎn)介

圖書目錄

前言
第1章 導(dǎo)論
1.1 研究背景
1.2 文本分類綜述
1.3 本書的內(nèi)容結(jié)構(gòu)
1.4 本書的創(chuàng)新工作
第2章 文本分類概述
2.1 文本分類的數(shù)學(xué)定義
2.2 文本分類任務(wù)的特點(diǎn)
2.3 文本分類系統(tǒng)的組成
2.4 文檔預(yù)處理
2.5 文檔的表示
2.6 常用文本分類模型
2.7 文本分類器學(xué)習(xí)、測(cè)試和評(píng)價(jià)
第3章 偏最小二乘回歸方法的基本理論
3.1 偏最小二乘回歸的發(fā)展歷史
3.2 偏最小二乘回歸的基本原理
3.3 偏最小二乘回歸的基本思想
3.4 數(shù)學(xué)原理
3.5 偏最小二乘回歸的理論算法
3.6 成分?jǐn)?shù)的確定
第4章 基于變量投影重要性指標(biāo)的特征選擇方法研究
4.1 維數(shù)約簡(jiǎn)技術(shù)
4.2 符號(hào)約定
4.3 常用的特征選擇方法
4.4 常用的特征抽取方法
4.5 基于變量投影重要性指標(biāo)的特征選擇方法
4.6 實(shí)驗(yàn)結(jié)果和分析
第5章 偏最小二乘Logistic文本分類模型研究
5.1 Logistic回歸模型
5.2 偏最小二乘Logistic回歸模型
5.3 偏最小二乘Logistic文本分類模型
5.4 實(shí)驗(yàn)結(jié)果和分析
第6章 GHTC層次文本分類模型研究
6.1 層次分類概述
6.2 層次特征選擇
6.3 GHTC層次文本分類模型
6.4 實(shí)驗(yàn)結(jié)果和分析
第7章 總結(jié)與展望
7.1 總結(jié)
7.2 研究展望
附錄1 REUTERS-21578前10個(gè)常見類和前10個(gè)稀有類的前20個(gè)特征VIP值
附錄2 復(fù)旦文本分類語(yǔ)料庫(kù)部分類別的前20個(gè)特征VIP值
附錄3 OHSUMED語(yǔ)料庫(kù)層次結(jié)構(gòu)
附錄4 20 Newsgroups語(yǔ)料庫(kù)各節(jié)點(diǎn)各特征維數(shù)的微平均F1值和宏平均F1值變化情況
參考文獻(xiàn)
后記

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)