注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計Python文本分析(原書第2版)

Python文本分析(原書第2版)

Python文本分析(原書第2版)

定 價:¥129.00

作 者: [印度] 迪潘簡·薩卡爾(Dipanjan Sarkar) 著,閆龍川,高德荃,李君婷 譯
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標 簽: 暫缺

ISBN: 9787111666776 出版時間: 2020-10-01 包裝: 平裝
開本: 16開 頁數(shù): 429 字數(shù):  

內(nèi)容簡介

  面對自然語言處理和文本分析應(yīng)用,解決問題的正確技術(shù)是什么?文本摘要如何真正有效?哪些才是解決多類文本分類的框架?《Python文本分析(原書第2版)》通過將數(shù)學(xué)和理論概念與現(xiàn)實用例的Python實現(xiàn)相結(jié)合,全面介紹了文本分析的相關(guān)概念、技術(shù)、工具及實踐,可幫助你快速掌握文本分析技術(shù),解決實際問題?!禤ython文本分析(原書第2版)》首先介紹與文本分析相關(guān)的自然語言基本概念以及Python語言的特點、特性和常用功能,然后結(jié)合示例代碼詳細闡述文本理解與處理、文本分類、文本摘要、文本相似度與聚類、語義與情感分析等內(nèi)容。通過《Python文本分析(原書第2版)》,你可以全面掌握文本分析的基礎(chǔ)技術(shù)和機器學(xué)習的一些經(jīng)典方法,包括SVM、貝葉斯分類器、k-均值聚類、層次聚類等,為進一步的學(xué)習和研究奠定基礎(chǔ)?!禤ython文本分析(原書第2版)》介紹了Python中的自然語言處理(NLP),以及如何設(shè)置健壯的環(huán)境來完成文本分析。《Python文本分析(原書第2版)》本版基于NLP的新趨勢對上一版進行了重大的修改,并引入幾個重要的變化和新的主題。你將通過實際案例了解如何使用Python中的先進NLP框架,配合機器學(xué)習和深度學(xué)習模型進行有監(jiān)督的情感分析?!禤ython文本分析(原書第2版)》首先回顧了Python以及字符串和文本數(shù)據(jù)相關(guān)的NLP基礎(chǔ)知識,接著介紹了文本數(shù)據(jù)的工程表示方法,包括傳統(tǒng)的統(tǒng)計模型和新的基于深度學(xué)習的嵌入模型。《Python文本分析(原書第2版)》中還討論了文本解析和處理方面的改進技術(shù)與新方法?!禤ython文本分析(原書第2版)》對文本摘要和主題模型的內(nèi)容進行了全面改寫,展示了如何在有趣的數(shù)據(jù)集-NIPS會議論文數(shù)據(jù)集上下文中構(gòu)建、調(diào)整和解釋主題模型。此外,《Python文本分析(原書第2版)》通過一個電影推薦系統(tǒng)實例介紹了文本相似度技術(shù),以及使用有監(jiān)督和無監(jiān)督技術(shù)的情感分析?!禤ython文本分析(原書第2版)》還有一章專門討論語義分析,你將看到如何從頭開始構(gòu)建自己的命名實體識別(NER)系統(tǒng)。雖然本版的總體結(jié)構(gòu)保持不變,但整個代碼庫、模塊和章節(jié)都已更新到Python3.x版本。

作者簡介

  迪潘簡·薩卡爾(Dianjan Sarkar)是紅帽(Red Hat)公司的數(shù)據(jù)科學(xué)家、暢銷書作者、顧問和培訓(xùn)師。他曾在多家初創(chuàng)公司以及《財富》500強公司(如英特爾)任職并提供咨詢服務(wù),主要致力于利用數(shù)據(jù)科學(xué)、高級分析、機器學(xué)習和深度學(xué)習來構(gòu)建大規(guī)模智能系統(tǒng)。他擁有數(shù)據(jù)科學(xué)和軟件工程專業(yè)的碩士學(xué)位,是自學(xué)教育和大規(guī)模開放在線課程的堅定支持者。他目前涉足開源產(chǎn)品領(lǐng)域,致力于提高全球開發(fā)人員的生產(chǎn)力。閆龍川,碩士,國家電網(wǎng)公司信息通信分公司高級工程師,信息通信技術(shù)專家,主要從事電力信息通信系統(tǒng)運行管理工作,研究興趣包括深度學(xué)習、強化學(xué)習、自然語言處理、云計算及數(shù)據(jù)中心管理等。高德荃,博士,國家電網(wǎng)公司信息通信分公司高級工程師,主要從事電力信息通信系統(tǒng)運行分析工作,研究興趣包括機器學(xué)習與數(shù)據(jù)科學(xué)、地理空間分析等。李君婷,碩士,國家電網(wǎng)公司信息通信分公司工程師,主要從事電力信息通信運維數(shù)據(jù)統(tǒng)計分析、項目管理等工作,研究興趣包括機器學(xué)習、數(shù)據(jù)挖掘、顛覆性創(chuàng)新等。

圖書目錄

譯者序
推薦序
前言
致謝
作者簡介
技術(shù)審校者簡介
第1章 自然語言處理基礎(chǔ)
1.1 自然語言
1.1.1 什么是自然語言
1.1.2 語言哲學(xué)
1.1.3 語言習得和用法
1.2 語言學(xué)
1.3 語言句法和結(jié)構(gòu)
1.3.1 單詞
1.3.2 短語
1.3.3 從句
1.3.4 語法
1.3.5 語序類型學(xué)
1.4 語言語義
1.4.1 詞匯語義關(guān)系
1.4.2 語義網(wǎng)絡(luò)和模型
1.4.3 語義表示
1.5 文本語料庫
1.5.1 文本語料庫標注及使用
1.5.2 流行的語料庫
1.5.3 訪問文本語料庫
1.6 自然語言處理
1.6.1 機器翻譯
1.6.2 語音識別系統(tǒng)
1.6.3 問答系統(tǒng)
1.6.4 上下文識別與消解
1.6.5 文本摘要
1.6.6 文本分類
1.7 文本分析
1.8.機器學(xué)習
1.9 深度學(xué)習
1.1 0本章小結(jié)
第2章 Python自然語言處理
2.1 了解Pvthon
2.2 Python之禪
2.3 應(yīng)用:何時使用Pymon
2.4 缺點:何時不用Pymon
2.5 Python的實現(xiàn)和版本
2.6 建立強大的Python環(huán)境
2.6.1 用哪個Python版本
2.6.2 用哪個操作系統(tǒng)
2.6.3 集成開發(fā)環(huán)境
2.6.4 環(huán)境設(shè)置
2.6.5 軟件包管理
2.6.6 虛擬環(huán)境
2.7 Python語法和結(jié)構(gòu)
2.8 使用文本數(shù)據(jù)
2.8.1 字符串文字
2.8.2 表示字符串
2.8.3 字符串操作和方法
2.9 基本的文本處理和分析:綜合案例
2.1 0自然語言處理框架
2.1 1本章小結(jié)
第3章 處理和理解文本
3.1 文本預(yù)處理和整理
3.1.1 刪除HTML標簽
3.1.2 文本標記解析
3.1.3 刪除重音字符
3.1.4 擴展縮寫詞
3.1.5 刪除特殊字符
3.1.6 大小寫轉(zhuǎn)換
3.1.7 文本校正
3.1.8 詞干提取
3.1.9 詞形還原
3.1.10 刪除停用詞
3.1.11 將以上整合在一起——構(gòu)建文本規(guī)范器
3.2 理解文本句法和結(jié)構(gòu)
3.2.1 安裝必要的依賴項
3.2.2 機器學(xué)習的重要概念
3.2.3 詞性標注
3.2.4 淺層解析或分塊
3.2.5 依存關(guān)系解析
3.2.6 成分結(jié)構(gòu)解析
3.3 本章小結(jié)
……
第4章 用于文本表示的特征工程
第5章 文本分類
第6章 文本摘要和主題模型
第7章 文本相似度和聚類
第8章 語義分析
第9章 情感分析
第10章 深度學(xué)習的前景

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號