文本分類和聚類技術是應信息檢索和查詢需要而出現的自然語言處理領域的重要研究課題。文本分類和聚類問題中的特征選擇和抽取技術、文本特征表示、聚類方法的選擇和實現以及分類方法的選擇和實現,都將對文本分類和聚類結果產生極大影響。針對文本分類和聚類中的文本數據的高維性和稀疏性、同義詞和近義詞問題、效率與精確度之間的搭配問題以及參數優(yōu)化問題,《基于遺傳算法的文本分類及聚類研究》提出了使用遺傳算法與傳統(tǒng)分類和聚類方法相結合的思路來進行處理,充分利用了遺傳算法的全局優(yōu)化能力和傳統(tǒng)分類及聚類算法的專業(yè)知識,有效地提高了文本分類和聚類的效率與精度?!痘谶z傳算法的文本分類及聚類研究》可作為自然語言處理專業(yè)和相關專業(yè)人員自學參考書。