知識(shí)發(fā)現(xiàn)是從數(shù)據(jù)集中抽取和精化新的模式的過(guò)程,基于數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD))是知識(shí)發(fā)現(xiàn)研究的主體和熱點(diǎn),而聚類(lèi)知識(shí)發(fā)現(xiàn)又是知識(shí)發(fā)現(xiàn)的重要方面。如何有效處理巨量、高維的數(shù)據(jù),是當(dāng)前聚類(lèi)分析的關(guān)鍵技術(shù)。本書(shū)圍繞高維數(shù)據(jù)的聚類(lèi)問(wèn)題展開(kāi)研究,在討論高維數(shù)據(jù)相似I生尤其是高維二元數(shù)據(jù)相似性定義的基礎(chǔ)上,提出了基于粗圖模型的硬聚類(lèi)和軟聚類(lèi)算法、高維二元數(shù)據(jù)的映射聚類(lèi)算法、基于螞蟻行為的聚類(lèi)算法等,并進(jìn)一步提出基于映射聚類(lèi)的離群點(diǎn)檢測(cè)方法;還特別討論了高維聚類(lèi)結(jié)果的表示方法問(wèn)題,提出了應(yīng)用粗糙集高效表達(dá)聚類(lèi)結(jié)果的方法;最后探討了聚類(lèi)知識(shí)發(fā)現(xiàn)數(shù)據(jù)建模的基本步驟,給出了聚類(lèi)知識(shí)發(fā)現(xiàn)的典型應(yīng)用案例。本書(shū)學(xué)術(shù)性、知識(shí)性并重,可供從事數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教學(xué)、研究的師生、學(xué)者閱讀,也可以為從事數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)系統(tǒng)等軟件工程技術(shù)人員提供參考。