python聚類算法怎么選擇

發布時間：2021-07-29 13:37:08 來源：億速云閱讀：139 作者：chen 欄目：編程語言

本篇內容介紹了“python聚類算法怎么選擇”的有關知識，在實際案例的操作過程中，不少人都會遇到這樣的困境，接下來就讓小編帶領大家學習一下如何處理這些情況吧！希望大家仔細閱讀，能夠學有所成！

說明

1、如果數據集是高維度的，選擇譜聚類是子空間的一種。

2、如果數據量是中小型的，比如在100W條以內，K均值會是更好的選擇；如果數據量超過100W條，可以考慮使用MiniBatchKMeans。

3、如果數據集中有噪聲(離群點)，使用基于密度的DBSCAN可以有效解決這個問題。

4、若追求更高的分類準確性，則選擇譜聚類比K均值準確性更好。

實例

import numpy as np
import matplotlib.pyplot as plt
 
 
# 數據準備
raw_data = np.loadtxt('./pythonlearn/cluster.txt') # 導入數據文件
X = raw_data[:, :-1] # 分割要聚類的數據
y_true = raw_data[:, -1]
 
print(X)

“python聚類算法怎么選擇”的內容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站，小編將為大家輸出更多高質量的實用文章！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python聚類算法怎么選擇

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python聚類算法怎么選擇

猜你喜歡

最新資訊

相關推薦

相關標簽