麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學院 > 開發設計 > 正文

K-均值聚類算法(K-means algorithm)

2019-11-06 06:32:33
字體:
來源:轉載
供稿:網友
k-means clustering is a method of vector quantization, originally from signal PRocessing, that is popular for cluster analysis in data mining. k-means clustering aims to partition n observations into k clusters in which each observation belongs to the cluster with the nearest mean, serving as a prototype of the cluster. This results in a partitioning of the data space into Voronoi cells.The problem is computationally difficult (NP-hard); however, there are efficient heuristic algorithms that are commonly employed and converge quickly to a local optimum. These are usually similar to the expectation-maximization algorithm for mixtures of Gaussian distributions via an iterative refinement approach employed by both algorithms. Additionally, they both use cluster centers to model the data; however, k-means clustering tends to find clusters of comparable spatial extent, while the expectation-maximization mechanism allows clusters to have different shapes.

The algorithm has a loose relationship to the k-nearest neighbor classifier, a popular machine learning technique for classification that is often confused with k-means because of the k in the name. One can apply the 1-nearest neighbor classifier on the cluster centers obtained by k-means to classify new data into the existing clusters. This is known as nearest centroid classifier or Rocchio algorithm.

此算法的主要作用:屏幕上很多的點,把相鄰的點聚到離他最近的點。k-means algorithm算法是一個聚類算法,把n個對象根據他們的屬性分為k個分割,k < n。它與處理混合正態分布的最大期望算法很相似,因為他們都試圖找到數據中自然聚類的中心。

聚類(clustering),其實本質就是尋找聯系緊密的事物,把他們區分出來。如果這些事物較少,人為的就可以簡單完成這一目標。但是遇到大規模的數據時,人力就顯得十分無力了。所以我們需要借助計算機來幫助尋找海量數據間的聯系。聚類過程中有一個關鍵的量,這個量就是標識兩個事物之間的關聯度的值,稱為相關距離度量(distance metrics),之前的兩篇博文相似性度量、皮爾遜相似性系數 都是計算這種距離度量的方法。根據實際情況的不同,選擇不同的適用的度量方法。這一點十分重要,直接影響聚類的結果是否符合實際需要和情況。K-均值聚類(K-Means Clustering)這個是經典的聚類算法,無論時間復雜度還是空間復雜度都是比較好的。這個算法的名稱已經說明了算法的核心意圖,會對數據進行K個類別的聚類。算法過程就是:1、在數據集里隨機選K個點,當作每個類別的中心點(你也可以通過一定方法選擇K個點)2、通過距離度量,把數據集里的所有點根據距離遠近分配給這K個中心點(即數據分給最近的一個中心點),組成一個類別,即獲得K個類別。3、在獲得的K個類別里進行均值計算,算出新的中心點(根據需求進行不同模型的均值計算,一般就是選個中心點使相應聚類里的所有點到這個點的距離和最小),把得到的中心點替換各個類別的K點值。4、判斷新獲得的一組K值是否和上一次的一組K值相同,如果不同則跳到第2步。如果相同則完成了聚類過程。

http://lib.csdn.net/article/machinelearning/35217

http://blog.pureisle.net/archives/1982.html

http://blog.csdn.net/garfielder007/article/details/51476104

http://blog.csdn.net/abcjennifer/article/details/8170687

1. C++標準模板庫從入門到精通 

http://edu.csdn.net/course/detail/3324

2.跟老菜鳥學C++

http://edu.csdn.net/course/detail/2901

3. 跟老菜鳥學python

http://edu.csdn.net/course/detail/2592

4. 在VC2015里學會使用tinyxml

http://edu.csdn.net/course/detail/2590

5. 在Windows下SVN的版本管理與實戰 

 http://edu.csdn.net/course/detail/2579

6.Visual Studio 2015開發C++程序的基本使用 

http://edu.csdn.net/course/detail/2570

7.在VC2015里使用protobuf協議

http://edu.csdn.net/course/detail/2582

8.在VC2015里學會使用MySQL數據庫

http://edu.csdn.net/course/detail/2672


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 精精国产xxxx视频在线野外 | 国产三级精品最新在线 | 国产一国产一级毛片视频在线 | 国产91精品一区二区麻豆亚洲 | 国产 视频 一区二区 | 成年免费观看视频 | 国产91对白叫床清晰播放 | www.guochan | 久久精品日产第一区二区三区 | 国产精品99久久久久久宅女 | 成人 日韩 | 国产成人高潮免费观看精品 | 依依成人精品视频 | 国产一级毛片高清视频完整版 | 成人在线视频精品 | 精品一区二区三区欧美 | 91av亚洲| 在线看一区二区三区 | 欧美中文字幕一区二区 | 免费午夜视频 | 欧美成人免费电影 | 国产亚洲精品综合一区91555 | av在线一区二区三区四区 | 成人在线观看免费高清 | 91看片在线播放 | 中文字幕一二三区芒果 | 9999精品| 91久久国产综合久久91精品网站 | 色视频在线播放 | 欧美日韩1区2区3区 黄片毛片一级 | 欧美日本中文字幕 | 久久免费视频精品 | 久久久久久久一区二区三区 | 亚洲天堂ww | 国产欧美亚洲精品a | gril hd | 欧美成人一区免费视频 | 久久99精品久久久久久国产越南 | xxxx69hd一hd| 羞羞网站在线看 | 欧美成年人在线视频 |