본문 바로가기

클러스터링3

데이터 분류 기법 : 계층적 클러스터링 오늘 알아볼 것은 클러스터링 기법 중에 계층 (Hierarchy) 을 이용해서 군집화를 수행하는 계층적 클러스터링입니다. 영어로는 Hierarchical Clustering이라고 해요. 데이터 간의 관계 클러스터링을 말하기에 앞서, 데이터 간의 관계에 대해 지난 글에서 이야기한 점을 다시 한 번 짚고 넘어가겠습니다. 지난 글에서 이야기한 내용을 요약하자면 다음과 같습니다. 1. 위 8개의 데이터는 직관적으로 4개씩 묶을 수 있는 것처럼 보인다. 2. 그 근거는, 데이터 상호 간의 "거리"를 관계로 규정하고, 관계성이 높은 것끼리 묶은 것이다. 이렇게 우리가 머리 속으로 직관적으로 할 수 있는 클러스터링을 기계가 했던 것이 k-means clustering이라고도 말씀드렸어요. 관련 글은 아래와 같습니다... 2021. 1. 10.
데이터 분류 기법 : DBSCAN 지난 글에 이어서 이번에 쓸 알고리즘은 DBSCAN 입니다. Density-Based Spatial Clustering of Applications with Noise 의 약자라고 하는데, 결론적으로 말해서 클러스터의 갯수를 정하지 않아도 된다라는 거 빼고는 엄청난... 뭐랄까 장점은 없어 보이네요 지난 글에서 클러스터링 기법 중에 가장 기초적인 K-means clustering을 소개했었습니다. 데이터 분류 (클러스터링) 기법 : K-means clustering 데이터 분류 (클러스터링) 기법이 뭐가 엄청 많은데, 이제부터 하나씩 공부해 가면서 정리 겸 블로그에 남기려고 합니다. 그 첫번째로 가장 기초적이고 가장 쉬운 K-means clustering부터 시작해 볼께 guzene.tistory.com.. 2020. 12. 3.
데이터 분류 (클러스터링) 기법 : K-means clustering 데이터 분류 (클러스터링) 기법이 뭐가 엄청 많은데, 이제부터 하나씩 공부해 가면서 정리 겸 블로그에 남기려고 합니다. 그 첫번째로 가장 기초적이고 가장 쉬운 K-means clustering부터 시작해 볼께요 K-means clustering 기법 자체에 대한 설명은 아래 위키피디아를 참조하면 됩니다. k-평균 알고리즘 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. k-평균 알고리즘(K-means clustering algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작 ko.wikipedia.org 위 링크에서 뭐라뭐라 복잡하게 쓰여진 내용을 단순화하고 실제 코드로 어떻게 짰는지 공유하는 내용을 써보.. 2020. 11. 29.