본문 바로가기

분류3

데이터 분류 기법 : DBSCAN 지난 글에 이어서 이번에 쓸 알고리즘은 DBSCAN 입니다. Density-Based Spatial Clustering of Applications with Noise 의 약자라고 하는데, 결론적으로 말해서 클러스터의 갯수를 정하지 않아도 된다라는 거 빼고는 엄청난... 뭐랄까 장점은 없어 보이네요 지난 글에서 클러스터링 기법 중에 가장 기초적인 K-means clustering을 소개했었습니다. 데이터 분류 (클러스터링) 기법 : K-means clustering 데이터 분류 (클러스터링) 기법이 뭐가 엄청 많은데, 이제부터 하나씩 공부해 가면서 정리 겸 블로그에 남기려고 합니다. 그 첫번째로 가장 기초적이고 가장 쉬운 K-means clustering부터 시작해 볼께 guzene.tistory.com.. 2020. 12. 3.
데이터 분류 (클러스터링) 기법 : K-means clustering 데이터 분류 (클러스터링) 기법이 뭐가 엄청 많은데, 이제부터 하나씩 공부해 가면서 정리 겸 블로그에 남기려고 합니다. 그 첫번째로 가장 기초적이고 가장 쉬운 K-means clustering부터 시작해 볼께요 K-means clustering 기법 자체에 대한 설명은 아래 위키피디아를 참조하면 됩니다. k-평균 알고리즘 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. k-평균 알고리즘(K-means clustering algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작 ko.wikipedia.org 위 링크에서 뭐라뭐라 복잡하게 쓰여진 내용을 단순화하고 실제 코드로 어떻게 짰는지 공유하는 내용을 써보.. 2020. 11. 29.
공간 데이터의 이해 - 내추럴 브레이크 (Natural Breaks) 이제까지 공간 정보를 다루면서 가장 기초적인 부분들에 대해 내가 공부한 만치, 그리고 가능한 한 자세하게 설명하려고 했고 이제 여기까지 해서 크게 하나의 꼭지가 마무리될 것 같다. Natural Breaks? 내추럴 브레이크란 지난 글에서 잠시 언급했을 텐데, 공간 정보가 눈에 잘 들어오게 하기 위한 방법 중에 하나라고 했었다. 사실은 이런 질문에서 시작한다. 위처럼 산발적으로 배치된 숫자들을 10개의 그룹으로 분류한다고 생각해보자. 그러면 각 숫자들은 어느 그룹으로 끼어 들어가야 가장 "올바른" 분류가 될까? 이렇게 분류된 그룹을 색깔로 나타내면 그것이 바로 시각화가 될 것이다. 이건 사실 "올바른" 이라는 말이 잘못됐다. 그때그때 상황에 따라 맞는 방법이 다르기 때문인데, 이런 분류 작업을 할 경우에.. 2020. 10. 17.