본문 바로가기

데이터6

데이터 분류 기법 : DBSCAN 지난 글에 이어서 이번에 쓸 알고리즘은 DBSCAN 입니다. Density-Based Spatial Clustering of Applications with Noise 의 약자라고 하는데, 결론적으로 말해서 클러스터의 갯수를 정하지 않아도 된다라는 거 빼고는 엄청난... 뭐랄까 장점은 없어 보이네요 지난 글에서 클러스터링 기법 중에 가장 기초적인 K-means clustering을 소개했었습니다. 데이터 분류 (클러스터링) 기법 : K-means clustering 데이터 분류 (클러스터링) 기법이 뭐가 엄청 많은데, 이제부터 하나씩 공부해 가면서 정리 겸 블로그에 남기려고 합니다. 그 첫번째로 가장 기초적이고 가장 쉬운 K-means clustering부터 시작해 볼께 guzene.tistory.com.. 2020. 12. 3.
데이터 분류 (클러스터링) 기법 : K-means clustering 데이터 분류 (클러스터링) 기법이 뭐가 엄청 많은데, 이제부터 하나씩 공부해 가면서 정리 겸 블로그에 남기려고 합니다. 그 첫번째로 가장 기초적이고 가장 쉬운 K-means clustering부터 시작해 볼께요 K-means clustering 기법 자체에 대한 설명은 아래 위키피디아를 참조하면 됩니다. k-평균 알고리즘 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. k-평균 알고리즘(K-means clustering algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작 ko.wikipedia.org 위 링크에서 뭐라뭐라 복잡하게 쓰여진 내용을 단순화하고 실제 코드로 어떻게 짰는지 공유하는 내용을 써보.. 2020. 11. 29.
공간 데이터의 이해 - QGIS를 이용한 시각화 지난 시간에 이어서 QGIS를 이용한 시각화를 좀 더 들여다보자. 지난 글 공간 데이터의 이해 - QGIS를 써 보자 공간이란 무엇일까? 보통 3차원 공간이라는 얘기를 많이 하는걸로 봐서는, 우리가 딛는 땅, 하늘, 그리고 지하 이런 것들을 모두 공간이라고 하는 것일 테고, 그러면 공간 데이터라는 건, 공간에 guzene.tistory.com 지난 시간에는 시각화보다는 QGIS가 뭔지, 어떻게 쓰는 건지에 좀 더 초점을 맞춰서 글을 진행했었고, 이번 시간에는 이걸 활용한 무언가에 좀 더 초점을 맞춰서 얘기하려고 한다. 지난 시간에는 전국 데이터를 불러와서 QGIS를 이용해서 지도랑 매칭해보고, 간단히 데이터가 어디있는지를 봤었다. 이번에는 조금 더 자세하게 보기 위해 서울시 데이터만 따로 쪼개고, 서울시.. 2020. 9. 23.
공간 데이터의 이해 - QGIS를 써 보자 공간이란 무엇일까? 보통 3차원 공간이라는 얘기를 많이 하는걸로 봐서는, 우리가 딛는 땅, 하늘, 그리고 지하 이런 것들을 모두 공간이라고 하는 것일 테고, 그러면 공간 데이터라는 건, 공간에 관한 데이터라는 뜻일 거다. 즉, 공간을 정의하는 방식이라고 보면 크게 틀리지 않는다고 보인다. 이 시리즈는 이러한 공간 데이터에 대해서 이제까지 공부한 내용을 정리하는 차원에서, 공간 데이터라는 것의 아주 기초적인 내용을 소개하는 선에서 남기는 글이다. 지난 글에 이어서, 오늘은 QGIS를 사용하는 방법에 대해서 알아보자. * 지난 글 : 공간 데이터의 이해 - 공간 데이터란 무엇일까? 오늘 소개할 내용은 아래와 같다. * QGIS의 설치 * 지도 그림 불러오기 * 공간 데이터 불러오기 * 공간 데이터의 속성 보.. 2020. 9. 16.
공간 데이터의 이해 - 공간 데이터란 무엇일까? 공간이란 무엇일까? 보통 3차원 공간이라는 얘기를 많이 하는걸로 봐서는, 우리가 딛는 땅, 하늘, 그리고 지하 이런 것들을 모두 공간이라고 하는 것일 테고, 그러면 공간 데이터라는 건, 공간에 관한 데이터라는 뜻일 거다. 즉, 공간을 정의하는 방식이라고 보면 크게 틀리지 않는다고 보인다. 이 시리즈는 이러한 공간 데이터에 대해서 이제까지 공부한 내용을 정리하는 차원에서, 공간 데이터라는 것의 아주 기초적인 내용을 소개하는 선에서 남기는 글이다. 위의 사진에서 얼핏 보이듯이, 서울시는 여러 개의 구와, 그걸 더 잘게 쪼갠 동으로 이루어져 있다. 예를 들어 서울시청은 서울특별시 중구에 속해있다. 이 "서울특별시 중구" 라는 걸 나타내 주는 데이터가 뭘까? "서울특별시" "중구" 라는 이름도 그 자체로 데이터.. 2020. 9. 15.
자전거 라이딩 GPS 데이터 분석 자전거 타는 걸 좋아해서, 처음엔 그냥 타다가 언젠가부터 GPS 데이터를 기록하면서 타기 시작했다. 데이터가 좀 쌓여서 내가 어떤 식으로 타고 있나 한 번 볼려고... 앱 깔끔한 인터페이스의 GeoTracker 일단 내가 사용한 앱은 구글의 MyTracks랑 위의 앱이다. 원래는 MyTracks만 쓰다가 올해 4월 30일부로 서비스를 종료한다고 해서..ㅠㅠ 진짜 잘 쓰고 있었는데 아쉽다. 그래서 앱을 이거저거 돌려봤었다. 스트라바(Strava), 엔도몬도(Endomondo), 트랭글, 런타스틱(Runtastic) 등등... 몇 개를 썼는데 위의 어플이 제일 깔끔하고 내 스타일이라 다 지우고 저걸로 결정.. ㅎㅎ 다른 앱들은 뭐 자꾸 이거저거 해보세요 우리꺼 좋아요 SNS에 올리세요 하면서 귀찮게 만들어서.. 2016. 4. 13.