본문 바로가기

프로젝트/(데이터분석)공공데이터분석

(1) 공공데이터 분석하기 - 데이터 선정

인터넷에서 구할 수 있는 데이터를 분석해 새로운 인사이트를 제안해보자.

 

우선 사용할 데이터를 선정해야한다!

 

한국인으로 태어난 이상 집값에 관심이 많기도 하고,

최근 큰 변동폭을 보인 점이 흥미로워서 한국의 주택가격 추이 데이터를 분석할 데이터로 선정했다.

 

주택가격은 지금까지 계속 상승 해왔고, 이 상승 폭이 지역별로 얼마나 차이 나는지 그리고 삶에 얼마나 와 닿는지 통계적으로 분석하고 시각적으로 표현하는 것이 본 프로젝트의 목적이다.

 

 

부동산가격 분석 사례

  1. 빅데이터를 활용한 글로벌 부동산 가격 분석
    정책 연구 위원회 주택 가격에 영향을 미치는 45가지 변수에 대해 글로벌 부동산 가격을 분석했다. 
    http://www.kiep.go.kr/sub/view.do?bbsId=global_econo&nttId=203460
  2. 주택가격의 추이와 지역 간 파급 여부 분석 한국은행 지역의 주택가격 변화가 다른 지역에 미치는 영향을 분석했다. SURADF 단위 근 검정 방법을 이용. 80년대 중반 ~ 2008년 데이터 기반 자료라는 한계 때문에 활용하기는 힘들지만 분석 방법이나 과정은 눈여겨볼 만 하다.
    http://www.kahps.org/data/_research/201803/15208449428858.pdf
  3. 文정부, 박근혜 정부 때보다 다주택자 더 늘어…집값 연간 상승률 9년만에 ‘최고치’ 外
    (본 프로젝트는 어떠한 정치적 견해를 담고 있지 않습니다.)
    뉴스에서는 통계청의 통계를 다음처럼 이용한다 "과거 ~와 비교하면 최고치..." 그리고 집값상승률과 청약경쟁률이 어떤 연관성을 갖는지 언급 하지는 않지만, 청약 경쟁률이 매우 높은 수치를 기록하며 집을 구하기 힘들어지는 세태를 강조하고 있다.
    http://www.youthdaily.co.kr/news/article.html?no=53445

3번의 사례는 분석 보고서가 아닌 뉴스 기사이기 때문에 전문적 검증 과정은 생략되어 있지만, 기사의 신뢰성이 떨어진다는 느낌을 받았다. 이처럼 다른 통계 수치를 통해 기존 데이터를 뒷받침 하는 방법은 데이터 간의 관계를 엄밀히 분석하는 과정이 필요할 것 같다. 

 

 

우선 공동주택실거래가격지수를 2006년부터 2020년까지 월별로 분석한 데이터를 그래프로 시각화해보았다.

 

주택실거래가격추이(사진변경 전)

시각화한 데이터를 간단하게 분석해보면,

1. 2009년에 주택실거래 가격이 급락했다.

2. 2018년에 주택실거래 가격이 겹치는 때가 있었다.

3. 2006년부터 2020년까지 전 지역에서 실거래가격이 상승했다.

 

간단히 분석해보았지만, 상당히 흥미로운 부분을 여럿 찾을 수 있었다. 주제선정이 꽤 잘 된 것 같다 :)