부동산 실거래가 데이터
- data 폴더에는 국토교통부에서 공개하는 부동산 실거래가 공개시스템에서 다운받은 데이터가 있습니다.
- 2020년 4월 6일 ~ 4월 10일 사이에 다운받았습니다. 따라서 데이터의 성격상 최근 데이터는 원본 자체가 추가되거나 수정될 수 있습니다.
- 정확한 최신 데이터가 필요하신 분은 아래 실거래가 사이트에서 조회하거나 다운받으시기 바랍니다.
- 2019년 6월 이후로 거래일이 상세하게 표기되도록 변경되었습니다. 조회해보니 과거의 데이터들도 모두 새로운 기준에 맞춰 수정되어 있고, 여기에 올려둔 데이터는 거래일이 상세한 데이터입니다.
- 각데이터의 시점은 아래와 같습니다.
- 매매 데이터는 2006년 부터
- 전월세 데이터는 2011년 부터
- 분양권 데이터는 2007년 6월 29일부터.
- 지속적인 업데이트 계획은 없습니다.
-
원본 데이터는 csv 형식이라 콤마와 따옴표가 들어가 있습니다. 따옴표 제거하고 tsv (탭으로 구분) 형식으로 변경하였습니다.
-
거래가격 숫자에서 천의 자리를 구분한 콤마를 제거했습니다.
-
기타 한 자리 공백이나 문자열 안에 tab이 포함되어 있던 것들을 제거했습니다.
-
나머지는 원본 그대로입니다. 원본에 null 값의 처리가 여러가지로 되어 있으니 필요에따라 직접 작업해야 합니다.
-
원본 데이터에는 모든 파일마다 아래의 내용이 상단에 삽입되어 있습니다. 모두 제거하고 아래에 옮겨둡니다.
- 본 서비스에서 제공하는 정보는 법적인 효력이 없으므로 참고용으로만 활용하시기 바랍니다.
- 신고정보가 실시간 변경, 해제되어 제공시점에 따라 공개건수 및 내용이 상이할 수 있는 점 참고하시기 바랍니다.
- 본 자료는 계약일 기준입니다. (※ 7월 계약, 8월 신고건 → 7월 거래건으로 제공)
- 통계자료 활용시에는 수치가 왜곡될 수 있으니 참고자료로만 활용하시기 바라며, 외부 공개시에는 반드시 신고일 기준으로 집계되는 공식통계를 이용하여 주시기 바랍니다.
- 국토교통부 실거래가 공개시스템의 궁금하신 점이나 문의사항은 콜센터 1588-0149로 연락 주시기 바랍니다.
- 코드매칭용테이블.tsv을 이용하면 원본 데이터의 주소 문자열을 법정동 코드로 바꿀 수 있습니다.
- [원본] 항목에는 데이터 원본에 존재하는 주소 문자열이 들어 있습니다.
- [매칭용 처리후] 항목에는 code.go.kr 에 올라와 있는 법정동 코드의 주소가 들어 있습니다. [원본]과 같은 것 같지만 다른 것들도 다수 있습니다.
- [법정동 코드]는 해당 법정동의 10자리 코드입니다. code.go.kr의 2020년 4월 자료를 바탕으로 작업했습니다.
- 고유PNUXY.tsv 파일에는 실거래가 데이터에 존재하는 주소들의 고유값에 대해 지오코딩을 통해 추출한 좌표가 들어있습니다.
- 전월세전환율_202003.tsv 파일에는 월세가를 전세로 전환시킬 수 있는 전월세 전환율이 들어 있습니다.
- 아파트, 연립주택, 단독주택은 국가통계포털의 지역별 전월세 전환율 자료를 이용했습니다.
- 오피스텔 전월세 전환율은 KB주택가격동향의 오피스텔 자료를 이용했습니다.
-
원본 데이터를 바탕으로 pnu값과 공간좌표를 부여한 파일이 있습니다.
-
지번이 별표처리된 원본 데이터는 법정동 중심점으로 공간좌표를 부여했습니다.
-
거래 건수(count 항목)에 비례하게 좌표를 주변으로 랜덤하게 발생시켰습니다.
-
기타 자세한 내용은 다음의 글을 참고하시기 바랍니다.
- data 폴더의 자료를 사용할 경우 출처는 국토교통부 실거래가로 표기하시면 됩니다. 별다른 처리를 하지 않은 자료입니다.
- dataRefined의 자료를 사용할 경우 출처를 국토교통부에 덧붙여 이 곳 Github 주소로 동시에 표기해주시기 바랍니다.
- ref 폴더의 자료는 원본으로부터 선택적으로 추출하여 가공한 자료입니다. 앞에서 언급한 원본 출처 이외의 별도의 출처 표기는 필요 없으나 오류가 있을 수 있으므로 각자의 책임하에 사용해주시기 바랍니다.