계량 분석을 하려고 데이터를 다룰 때에 자료 검증 방법


231
views
0
6 months ago by
Anonymous

raw 데이터를 불러오고 stata를 이용하여 코딩하는 것을 연습하고 있습니다.
이 과정에서 사소한 것들이 궁금한데,
1. 자료를 제대로 불러왔는지, 불러온 자료 코딩이 제대로 되었는지 어떻게 검증할 수 있을 까요?
   raw 데이터를 불러왔고 라벨도 잘 달려있긴합니다만, 기초통계량 등이 맞게 된건지 실수가 없는지 불안합니다.
  혹시 기초통계량을 검증하기 위한 팁이 있으시면 알려주시면 좋겠습니다.

2. bk컨퍼런스 때 살짝 소개되었는데, stata do파일을 다루는데 괜찮은 에디터 소개해주시면 좋겠습니다.


1번과 2번은 질문의 성격이 다르므로 2번은 별도의 질문으로 해 주는 것이 좋겠네요.
written 6 months ago by ch079  

1 Answer


2
6 months ago by
ch079  
원래 데이터가 엑셀 포맷이라고 한다면, 1번에 대해서 제가 자주 사용하는 방법은 (i) Stata에서 import하는 코드에 오류가 없는지 눈으로 확인, (ii) 엑셀과 Stata를 둘 다 열어 놓고 전체적으로 눈으로 비교하는 방법(missing 부분을 주의깊게 보아야 함), (iii) 변수별로 표본크기와 표본평균을 계산해서 엑셀과 스타타 양쪽이 일치하는지 확인, (iv) Stata와 R 두 가지로 import를 한 다음 Stata와 R의 결과가 동일한지 확인인데, 보통은 네 가지 모두를 하거나 (i)과 (iv)를 합니다(엑셀을 잘 사용하지 않기 때문에).

명쾌한 해설 감사드립니다.
missing 부분을 주의깊게 봐야 한다는 점, 기초 통계량을 통해 비교한다는 점 등 정확한 답변 감사드립니다.

written 5 months ago by Jonghyuck Yang  
2
고맙다는 이야기는 안 해도 됩니다. ^^ 그리고 답이 되었으면 답으로 채택하든지 아니면 upvote를 해 주면 좋습니다. :)
written 5 months ago by ch079  
Please login to add an answer/comment or follow this question.

Similar posts:
Search »
  • 계량기초부터 공부하고 있습니다.
    노동경제학을 전공하고 있습니다. 전공과 다르더라도 따라 해볼 수 있는 논문이 있다면 추천 부탁드리겠습니다. 당연히 raw 대이터가 공개 되어야 합니다. 경재학애서 중요...