경향신문 데이터저널리즘팀 다이브는 젠더기획 <우리가 명함이 없지 일을 안했냐>에서 활용한 데이터와 분석 방법을 독자 여러분께 공개합니다. 독자 여러분의 신뢰를 구하는 동시에, 저희 스스로 한 뼘 더 나아지려는 노력의 일환입니다.

1화 1954년 32만명의 딸들이 태어났다

[젠더기획]1954년 32만명의 딸들이 태어났다

54년생 여성의 노동사


1954년생 여성의 노동과 관련한 데이터를 수집하기 위해 1970년부터 2020년까지 5년 단위 경제활동인구조사 마이크로데이터를 활용했습니다. 1954년생 여성이 만16세인 1970년부터 현재까지입니다. 조사 대상을 5세 단위로 묶은 것은 경제활동인구조사 마이크로데이터(※가입해야 이용 가능) 가중값이 연령 5세별을 단위로 산정돼 있기 때문입니다.

54년생의 노동사를 추적하기 위해 연도마다 분석 대상 연령대를 옮겨가며 데이터를 수집했습니다. 예를 들어 1970년에는 15~19세 여성 데이터를, 1975년에는 20~24세 여성 데이터를 들여다보는 식입니다. 1981년 이전에는 경제활동인구조사 마이크로데이터가 없어 한국통계연감, KOSIS 경제활동인구조사를 활용했습니다.

분석에 활용한 마이크로데이터 코드


데이터 수집 과정에서 가장 어려웠던 지점은 통계 작성을 시작한 후 시간이 흐르며 집계 기준이 계속 바뀐다는 점이었습니다. 마이크로데이터에서 임금근로자를 추출하는 방식도 매년도마다 달랐습니다. (수차례 문의에도 친절히 방법을 알려주신 통계청 고용통계과에 감사의 마음을 전합니다.)

Untitled

마이크로데이터에서 활용한 코드는 다음과 같습니다.

1)임금근로자

경제활동분류가 취업자이고 종사상지위가 상용근로자, 임시근로자, 일용근로자인 사람

81년, 85년 | 경제활동분류(취업자) 코드: 11, 12, 13 & 종사상지위 코드: 22, 23

90년, 95년 | 경제활동분류(취업자) 코드: 11, 12 & 종사상지위 코드: 21, 22, 23

2000년 이후 | 경제활동분류(취업자) 코드: 1 & 종사상지위 코드: 1, 2, 3