본문 바로가기
Project

[R] 사망률 최대 암의 발병 원인 분석

by wave_m 2020. 9. 23.
728x90

 

프로젝트명 : 사망률 최대 암의 발병 원인 분석

진행 기간 : 2020 7월 9일 ~ 2020년 7월 14일(6일)

개발 인원 : 2명

사용 기술 : R

 

 


사망률 최대 암의 발병 원인 분석

 

 

기획 의도 : 한국인 사망 원인이 몇십년 째 암으로 대두되고 있음을 다양한 미디어에서 확인할 수 있다. 공공데이터를 활용하여 암 발병률의 증가 추세와 사망률 1위의 암을 확인하고 해당 암에 관련된 원인 분석을 진행했다.

 

 

암 발병자 수와 사망자 수는 일시적으로 감소하는 경향은 있으나 전체적으로 상승 추세였음을 알 수 있다.

 

 

 

 여러 암종 중에서 폐암이 압도적으로 1위임을 알 수 있다.

 

 

 

또한, 남성, 고연령자의 사망률이 압도적으로 높음을 알 수 있다. 

 

 

(출처 : 대한폐암학회 / 질병관리본부)

 

앞선 그래프를 통해 폐암의 위험성에 대해 다시 인지 할 수 있었고 폐암의 원인에 대해서 조사해본 결과 흔히 아는 흡연 외에도 직업성 및 환경성과 관련이 있다는 자료를 찾을 수 있었다. 그리하여 직업성과 환경성에 따른 폐암의 연관성을 방향으로 잡아 프로젝트를 진행했다.

 

 

(출처 : 울산대학교 대학교 논문)

 

울산대학교 대학원 논문에서 발췌한 자료로 지역별  표준화율비를 나타낸 표인데 서로 다른 인구 그룹간에 연령표준화율의 비(SRR)에 흡연율을 보정한 수치(aSRR)이다.

 

SRR : 서로 다른 인구 그룹 간에 또는 서로 다른 기간 간에 직접 연령표준화율의 비를 조사하는 방법

 

 

이미 정리가 되어 있는 표이기 때문에 전처리가 크게는 필요 없었으나 써보지 않은 gganimation 패키지에서 사용한 enter_grow,enter_fade를 써봤다.

 

 

 

위 코딩을 하게되면 나오는 그래프이다. 울산이 다른 지역에 비해 두드러지는 것을 확인할 수 있다.

 

 

 

논문 내용을 워드클라우드 홈페이지와 R wordcloud2패키지를 이용해 제작했다.

 

(출처 : 건강보험심사평가원)

 

건강보험심사평가원에서 폐암 적정성 평가 1등급을 한 병원을 구글맵으로 마크했다. 보시다시피 서울과 부산에 밀집되어있는걸 알 수 있는데 인구 분포가 많으므로 당연한 결과겠지만 울산은 울산대병원 1곳만 있는걸 확인할 수 있다.

 

 

 

결론 : 최초 진행 당시 사망률 최대 암의 발병 원인에 대해 조사를 하여 폐암의 원인으로 흡연 이외의 직업적 및 환경적 요인과의 관련성을 도출했다. 따라서 울산의 인구대비 폐암발병률이 높았고 폐암 1등급 기관 병원을 조사한 결과 울산은 1곳만 있어서 국가차원에서 추가적인 지원이 필요한 실정이다.

 

 

 

한계점 : 

1) 1년간 발생한 암 등록 통계로서 해마다 암 종에 따른 암 발생률의 변동이 나타나기 때문에 장기적으로 안정된 암 발생률 자료를 얻기 힘듦

 

2) 폐암 발생률을 계산하는데 사용된 국가암등록 DB흡연력을 제시하고 있지 않기 때문에 흡연율을 보정하기 위해서 지역사회 건강조사 원시자료를 이용하여 대체

 


 

Reference ?

 

건강보험심사평가원 자료

http://bitly.kr/dLFCwPhfpOX

 

암 발생 및 사망 현황

http://bitly.kr/TeOskglkxDx

 

워드클라우드 생성기

http://wordcloud.kr/

 

한국 대도시의 10년 누적 폐암 연령표준화발생률 비교(2000-2009): 직업적, 환경적 유해인자와 폐암의 관련성

http://bitly.kr/jpsMdEH23jN

 

 

 

 

 

728x90

'Project' 카테고리의 다른 글

[Python][미니 프로젝트] 2048  (0) 2020.10.12
[Python] 음성인식 비서 'Javis' 프로젝트  (0) 2020.10.12