NEWBLUE's

[국회 데이터 시각화] plotly와 함께하는 대한민국 의회민주주의 발전사 - 어느 국회의원이 영향력이 있을까? 본문

데이터 분석가가 되자, 지금 당장!

[국회 데이터 시각화] plotly와 함께하는 대한민국 의회민주주의 발전사 - 어느 국회의원이 영향력이 있을까?

newblue 2020. 12. 20. 19:30
반응형

본 게시물은 데이콘 대회에 제출하였던 코드를 기반으로 작성되었습니다 :)

 

plotly와 함께하는 대한민국 의회민주주의 발전사 - 어느 국회의원이 영향력이 있을까?

국회 입법활동 빅데이터 시각화 경진대회

dacon.io

안녕하세요. 새파란입니다.
데이터 시각화 공부도 할 겸 겸사겸사 위의 대회를 나가게 되었는데요.

평소에 matplotlibseaborn 만 써봤었는데, plotly가 깔끔해서 앞으로도 자주 이용할 것 같다는 생각이 드네요.

plotly 그래프를 티스토리에 올리기가 생각보다 쉽지 않은 것 같은데, 추가로 해당 내용들이 계속 변경될 수 있어 우선 이번 포스팅에서는 대회 및 플랫폼 소개와 그 전반적인 과정에 대해서 알아보도록 하겠습니다. 결과물은 본 포스팅 위와 아래에 있는 링크에서 확인하실 수 있습니다:)
(티스토리에도 jupyter notebook 플러그인이 있으면 좋을 것 같은데, 답답하면 제가 만들게 될지도 모르겠네요 )


1. 데이콘 소개

우선 데이터 관련 가장 유명한 플랫폼인 캐글이 대기업이라면, 데이콘은 약간 비슷한 길을 걷고자 하는 스타트업 느낌입니다. 
항상 참가해야지 해야지 했다가 드디어 최근부터 참가를 시작하게 되었습니다. 이 전에 소설 작가 분류 AI 경진대회를 참여했었는데 (전에 관심이 없었던) NLP 관련 이론들에 대해 익숙해질 수 있는 좋은 계기였습니다.

2. 대회 소개

이번 대회의 목적은 (공지에서 참조했습니다.)

- 국회 활동이 쉽고 명확하게 보이도록 시각화

- 국회 활동에 대한 일반인의 관심을 제고할 수 있는 인사이트 발굴

이었습니다. 정당별 분류 혹은 인사이트는 많은 분들께서 해주시고 계신 것 같았기에, 저는 개개인의 국회의원을 조명하고 싶었습니다. 따라서 한때 유튜브에서 즐겨봤던 네고왕/발명왕 시리즈와 엮어서 국회 입법과 관련한 부문별로 '왕'을 뽑아보기로 했습니다. 

1. 네트워크왕
2. 입안왕
3. 통과왕
4. ??왕 (업데이트예정)

분명 우리 생활과 국회는 아주 밀접한 관련이 있는데, 그 사실을 자주 까먹고 살아가는건 아닐까요?

 

3. 사용한 라이브러리 소개

데이터 분석의 기본적인 pandas 라이브러리, 네트워크 분석시에 자주 사용하는 networkx 라이브러리, 그리고 위에서 언급했던 plotly 라이브러리를 사용했습니다.

plotly 라이브러리는 친해지는 중인데, (모든 기술이 다 그렇겠지만) 잘 쓸려면 시간이 조금 필요하겠네요. 
plotly.graph_object 로 직접 설정을 해주기에는 번거로울 때가 많은데, plotly.express 를 이용하면 함수 하나로 그래프를 그릴 수 있습니다. 저도 많이 애용했습니다ㅎ.ㅎ

 

 

이렇게 함수로 만들고 나서, 네트워크 시각화를 하면 어떤 모습일까요?

대회 코드 공유 게시물 페이지에서 확인하실 수 있습니다 :)
(참고로 아직 대회가 끝나지 않아서, 계속 업데이트될 예정입니다)

 

plotly와 함께하는 대한민국 의회민주주의 발전사 - 어느 국회의원이 영향력이 있을까?

국회 입법활동 빅데이터 시각화 경진대회

dacon.io

반응형