일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 스타트업독서노트
- 새파란
- 안철수
- 라이브코딩테스트
- 개발자면접
- 주니어개발자
- 360시간만에개발자되기
- 로버트마틴
- 2021년회고
- 글또회고
- 개발자취업
- 데이터과학자의일
- 360시간만에개발자
- 회고
- 박영선
- 구글트렌드
- 2021년의 #봄여름가을겨울
- 데이터분석
- 데이터분석가채용
- 국회데이터시각화
- 데이터분석가
- 데이터시각화
- 신입개발자
- 네이버트렌드
- 글또6기회고
- 국민의힘경선
- 데이터과학자진로
- 데이터분석공부
- 데이터분석가준비
- 서울시장
- Today
- Total
NEWBLUE's
새파란 데이터 이야기를 시작하며 - 데이터 시각화 디자인 리뷰 본문
데이터 분석과 시각화 관련 공부를 본격적으로 해보고자 관련 서적 10~20권 내외를 읽고 리뷰하는 시간을 가져보려고 한다.
첫 번째 책은 '데이터 시각화 디자인'이다.
컨설턴트 출신의 저자가 썼기에, 굉장히 '고객 중심 사고'가 돋보이는 책이었다.
1~2장에는 저자가 생각하는 데이터 시각화의 기본이 나와 있었다. 인상적인 부분을 정리하였다. (요약은 아닙니다) 사실 Tableau 같은 BI tool을 사용하게 되면 자연스럽게 아래와 같은 원칙을 접하게 되긴 한다.
데이터 시각화의 기본 - 디자인 원칙들
- 색상 분류 파악하기
- 순차적 / 확산적 / 카테고리 / 하이라이트
- 하지만 최대한 색은 제한하고, 변화를 주고 싶은 부분을 채도로 표현하는 것을 권장
- 배경은 흰색, 회색, 검은색 권장
- 배경 / 강조 / 경고에 알맞은 적절한 색 선택 및 비율 고려
- 데이터 유형 분류 파악하기
- 카테고리 / 순서 데이터 / 양적 데이터
- 인지 부하 낮추기 ( 데이터-잉크 비율, 게슈탈트 법칙)
- 텍스트 사용
- 꼭 차트로만 시각화를 필요는 없다
- BAN(Big A$$ Numbers) - 중요한 건 크게
당연하다고 생각되는(?) 것들도 많았지만, 그 와중에 종종 새로운 개념들을 확인할 수 있었다.
그리고 다음 3장에서 데이터를 어떻게 표현할지 구체적인 다양한 시각화의 사례를 보여준다. 자세한 예가 많지만, 어차피 외울 수도 없을 테니 가볍게 살펴보았다. 대신 막대그래프와 선 그래프에 대한 내용만 정리해두었다.
그래서 어떻게 표현할 것인가?
- 결국 질문 정의가 가장 중요
- 시각화 하는 이유 -> 사람이 구체적인 결과물을 볼 때 비로소 구체적인 판단을 할 수 있기 때문에
- 양, 비율, 흐름, 시간 추이, 분포, 순위, 관계성, 차이, 지리공간 등에 따라 적절히 표현하기
- 양 - 막대그래프
- 0부터 시작하도록 그리기
- 막대 간격 사이 일정하게
- 3d 막대 / 생략 물결선은 지양
- (데이터와 상관없이) 분위기 때문에 그래프 사용하는 것 지양
- 3개의 축 -> 색이나 다른 방식으로 표현
- 라벨과 막대 방향 통일
- 막대 순서 의식. 순서 없는 카테고리라면 정렬 권장
- 막대를 3개 이상 붙여서 나열하면 부하 발생! 주의
- 시간 추이 - 선 그래프
- 가로축 왜곡하지 않기
- 스파게티 차트 피하기 (색깔 강조, 영역 차트, 스파이크 라인 등)
- 막대그래프 + 선 그래프 조합
- 이중축은 가급적 지양
- 축 위아래 분할
사실 이런 건 공식이나 정답이 있는 것은 아니다. (아까 디자인의 원칙도 마찬가지) 대신 '몰라서 못 그리는 경우'는 없어야 하므로 다양한 시각화 사례를 접해보면 좋겠다.
필자(=저, 새파란) 의 경우에는 보통 데이터를 조금 살펴본 후, 엑셀이나 Tableau로 빠르고 다양한 방식으로 시각화하는 편이다. 때로는 Plotly나 D3 같은 페이지에서 레퍼런스를 찾은 후 비슷하게 표현할 때도 있다.
예술에 가까운 다양한 데이터 시각화도 많긴 하다. 하지만 결국 시각화 자체가 목적이 되면 인지 부하가 높아지거나, 오히려 시간 대비 성과 측면에서 배보다 배꼽이 더 큰 경우가 생긴다. 그래서인지 (이 책의 저자를 포함해) 막대 그래프 / 선 그래프로 대부분의 분석이 가능하다고 하는지도 모르겠다. 물론 '데이터 분석'이 아닌 '데이터 시각화 자체'가 목적인 경우는 전혀 다른 이야기다.
대시보드 그리기
- 대시보드의 2가지 종류
- 중립적인 탐색형 대시보드
- 명확한 의견을 가지고 있는 설명형 대시보드
- 불필요한 정보보단 여백 권장
- 시선 방향 고려하기
- 텍스트를 꼭 다 뺄 필요는 없다
- 초보는 화려하게 시각화를 하려고 하지만, 결국 과도한 힘을 뺀 깔끔한 시각화가 좋을 수도
- 디지털 매체에서는 읽는 사람의 환경(모바일, pc)까지 고려하기
필자의 경우에도 데이터 시각화를 할 때 '관점' 유무에 따라서 난이도가 엄청나게 달라졌던 것 같다. 관점이 없으면 중립적이므로 최대한 디자인적 요소에만 신경 써서 시각화를 진행하면 된다. (위의 탐색형 대시보드의 예)
하지만 분명 '명확한 관점'이 필요한 경우가 있다. 그럴 경우에는
- 데이터를 자유롭게 살펴보면서 먼저 어떤 관점을 가질지 생각하기
- 정해진 관점에 따라 데이터를 어떻게 사용할지 정하고, 또 표현하기
- 표현물이 의도에 맞는지, 오류는 없는지 검증하기
의 작업을 계속 반복해야 하기에 시간이 더 오래 걸리고, 신중해진다.
마지막 5장에서는 '데이터 기반 문화'를 만들어나가기 위해 저자가 여러 의견을 제시한다.
데이터 기반 문화를 위하여
- 오디언스 생각하기 (임원, 실무자, 영업사원 등)
- 일관성 유지 - 데이터 시각화도 템플릿 필요
- 구체적인 피드백 주고받기 - 시각화는 결국 커뮤니케이션하기 위한 것
- 대시보드 구성 (p205)
- 표층 부분 - 비주얼 디자인
- 구조 - 배치 레이아웃
- 오디언스 분석 흐름 - 대시보드 흐름, 인터랙션
- 스코프 - 초점을 맞출 영역, 사양
- 전략 - 대시보드의 대상 오디언스와 그 질문
- 결국 전략과 스코프가 탄탄해야 좋은 대시보드가 나올 수 있다
- 데이터 기반 문화 만들기 (p220)
- 작게 거둔 성공을 사내에 선언한다.
- 같은 성공 패턴이 늘어난다.
- 데이터 활용을 기업의 이익으로 만들고자 하는 일부 경영진이 데이터 활용 추진에 앞장선다.
- 다른 패턴으로 데이터를 활용하기 위한 예산을 확보하기 쉬워진다.
- 성공 예제를 닮고 싶은 사람들이 같은 패턴을 이용해 반복적으로 성공 예제를 만든다.
스타트업에서 일하고 있기에, 약간 기시감이 들었다. 저자는 '데이터 시각화'를 흔히 스타트업에서 말하는 '제품'과 비슷하게 접근한다.
아무도 사용하지 않는 서비스를 만드는 건 쓸모없는 일인 것처럼, 아무도 보지 않는 시각화를 만드는 것 역시 의미가 없다. 그렇기에 계속 피드백을 주고받으면서, 시각화의 방향이 맞는지 검증하라고 권한다. 또 '완벽한 시각화'를 하는 것보단 시각화를 우선 완성하고 피드백을 거쳐서 다듬어가는 것을 권한다. (보통 스타트업들이 하고 있는 방식이다)
'데이터 기반 문화를 만드는 것' 역시 스타트업처럼 접근한다. 결국 작은 성공들이 모여 기업의 문화를 바꿀 수 있다. 비슷하게 데이터 분석 공부를 할 때도 작은 성공들이 모이면, 언젠간 데이터를 더 잘 활용할 수 있게 될 것 같다. (그렇기에 데이콘이나 쏘프라이즈 같은 플랫폼을 자주 활용해도 좋겠다)
다시 발견한, 새파란 데이터 이야기의 방향성
(p226) 데이터 시각화 기술은 이 모든 것이 높은 수준으로 융합되었을 때 비로소 얻을 수 있습니다.
- 데이터 전처리 및 사전 정형 기술
- 계산, 통계 관련 지식
- 데이터 시각화 기술 및 경험
- 데이터 분석 기술 활용 경험
- 비즈니스 도메인 지식 및 경험
- 강도 높은 사고에 견디는 능력
이번 새파란 데이터 이야기 리뷰를 위한 서적을 다양하게 고른 이유도 위와 비슷했다. (물론 책만 읽는다고 능사는 아니겠지만, 분명 안 읽는 것보단 나을 것이라 믿어봅니다ㅎㅎ)
어쨌든, 가볍게 데이터 시각화 전반에 대해서 생각할 수 있는 책이었다. 예정대로 앞으로 꾸준히 아래 목록 도서들을 리뷰할 예정이다.
(추천해주셔도 좋습니다:D)
새파란 데이터 이야기 리뷰 예정 도서 목록 (변경 될 수도 있습니다)
통계 / 데이터 분석 전반 관련
- 밑바닥부터 시작하는 데이터 과학 (2판)
- 데이터 과학을 위한 통계 (2판)
- 파이썬으로 배우는 통계학 교과서
- 비즈니스를 위한 데이터 과학
데이터 분석 관련
- 데이터 분석의 힘
- 데이터 애널리틱스
데이터 시각화 관련
- 데이터 시각화 디자인 - 2021.08.14
- 데이터 시각화 교과서
- 대시보드 설계와 데이터 시각화
- 윌스트리트저널 인포그래픽 가이드
- 데이터가 한눈에 보이는 시각화
기타 데이터 / 논리 등 인문 도서
- 새빨간 거짓말, 통계
- 팩트풀니스
- 틀리지 않는 법 - 수학적 사고의 힘
- 로지컬 씽킹
- 논리의 기술
- 생각에 관한 생각
(본 게시물의 링크로 도서를 구매하시게 되면 yes24로부터 소정의 커미션을 지급받을 수 있습니다. 특정 출판사의 책 광고는 아니니 안심하셔도 됩니다:D )
'새파란 데이터 이야기' 카테고리의 다른 글
프로답게 일하고 있나요? - 클린 코더 리뷰 (0) | 2021.11.06 |
---|---|
데이터 분석가 잔혹사 - 데이터 분석가의 숫자유감 리뷰 (0) | 2021.09.10 |