일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 새파란
- 구글트렌드
- 2021년회고
- 데이터과학자의일
- 360시간만에개발자되기
- 데이터시각화
- 국회데이터시각화
- 개발자면접
- 글또회고
- 2021년의 #봄여름가을겨울
- 360시간만에개발자
- 개발자취업
- 안철수
- 데이터분석가채용
- 데이터과학자진로
- 스타트업독서노트
- 데이터분석
- 박영선
- 회고
- 국민의힘경선
- 데이터분석가
- 데이터분석가준비
- 데이터분석공부
- 신입개발자
- 글또6기회고
- 서울시장
- 라이브코딩테스트
- 로버트마틴
- 네이버트렌드
- 주니어개발자
- Today
- Total
NEWBLUE's
데이터 분석가 잔혹사 - 데이터 분석가의 숫자유감 리뷰 본문
원래 리뷰 예정 목록에는 없었지만, 흥미로운 신간을 발견했다. 만화로 되어 있어서 빠르게 읽을 수 있지만, 나름 생각해볼 내용이 많다.
여러분, 제가 발표를 하나 들었어요. '빅데이터' 시대에 맞게, 우리도 '데이터가 흐르는 조직'으로 변화해서 '데이터 기반 의사결정'이 실시간으로 이루어지는 시스템을 추구해보면 어떨까요? A/B 테스트 하는 것 너무 멋있던데, 우리 조직도 이번에 제가 추진했던 B 기능 출시 전에 A/B테스트 해보고 (결국 B로) 결정해봐요~
라고 제안하는 무서운(?) 분이 나타난다면 조심스럽게 이 책을 쥐어주면 좋을 것 같다. 데이터 기반 의사 결정이나 A/B 테스트가 의미 없다는게 아니라, 결국 뭐든 '제대로 알고 사용해야' 의미가 있다는 것이다. 아니라면, 결국 시간도 돈도 의견도 감정도 전기도 낭비일 뿐이니.
(머신러닝 프로젝트에서도, 제일 먼저 머신러닝을 사용하지 않는 방법은 없는지 검토하라고 들었다)
혹시 하고 싶은 말을 하기 위해 데이터를 사용하고 있진 않나요?
목차를 보면 알 수 있듯이, 상관관계와 인과관계, 확률, 실험, 그래프, 별점, 평균 등 '익숙한 용어들'이 등장한다. 각 용어들에 대해서 오해하게 되면서 회사 안에서 여러가지 상황들이 벌어진다.
'저러면 안되지~ㅎㅎ'라고 생각하지만 동시에 나를 돌아보았다. 나도 단순 상관관계를 인과관계로 오해한 적은 없는지, A/B 테스트는 모든 상황에서 무조건 해야 한다고 생각한 적은 없는지, 추세선을 대충 그려놓고 R-제곱 값 상관없이 뇌피셜 예측을 내린 적은 없는지, 사용자가 직접 입력하는 데이터에 대해 절대적으로 신뢰한 적은 없는지, 포괄적인 서술은 없는지, 데이터를 통한 결론이 아니라 '개인적인 직관'을 증명하기 위해 보고 싶은 데이터만 보는 것은 아닌지 등 계속 생각해보게 된다. 더 이상 셀 손가락이 없다.
회사에 데이터 분석가가 톡 떨어진다면
만화에는 상대적으로 귀엽게(?) 순화되어 표현되었지만, 읽는 내내 저자분의 슬픔과 고통이 절절하게(?) 느껴졌다. 데이터 분석가인 책의 캐릭터는 의사결정을 내리는 주체라기보단, 조언(서포트 혹은 컨설팅)을 하는 경우가 많다. ('데이터 분석가'에 대해 기대하는 역할도 다 다르기에, 회사마다, 팀마다, 개인마다 다를 수 있습니다.)
'서포터'의 한계가 느껴지기도 했지만, 어쩌면 '서포터'들이 모여 바꾼 회사도 분명 있을 것이다. 없다면 제보주세요 데이터 분석가나 데이터 팀의 존재만으로 회사에 갑자기 데이터 기반 문화가 생기지는 않을테고, 아마 직전 데이터 시각화 디자인에서 읽은 것처럼, 작은 성공을 통해 조금씩 문화를 만들어가는 수 밖에 없을 것이다. (그만큼 보람도 있겠지)
결국 문화가 완성되어 '데이터 분석을 실무에 필요한 정도로 적절히 잘 사용하는 기획자, 개발자, 임원, 마케터 등'이 생긴다면 데이터 분석가는 크나큰 보람을 느끼게 될 것 같다. 하지만 역설적으로 이럴 경우에 순수 '데이터 분석가'의 존재 이유는 무엇일까? 어쩌면 데이터 분석가의 궁극적인 목적은 데이터 분석가가 필요없는 조직을 만드는 것일지도 모르겠다. (데이터 엔지니어링 및 데이터 사이언티스트 직무는 결이 조금 다를 수 있다.)
불확실한 세상이기에 확실한 결론은 더 조심히
데이터로 말하는 것은, 어쩌면 무언가를 확신하는 말을 아끼게 되는 것인지도 모른다. (p329)
어쩌다 보니 요즘 데이터를 기반으로 하는 글을 계속 쓰고 있다. 마감기한이 있어서 계속 제출하는 편이지만, 늘 그렇듯 낼 때마다 조금씩 아쉽다. (물론 크래프톤 김창한 대표가 '혁신은 제약에서 나온다'라고 말했을 땐 격하게 공감했다.)
분명 어디선가 말하기와 글쓰기의 원칙은 간결한 문장이라고 들었다. 하지만 내 글은 보통 '~같다', '~듯하다', '~처럼 보인다', '일지도 모른다', '~할 확률이 높다', '우선 ~ 여겨진다', '어쩌면', '아마' 처럼 틀릴 수도 있다는 가정(혹은 방패)을 기본으로 하고 있다. 정말 확실한 것이 아닌 이상, 확실하게 말하지 않는다는 비슷한 의견을 읽을 수 있어서 반가웠다. (물론 자신이 없어 보이는 워딩은 늘 고민이고 어떻게 하면 'A 같다'를 'A 다'라고 말할 수 있을지 연구한다.)
데이터 기반 글이나 보고서의 독자들은 궁금한 것(혹은 처음에 바랐던 사실에 대한 확신)을 하나부터 끝까지 속 시원하게 짚어주는 '데이터 오마카세'를 바라고 있을 수도 있다. '그래서 결론이 뭔데?' 정말 엄밀하게 준비해서 글을 쓰거나 아니면, 적당히 낚시성 글을 쓰면 가능할지도 있겠다. 하지만 오히려 세상엔 확실한 게 많이 없기에 재료를 잘 손질한 '데이터 뷔페'를 차려놓고, 특정 부분에 같이 논의해보는 것도 나쁘지 않은 방법으로 여겨진다. (이상 그래프 십수 개를 포함하고 마음에 드는 것 골라서 쓰세요~ 라는 취지의 글에 대한 변명이었습니다.)
백엔드 개발 반, 데이터 분석 반 업무를 하고 있는 내가 나중에 어떤 길로 가게 될 진 모르겠지만 어쨌든, 이 책이 널리 널리 퍼졌으면 좋겠다. 스타트업 기획자/경영자 필독서!
새파란 데이터 이야기 리뷰 예정 도서 목록 (변경 될 수도 있습니다)
통계 / 데이터 분석 전반 관련
- 밑바닥부터 시작하는 데이터 과학 (2판)
- 데이터 과학을 위한 통계 (2판)
- 파이썬으로 배우는 통계학 교과서
- 비즈니스를 위한 데이터 과학
데이터 분석 관련
- 데이터 분석가의 숫자 유감 - 2021.09.09
- 데이터 분석의 힘
- 데이터 애널리틱스
데이터 시각화 관련
- 데이터 시각화 디자인 - 2021.08.14
- 데이터 시각화 교과서
- 대시보드 설계와 데이터 시각화
- 윌스트리트저널 인포그래픽 가이드
- 데이터가 한눈에 보이는 시각화
기타 데이터 / 논리 등 인문 도서
- 새빨간 거짓말, 통계
- 팩트풀니스
- 틀리지 않는 법 - 수학적 사고의 힘
- 로지컬 씽킹
- 논리의 기술
- 생각에 관한 생각
(본 게시물의 링크로 도서를 구매하시게 되면 yes24로부터 소정의 커미션을 지급받을 수 있습니다. 특정 출판사의 책 광고는 아니니 안심하셔도 됩니다:D )
'새파란 데이터 이야기' 카테고리의 다른 글
프로답게 일하고 있나요? - 클린 코더 리뷰 (0) | 2021.11.06 |
---|---|
새파란 데이터 이야기를 시작하며 - 데이터 시각화 디자인 리뷰 (0) | 2021.08.14 |