데이터분석 6기/Article_Study

Article Study 3 - 데이터 리터러시&그 데이터는 잘못 해석되었습니다

seyeon1130 2025. 1. 17. 16:01

데이터 리터러시(Data Literacy)를 올리는 방법 | 요즘IT

 

데이터 리터러시(Data Literacy)를 올리는 방법 | 요즘IT

화해팀은 일찍이 데이터의 중요성을 강조해왔는데요. 조직 전반적으로 데이터 활용력을 높이고, 데이터 의사결정 문화를 활성화하기 위해 많은 시도를 해왔습니다. 데이터를 거의 실시간에 가

yozm.wishket.com

[주제]

데이터 리터러시를 올리는 방법

[아티클 요약]

데이터 리터러시 - 데이터를 활용해 문제를 해결할 수 있는 능력 일을 할 때 필요한 데이터 뿐만 아니라 너무 많은 데이터를 보려고 할 때가 있다. 문제정의 - 솔루션 - 측정 지표를 만들어야한다. 이 때 필요한 점은 3가지

 

첫째, 데이터/실험 기반 사고방식 - 모든 업무를 데이터와 실험 기반으로 이루어지게 만들어야한다. → 실험 프로세스와 실험 보드 만들기

 

둘째, 분석 흐름대로 데이터를 탐색할 수 있는 환경

  • 데이터 맵: 분석가 없이는 문제와 솔루션, 지표 간의 관계를 생각하는데 한계까 있음. 따라서 인풋 지표와 아웃풋 지표 간의 관계를 표현한 관계도를 제작한다.
  • 대시보드: 지표의 현재 수준을 확인할 수 있는 환경 만들기, 최상위 문제를 발견하면 관련된 하위 지표들에서 원인 짐작함.

셋 째, 데이터분석가 : 원인 분석 후 액션 아이템까지 도출해 리포트를 제공 받은 협업팀이 실행에 옮기도록 할 수 있음.

  • 지표 설계 및 대시보드 개발
  • 문제 해결을 위한 실험 설계
  • 핵심 지표 모니터링 및 지표 변동의 root cause 분석
  • 실질적인 액션 아이템 제안
  • 데이터 기반 사고와 코칭 및 컨설팅 역할 수행

데이터 플랫폼

  • 데이터 레이크: 원천 데이터 적재
  • 데이터 웨어하우스: 신속하게 정확한 데이터를 추출할 수 있도록 구조화됨
  • 데이터 카탈로그: 데이터레이크/웨어하우스 내 어떤 데이터가 있는지 쉽게 확인할 수 있음

용어 정리

 

데이터 웨어하우스: 구조화된 데이터를 저장하고 분석하기 위한 시스템

데이터 레이크: 다양한 형식의 데이터를 원본 그대로 저장할 수 있는 대규모 데이터 저장소

데이터 카탈로그: 조직 내의 하나 또는 그 이상의 시스템에 위치한 데이터 자산을 검색하고 활용하기 위한 데이터 목록.

 

[인사이트]

이번 내용을 통해 데이터 분석에서 중요한 것은 단순히 데이터를 다루는 기술적인 역량만이 아니라, 문제를 정의하고 해결하는 과정에서 데이터를 효율적으로 활용할 수 있는 사고방식과 프로세스를 구축하는 것임을 다시금 느꼈습니다.


 

그 데이터는 잘못 해석되었습니다 | 요즘IT

 

그 데이터는 잘못 해석되었습니다 | 요즘IT

무엇이든 데이터가 있으면 쉽게 결정을 내릴 수 있을 것 같습니다. 하지만 현업에서는 데이터가 있어도 결정을 내리기 어려운 상황들이 있습니다. 특히 데이터를 통한 의사결정을 내릴 때, 가장

yozm.wishket.com

[주제]

그 데이터는 잘못 해석되었습니다.

[아티클 요약]

데이터를 잘못 해석하는 상황별 유형

  • 생존자 편향의 오류 ex) 총탄자국이 많으니 전투기를 보강한다 -> 총탄자국이 많은데도 무사귀환을 했을 만큼 강력하다
  • 심슨의 역설: 사용자의 성별과 나이에 따라 선호도가 다를 수 있다. 전체 지표와 그룹을 나눈 지표의 방향성이 다르다.
  • 상관관계를 통한 성급한 일반화: 사람은 연관성을 찾고 연결하는 경향이 있어 쉽게 일반화함 ex) 이벤트 페이지를 앞에 두면 매출이 올라간다 -> 매력적인 이벤트를 한다.
  • 목적에 맞지 않는 지표 선택 ex) CTA(유저 행동 유도 버튼)의 클릭 수를 높이려는 목적 지표를 올바르게 선택한다.
  • 세이건 표준 참고하기: 데이터를 올바르게 해석하기 위한 표준

[인사이트] 이번 내용을 통해 데이터를 해석할 때 편향과 오류를 인지하고 주의하는 것이 얼마나 중요한지 깨달았습니다. 데이터는 객관적이지만, 이를 해석하는 과정에서 생기는 생존자 편향, 심슨의 역설, 성급한 일반화와 같은 오류는 잘못된 결론으로 이어질 수 있음을 알게 되었습니다.