데이터분석 6기/Article_Study

Article Study - 양질의 데이터를 판별하는 5가지 방법 2

seyeon1130 2025. 3. 17. 15:53

https://yozm.wishket.com/magazine/detail/1074/

 

양질의 데이터를 판별하는 5가지 방법 : 2 믿을 수 있는 데이터인가? | 요즘IT

데이터 신뢰성이란 데이터가 얼마나 실제 정보를 똑바로 담고 있는가에 대한 개념으로 이해하면 좋습니다. 데이터 자체에 틀린 정보가 담겨있을 수도 있으며, 확실한 값이 아닌 추정 값을 데이

yozm.wishket.com

  • 요약 :

데이터의 신뢰성이란: 데이터가 얼마나 실제 정보를 담고 있느냐

데이터 신리성 관련 단어

  1. 데이터 오류: 실제 정보와 다른 데이터
  2. 데이터 결측: 누락된 데이터

결측 데이터를 처리하는 방법은 삭제와 대체가 있지만 두 방법 모두 최선의 방법이 아님.

최선의 방법은 애초에 데이터를 선택할 때 결측치가 최소화 된 데이터를 다루는 것

  1. 가공데이터 : 원천데이터가 훨씬 신뢰도 높음
  • 주요 포인트 : 데이터 신뢰성을 높이기 위해서는 결측치를 제거하는 등의 가공이 되어있지 않은 원천 데이터를 사용해야 한다.