데이터분석 6기/Article_Study

Article Study 양질의 데이터를 판별하는 5가지 방법 5

seyeon1130 2025. 4. 1. 09:25

양질의 데이터를 판별하는 5가지 방법 : 5 목적에 적합한 데이터인가? | 요즘IT

 

양질의 데이터를 판별하는 5가지 방법 : 5 목적에 적합한 데이터인가? | 요즘IT

사실 좋은 데이터라고 매번 쓰이는 것은 아니며 좋지 않은 데이터라고 절대 사용되지 않는 것은 아닙니다. 양질의 데이터라는 것은 상황에 따라, 분석 목적에 따라 변화하기 마련입니다. 결국

yozm.wishket.com

  • DIKW 피라미드 이론 데이터, 정보, 지식, 지혜 앞 글자만 딴 것으로 데이터는 DIKW로 바뀌어 활용성을 띄게 된다. 데이터 속에서 바로 지혜를 얻는 것이 아닌 정보, 지식의 단계를 거쳐야 지혜를 얻을 수 있다. 데이터 분석가들은 보통 '이 데이터도 언젠가는 활용하겠지' 라고 생각하지만 그렇지 않은 경우가 많으므로 애초에 저품질의 데이터를 판별하고 분석 해야한다.
  • 데이터 VS 분석가 숙련된 데이터 분석가는 숨어있는 작은 정보도 놓지지 않고 인사이트를 도출한다. 누군가에겐 쓸모없는 종이일지라도 누군가에게는 소중한 지식이 되는 것과 같다.
  • 머신러닝을 이한 데이터 머신러닝을 위해서는 데이터 양이 많아야 한다. 하지만 그보다 더 중요한 것은 데이터에 종속 변수가 있어야 한다는 점이다. 종속 변수: 관심 대상이 되는 데이터
  • 인사이트 도출을 위한 빅데이터 빅데이터 활용은 머신러닝, 인사이트 활용 방법은 빅데이터를 사용하는 것이다.

인사이트: 데이터는 누가 활용하냐에 따라 달라질 수 있다. 또한 분석 방법이 명확하지 않으면 데이터 품질을 논할 수 없다