데이터분석 6기/Article_Study 19

Article Study - A/B테스트 제대로 이해하기 3

A/B 테스트 제대로 이해하기: 3 A/B 테스트 계산기의 세팅과 해석 | 요즘IT A/B 테스트 제대로 이해하기: 3 A/B 테스트 계산기의 세팅과 해석 | 요즘IT앞선 두 편의 글에서, ‘실제 A/B 테스트를 설계할 때 우리가 진짜 궁금한 질문’과 ‘A/B 테스트 실험 결과의 유의미한 방안’, 그리고 ‘이를 바탕으로 A/B 테스트의 설계 및 해석에 필요한 기초yozm.wishket.com 구글 옵티마이저: A/B테스트 툴, 전환율과 더불어 표본 크기에 따른 유의미한 결과 해석에 도움을 줌 A/B테스트 툴을 사용하지 않고, 파이썬을 사용하지 않고도 간단한 입력만으로도 계산을 제공하는 웹사이트가 존재한다.(ABTest Guide)A/B-Test Calculator - Power & Significance..

Article Study A/B테스트 제대로 이해하기 1 -2

A/B 테스트 제대로 이해하기: 1테스트를 설계할 때 우리의 진짜 질문은? | 요즘IT A/B 테스트 제대로 이해하기: 1테스트를 설계할 때 우리의 진짜 질문은? | 요즘IT서비스 기획, PM, 그리고 그로스 해킹과 관련한 부트캠프나 신입 교육 과정을 살펴보면, A/B 테스트에 관한 이야기가 많다. 아마도 서비스를 개선하는 실험 방안 중 하나로 A/B 테스트가 가장 유명(yozm.wishket.comA/B 테스트 제대로 이해하기: 2A/B 테스트를 위한 기초 통계 이해하기 | 요즘IT A/B 테스트 제대로 이해하기: 2A/B 테스트를 위한 기초 통계 이해하기 | 요즘IT앞선 글에서 A/B 테스트를 설계하거나 수행할 때 ‘목표를 달성하기 위한 방안으로 A와 B 중 어느 게 더 나은가?’ 뒤에 숨은 진짜 질..

Article Study - 엑셀로 온라인 서비스의 RDB 이해하기

비개발자를 위한 엑셀로 이해하는 SQL: 1 엑셀로 온라인 서비스의 RDB 이해하기 | 요즘IT 비개발자를 위한 엑셀로 이해하는 SQL: 1 엑셀로 온라인 서비스의 RDB 이해하기 | 요즘ITVOD 강의부터 부트캠프에 이르기까지, SQL(Structured Query Language, 데이터베이스 시스템에서 자료를 처리하는 용도로 사용되는 구조적 데이터 질의 언어)의 수요가 늘고 있다. 이제는 비단 백엔드 엔yozm.wishket.com요약비전공자들은 데이터를 다루는 게 처음인 것처럼 느껴지지만 사실 아님. 옛날부터 우리는 엑셀이라는 관리 솔루션으로 데이터를 다루고 있었다. 엑셀의 핵심 기능은 데이터의 기록과 관리엑셀과 RDBMS의 DB는 사실 동일하다. 하나의 시트 내에는 행과 열의 구조로 이루어진 표..

Article Study 양질의 데이터를 판별하는 5가지 방법 5

양질의 데이터를 판별하는 5가지 방법 : 5 목적에 적합한 데이터인가? | 요즘IT 양질의 데이터를 판별하는 5가지 방법 : 5 목적에 적합한 데이터인가? | 요즘IT사실 좋은 데이터라고 매번 쓰이는 것은 아니며 좋지 않은 데이터라고 절대 사용되지 않는 것은 아닙니다. 양질의 데이터라는 것은 상황에 따라, 분석 목적에 따라 변화하기 마련입니다. 결국yozm.wishket.comDIKW 피라미드 이론 데이터, 정보, 지식, 지혜 앞 글자만 딴 것으로 데이터는 DIKW로 바뀌어 활용성을 띄게 된다. 데이터 속에서 바로 지혜를 얻는 것이 아닌 정보, 지식의 단계를 거쳐야 지혜를 얻을 수 있다. 데이터 분석가들은 보통 '이 데이터도 언젠가는 활용하겠지' 라고 생각하지만 그렇지 않은 경우가 많으므로 애초에 저품질..

Article Study - 양질의 데이터를 판별하는 5가지 방법 3

https://yozm.wishket.com/magazine/detail/1096/ 양질의 데이터를 판별하는 5가지 방법 : 3 관계형 데이터베이스인가? | 요즘IT보통 빅데이터의 특성을 이야기할 때 3V라는 단어를 언급하는 경우가 많습니다. Velocity(속도), Volume(양), Variety(다양성)까지 V로 시작하는 3가지 단어의 묶음입니다. 이때 Variety(다양성)이라는 단어yozm.wishket.com빅데이터의 특성-3VVolume(양), Variety(다양성),Velocity(속도)관계형 데이터베이스 : 데이터를 행과 열의 테이블 형태로 저장관계형 데이터베이스의 조건키의 존재 - 모든 데이터에 키가 존재해야함(열)유일성, 무결성 - 유일성(하나의 키가 하나의 식별값을 식별), 무결성(..

Article Study - 양질의 데이터를 판별하는 5가지 방법 2

https://yozm.wishket.com/magazine/detail/1074/ 양질의 데이터를 판별하는 5가지 방법 : 2 믿을 수 있는 데이터인가? | 요즘IT데이터 신뢰성이란 데이터가 얼마나 실제 정보를 똑바로 담고 있는가에 대한 개념으로 이해하면 좋습니다. 데이터 자체에 틀린 정보가 담겨있을 수도 있으며, 확실한 값이 아닌 추정 값을 데이yozm.wishket.com요약 :데이터의 신뢰성이란: 데이터가 얼마나 실제 정보를 담고 있느냐데이터 신리성 관련 단어데이터 오류: 실제 정보와 다른 데이터데이터 결측: 누락된 데이터결측 데이터를 처리하는 방법은 삭제와 대체가 있지만 두 방법 모두 최선의 방법이 아님.최선의 방법은 애초에 데이터를 선택할 때 결측치가 최소화 된 데이터를 다루는 것가공데이터 :..

Article Study 13 - 양질의 데이터를 판별하는 5가지 방법

양질의 데이터를 판별하는 5가지 방법 : 1 데이터 양은 충분한가? | 요즘IT 양질의 데이터를 판별하는 5가지 방법 : 1 데이터 양은 충분한가? | 요즘IT양질의 데이터 조건 첫 번째는 ‘충분한 양의 데이터’입니다. 최근 빅데이터라는 단어가 기승을 부리고 있으며 빅데이터는 기본적으로 방대한 양의 데이터를 의미합니다. 하지만 현실적으로yozm.wishket.com요약 :양질의 데이터란 무엇인가?데이터 품질: : 낮을 수록 가공을 많이 해야한다.양질의데이터 구분하는 방법:데이터 수가 충분히 많다데이터 자체에 오류가 적다관계형 데이터베이스의 형식을 잘 지키고 있다.수치형 데이터 베이스 형식을 많이 가지고 있다.활용 목적에 적합하다충분한 데이터란?통계 분석용 데이터 : 최소 500개머신러닝 분석용 데이터 :..

Article_Study 12 - 검증할만한 가설은?

실험 조직으로 거듭나기: 2 검증할 ‘만’한 가설은? | 요즘IT 실험 조직으로 거듭나기: 2 검증할 ‘만’한 가설은? | 요즘IT오늘은 실험 조직으로 거듭나기 2편으로, 가설의 뼈대를 만드는 방법을 살펴보겠습니다. 그로스(Growth)와 실험 문화를 팀에 도입하고 싶은 분, '무엇'을 '어떻게' 검증해야 할지 헷갈리는 분, 가설yozm.wishket.com가설 검증 프로세스검증할 가설 선택가설 검증 방식 결정검증 지표와 목표 수치 결정실험 기간 결정기존 실험환경 튜닝 → 최적환경실험 진행 및 검증 데이터 모으기데이터 분석 및 가설 검증학습검증할 가설 선택현지 상황을 개선하는가?Actionable한가? → 우리가 다음에 어디로 가야 하는지 알 수 있을까?검증 방식 결정AB테스트 : 서로 다른 시안을 비슷..

Article_Study 11 - 사용자 데이터를 효과적으로 분석하는 방법

사용자 데이터를 효과적으로 분석하는 법 | 요즘IT 사용자 데이터를 효과적으로 분석하는 법 | 요즘IT사용성 평가나 설문 조사 그리고 인터뷰와 같은 사용자 조사는 고객 관점에서의 사업 기회 발굴과 디자인 개선에 대한 인사이트를 제공해 줍니다. 그렇지만 단순히 사용자 조사로 수집된 데이yozm.wishket.com 정량 데이터: 얼마나 많은 행동이 일어나는지 알려줌정성 데이터: 행동이 일어난 이유를 알려줌정량적 경험 데이터 분석하기 → 통계분석 이용기술통계: 빈도나 평균과 같은 수집된 데이터의 특성 파악→ 대표적으로 중심 경향 지표가 있음 / 평균, 중앙값, 최빈값→ 엑셀을 통해 수행 가능범주형 데이터(막대그래프): 사용자 행동이 어디 영역에 많이 분포되는지수치형 데이터(막대그래프, 선그래프): 사용자 행..

Article_Study 10 - 데이터 아키텍처? 쉽게 배워봅시다!

데이터 아키텍처? 쉽게 배워봅시다 | 요즘IT요약 데이터 아키텍처란? 시스템이 어떻게 구성되며 동작하는지 원리를 나타내는 원칙조직이 데이터를 수집,저장, 처리 및 관리하는 방법을 설계하고 구현하는 일련의 과정 또는 체계구성: ETL, 데이터 마트, 데이터 웨어하우스 1, 데이터 원천OLTP 데이터 베이스:  쇼핑, 은행 업무 등의 트랜잭션 데이터(구매 내역 등)기업 애플리케이션: ERP, CRM서드파티: 외부 제공 데이터( 시장 조사, 경쟁사 분석 등)웹.로그 데이터: 인터넷 발자취 (광고 클릭 등)IoT데이터: 스마트 TV 등2. ETL(추출,변환,적재) 3. 웨어하우스와 레이크: 데이터 보관소웨어하우스: 테이블 형태 데이터, 구조화 된 데이터레이크: 정형, 반정형, 비정형 다 포함4. 데이터 마트데이..