728x90

데이터 과학 기초 2

[데이터과학기초] 탐색적 데이터 분석

복습하기 위해 학부 수업 내용을 필기한 내용입니다. 이해를 제대로 하지 못하고 정리한 경우 틀린 내용이 있을 수 있습니다. 그러한 부분에 대해서는 알려주시면 정말 감사하겠습니다. 데이터에 대한 두 가지 접근법 : CDA vs EDA 확증적 데이터 분석 : CDA (confirmatory data analysis) - 가설을 수립하고 데이터를 통해 통계적 유의성을 검정하는 전통적 분석 기법 - Ronald Fisher : 가설검정, 신뢰구간, 유의 수준, 유의확률(p-value) 탐색적 데이터 분석 : EDA (exploratory data analysis) - 정해진 가설과 모형 없이 데이터의 구조와 특성을 통해 통찰을 얻는 분석 기법 - John Tukey : EDA는 우리가 존재한다고 믿는 것들은 물..

[데이터과학기초] 데이터 과학2

복습하기 위해 학부 수업 내용을 필기한 내용입니다. 이해를 제대로 하지 못하고 정리한 경우 틀린 내용이 있을 수 있습니다. 그러한 부분에 대해서는 알려주시면 정말 감사하겠습니다. ▶데이터 과학 프로세스 (Data Science Process) 문제 정의 (problem definition) 데이터 과학의 시작은 문제를 명확히 정의하는 것으로부터 시작 - 부모의 키가 크면 자녀의 키도 클까? - 집값에 영향을 미치는 요인은 무엇일까? 데이터 수집 (data collection) 데이터화 : datafication - a process of taking all aspects of life and turning them into data. 데이터화의 사례 - 트위터/페이스북 : 생각의 조각을 데이터화 - 구글..

728x90