728x90

KNN 2

[데이터과학기초] 로지스틱 회귀와 분류

복습하기 위해 학부 수업 내용을 필기한 내용입니다. 이해를 제대로 하지 못하고 정리한 경우 틀린 내용이 있을 수 있습니다. 그러한 부분에 대해서는 알려주시면 정말 감사하겠습니다. 선형모델의 일반화 선형회귀분석을 위한 조건 - 결과변수가 연속형 변수이면서 정규분포를 따라야 한다. 선형회귀분석을 위한 조건에 맞지 않는 경우 - 결과변수가 범주형 변수일 때 : 로지스틱 회귀분석 - 결과변수가 어떤 사건이 발생하는 횟수일 때 : 포아송 회귀분석 일반화 선형모델 : generalized linear model 선형회귀모델을 확장 : 정규분포를 따르지 않는 결과변수에 대한 회귀모델 생성 - 표준 선형회귀모델 : μy = b0 + b1x1 + b2x2 +... + bmxm - μy : 결과변수의 조건부 평균, xm ..

[데이터과학기초] 데이터 과학2

복습하기 위해 학부 수업 내용을 필기한 내용입니다. 이해를 제대로 하지 못하고 정리한 경우 틀린 내용이 있을 수 있습니다. 그러한 부분에 대해서는 알려주시면 정말 감사하겠습니다. ▶데이터 과학 프로세스 (Data Science Process) 문제 정의 (problem definition) 데이터 과학의 시작은 문제를 명확히 정의하는 것으로부터 시작 - 부모의 키가 크면 자녀의 키도 클까? - 집값에 영향을 미치는 요인은 무엇일까? 데이터 수집 (data collection) 데이터화 : datafication - a process of taking all aspects of life and turning them into data. 데이터화의 사례 - 트위터/페이스북 : 생각의 조각을 데이터화 - 구글..

728x90