728x90

clustering 2

[데이터과학기초] 군집 분석 (Clustering)

복습하기 위해 학부 수업 내용을 필기한 내용입니다. 이해를 제대로 하지 못하고 정리한 경우 틀린 내용이 있을 수 있습니다. 그러한 부분에 대해서는 알려주시면 정말 감사하겠습니다. 군집화 : Clustering 데이터를 서로 비슷하거나, 서로 가까운 것들끼리 묶어서 나누는 것 비지도 학습 : 정답(라벨)이 없음. 유사도와 거리로 판단 - 유사도(similarity) : 두 데이터가 얼마나 가까운가를 나타내는 척도 - 거리(distance ): 두 데이터 사이의 거리 - s = 1 – d, s = similarity, d = distance 유클리드 거리 : Euclidean Distance - 두 점 사이의 거리를 계산하는 가장 일반적인 방법 - 유클리드 공간에서 두 점 사이의 거리 맨해튼 거리 : Man..

[데이터과학기초] 로지스틱 회귀와 분류

복습하기 위해 학부 수업 내용을 필기한 내용입니다. 이해를 제대로 하지 못하고 정리한 경우 틀린 내용이 있을 수 있습니다. 그러한 부분에 대해서는 알려주시면 정말 감사하겠습니다. 선형모델의 일반화 선형회귀분석을 위한 조건 - 결과변수가 연속형 변수이면서 정규분포를 따라야 한다. 선형회귀분석을 위한 조건에 맞지 않는 경우 - 결과변수가 범주형 변수일 때 : 로지스틱 회귀분석 - 결과변수가 어떤 사건이 발생하는 횟수일 때 : 포아송 회귀분석 일반화 선형모델 : generalized linear model 선형회귀모델을 확장 : 정규분포를 따르지 않는 결과변수에 대한 회귀모델 생성 - 표준 선형회귀모델 : μy = b0 + b1x1 + b2x2 +... + bmxm - μy : 결과변수의 조건부 평균, xm ..

728x90