카테고리 없음

파이썬 머신러닝 사이킷런 정규화 표준화 normalization stardardization

give_me_true 2021. 11. 16. 11:16

Feature scaling에 적용되는 scaling 방법

두 값들의 feature가 달라서 직접 비교하기 어려우며 학습 능력도 떨어짐

모델의 학습 성능을 높이기 위한 것

 

정규화 표준화 제약화

: overfitting 방지

 

from sklearn.preprocessing import MinMaxScaler
# from sklearn.preprocessing import StandardScaler

scaler = MinMaxScaler()
x_scaled = scaler.fit_transform(x)

 

정규화 Normalization

normalization은 값의 범위를 0~1로 변환

MinMaxScaler

데이터의 상대적 크기 영향 줄이기

이상치로 인해 다른 값들이 한 쪽으로 몰려서 왜곡이 생길 수 있음

 

 

표준화 Standardization

값의 범위를 평균 0, 분산 1로 변환

StandardScalar

1,2,3 = 68%, 95%, 98%

특정 범위 벗어나면 oulier로 간주

 

 

제약화 Regularization

모델의 복잡도 조정

하이퍼 파라미터 수정. L1, L2

 

 

https://huidea.tistory.com/39

 

[Machine learning] 데이터 표준화, 정규화, 피쳐스케일링 - 200729

index 1. 피쳐스케일링, 표준화, 정규화 2. 피쳐의 분포확인 방법. 3. 표준화 정규화 방법. 4. 코드 구현 성능 차이 1. 피쳐 스케일링 표준화 정규화 0) 피쳐 스케일링? 입력된 데이터에는 각각의 피쳐

huidea.tistory.com

https://realblack0.github.io/2020/03/29/normalization-standardization-regularization.html

 

[딥러닝] 정규화? 표준화? Normalization? Standardization? Regularization?

딥러닝을 공부하다 보면 “정규화” 라는 용어를 참 자주 접하게 된다. 그런데 애석하게도 Normalization, Standardization, Regularization 이 세 용어가 모두 한국어로 정규화라고 번역된다. 이 세가지 용어

realblack0.github.io

https://soo-jjeong.tistory.com/123

 

데이터 표준화(standardization), 정규화(normalization) 차이점

데이터 표준화와 정규화. 하나씩 알아갈 때는 헷갈리지 않았는데, 막상 분석을 하려고 하니 헷갈린다. 그래서 표준화와 정규화의 공통점과 차이점에 대해 포스팅해보고자 한다. 표준화(standardiza

soo-jjeong.tistory.com

https://bskyvision.com/849

 

정규화(normalization)와 표준화(standardization), 머신러닝 성능 향상을 위한 필수 단계

오늘은 꽤 중요한 이야기를 하고자 합니다. 기본적이기 때문에 중요합니다. 이것을 간과하면 성능에 치명적인 영향을 끼치기 때문에 중요합니다. 바로 정규화(normalization)와 표준화(standardization)

bskyvision.com