본문 바로가기
카테고리 없음

트리계열 알고리즘이 표준화 / 정규화가 필요하지 않은 이유는?

by 호놀롤롤 2024. 2. 19.

머신러닝에서 트리계열 알고리즘은 데이터를 특성(feature)들의 조합으로 분할하여 예측을 수행하는데 사용됩니다. 이러한 알고리즘들은 정규화표준화가 필요하지 않은 이유가 있습니다.

 

 

  1. 단위 무시: 트리계열 알고리즘은 특성들의 단위를 무시하고 순서에만 집중합니다. 따라서 특성들을 정규화하거나 표준화할 필요가 없습니다.
  2. 분기 기준: 트리 알고리즘은 특성의 값을 비교하여 분기를 결정합니다. 이때 특성의 값이 정규화되거나 표준화되어도 분기 기준에는 영향을 미치지 않습니다.
  3. 불변성: 트리 알고리즘은 특성들의 순서를 바꾸지 않으며, 특성들 간의 상대적 크기만 고려합니다. 따라서 정규화나 표준화를 적용해도 결과에 영향을 주지 않습니다.

 

 

 

결론적으로,

 

트리계열 알고리즘은 특성들의 단위와 범위를 고려하지 않고

 

독립적으로 작동하므로

 

정규화와 표준화가 필요하지 않습니다.