2025/07/01 2

모수적 / 비모수적

Parametric (모수적/매개변수적): 데이터가 특정 **분포(예: 정규 분포)**를 따른다거나, 모델의 형태가 고정된 소수의 매개변수로 정의될 수 있다고 가정하는 방식입니다. 가정이 충족되면 효율적이고 해석하기 좋지만, 가정이 틀리면 문제가 생깁니다.Non-parametric (비모수적/비매개변수적): 데이터 분포에 대한 엄격한 가정을 하지 않고, 모델이 데이터로부터 직접적으로 관계를 유연하게 학습하는 방식입니다. 가정이 적으므로 다양한 상황에 적용 가능하고 복잡한 패턴을 잘 포착하지만, 과적합 위험이 높고 해석이 어려울 수 있습니다.

컴공 2025.07.01

베이즈 오류율

베이즈 분류기에서 1에서 각 케이스에서 가장 큰 확률을 뺀거의 나머지의 평균이 수식이 overall Bayes error rate임 또한 비가환 오차 (irreducible error)와 유사함.주어진 데이터로 예측을 할때 필연적으로 발생할 수 밖에 없는 최소 오류를 뜻함. 베이즈 분류기는 모든 데이터의 실제 확률 분포를 완벽하게 알고 있다는 가정하의 이론상 최적이기때문에 현실에서는 불가하고현실에서는 베이즈 분류를 기반으로 하되 각 feature가 독립적이라는 naive한 가정을 바탕으로 한 나이브 베이즈 분류기를 사용함.또한 ISL책에서많은 접근 방식들은 X가 주어졌을 때 Y의 조건부 분포를 추정하려고 시도하고, 그 다음 주어진 관측치를 가장 높은 추정 확률을 가진 클래스로 분류합니다.그 방법중 하나는..

확률과통계 2025.07.01