모두야
NLR / PLR/ RFE 란? 본문
NLR이란?
: 호중구 대 림프구 비율
-> 종양 기실, 염증 및 전반적인 예후 상태를 반영한다.
NLR = Npercent/Lpercent
PLR이란?
: 혈소판 값을 절대 림프구 수로 나눈 값
=> NLR와 PLR이 낮은 것이 좋다. 림프구 수치는 높으면서, 호중구 수치와 혈소판 수치는 높지 않은 것이 좋다.
PLR = plt/(Lpercent*WBC*10)
RFE란?
Recursive feature elimination 으로, 학습에 필요한 적절한 feature를 선택하는 feature selection 과정 중의 한 방법이다.
모든 feature들로부터, feature를 하나 하나 제거하면서 원하는 갯수의 feature가 남을 때까지 반복하는 것이다.
1. 학습하고 싶은 모델을 정한 후, 해당 모델로 모든 feature를 활용하여 데이터를 학습한다.
2. 학습을 진행하며 각 feature의 feature importance를 도출한다.
3. feature importance가 낮은 feature부터 하나씩 제거한다.
4. feature를 제거하며, 원하는 feature 갯수가 될 때까지 반복한다.
5. 원하는 feature 갯수에 도달하면, 상위 feature importance를 가지는 feature가 최종 feature selection의 결과가 된다.
scikit-learn 패키지의 RFE 함수로 구현할 수 있다.
Recursive feature elimination with cross-validation — scikit-learn 1.0.2 documentation
Recursive Feature Elimination (RFE) for Feature Selection in Python (machinelearningmastery.com)
? 원하는 feature 어떻게 선정, 갯수마다 결과가 달라지려나
? feature importance 는 어떻게 구하나
ROC-AUC란?
1) ROC - Receiver Operating Characteristic
: 모든 임계값에서 분류 모델의 성능을 보여주는 그래프
2) AUC - Area Under the Curve
: ROC 곡선 아래 영역
==> AUC가 높다 = 클래스를 구별하는 모델의 성능이 높다
- ROC-AUC 곡선은, 정상vs환자 클래스를 분류하여 구분하는 모델의 성능 평가로 주로 사용된다.
x축 : FPR(1-specificity)
y축 : TPR (민감도)
우수한 분류 모델은 AUC가 1에 가깝다.
참조
RFE와 RFECV (Recursive Feature Elimination이란?)
sklearn.feature_selection. RFE — scikit-learn 1.0.2 문서
'Medical AI > study' 카테고리의 다른 글
IEEE PDF eXpress® 란? (0) | 2023.05.15 |
---|---|
커널 밀도 추정 Kernel Density Estimation (KDE) (0) | 2022.05.09 |