인텔 AI 교육
인텔 AI 교육 - Module-11(ML 모델)
Regain
2023. 7. 24. 13:51
(해당 자료들은 인텔 AI for Future Workforce내용을 학습하고 가공한 내용입니다.)
< Module - 11 >
#이상치(오류) 확인
'Matplotlib' 에서 제공하는 간단한 시각화 도구를 사용하여 확인할 수 있다.
1. 박스 플롯
백분위수 값 및 사분위수 범위를 시각화 한다.
2. 히스토그램
빈(히스토그램의 한 구간) 크기를 기반으로 이해를 돕는다.
3. 산점도
서로 멀리 떨어져 있는 데이터 포인트를 식별한다.
#AI 모델
1. 지도 기계 학습
(1) 특징
- 정확한 출력 데이터를 효과적으로 생성할 수 있도록 입력 데이터에서 특정 관계나 구조를 찾는 것이 목표이다.
- 데이터에 레이블이 지정된다. = 분류된 데이터를 사용한다.
- 사람이 답을 알고 있는 상태에서 AI를 훈련한다.
- 비지도 학습보다 더 단순하면서 일반적이다.
(2) 사용
- 분류(입력을 출력 레이블에 매핑)
- 회귀(입력을 연속 출력으로 매핑)
2. 비지도 기계 학습
(1) 특징
- 제공된 레이블을 사용하지 않고 데이터의 구조를 찾는 것이 목표이다.
- 데이터에 레이블이 지정되지 않는다. = 분류되지 않은 데이터를 사용한다.
- 사용자가 보다 복잡한 처리 작업을 수행할 수 있도록 한다.
(2) 사용
- 클러스터링(개별 기능 간의 관계 학습)
- 차원 축소(더 적은 열, 기능을 사용하여 데이터를 나타내기 위한 방법)
#모델의 평가 방법
1. 오차행렬(Confusion Matrix)
정답 o | 정답 x | |
예측 o | 진실 정답(TP) | 거짓 정답(FP) |
예측 x | 거짓 오답(FN) | 진실 오답(TN) |
2. 정확도
- 모든 관찰 중에서 정확한 예측의 백분율을 말한다.
- 정확도 = (TP + TN) / (TP + FP + TN + FN), 즉 '정확한 예측 / 모든 경우'
3. 정밀도
- 정답으로 예측되는 경우 중 진실정답의 비율이다.
- 정밀도 = (TP) / (TP + FP), 즉 '진실 정답 수 / 총 정답 예측 수'
4. 재현율(Recall)
- 총 정답 예측 중 정답 수의 비율이다.
- 재현율 : (TP) / (TP + FN), 즉 '진실 정답 수 / 총 진실 답(예측+실제) 수'
#정확도 예제
정확도 : 전체 / 예측 성공
정밀도 : 예측 o전체 / 정답 o - 예측 o
재현율 : 정답 o전체 / 예측 x - 정답 o
1번
정답 o | 정답 x | 정확도 : 0.69 | ||
예측 o | 15 | 12 | 정밀도 : 0.55 | |
예측 x | 47 | 118 | 재현율 : 0.24 |
2번
정답 o | 정답 x | 정확도 : 0.94 | ||
예측 o | 0 | 3 | 정밀도 : 0 | |
예측 x | 3 | 94 | 재현율 : 0 |
3번
정답 o | 정답 x | 정확도 : 0.55 | ||
예측 o | 5 | 0 | 정밀도 : 1 | |
예측 x | 45 | 50 | 재현율 : 0.1 |
참고 자료
https://www.appier.com/ko-kr/blog/what-is-supervised-learning