인텔 AI 교육

인텔 AI 교육 - Module-11(ML 모델)

Regain 2023. 7. 24. 13:51

(해당 자료들은 인텔 AI for Future Workforce내용을 학습하고 가공한 내용입니다.)

 

< Module - 11 >

#이상치(오류) 확인

  'Matplotlib' 에서 제공하는 간단한 시각화 도구를 사용하여 확인할 수 있다.

1. 박스 플롯

  백분위수 값 및 사분위수 범위를 시각화 한다.

2. 히스토그램

  빈(히스토그램의 한 구간) 크기를 기반으로 이해를 돕는다.

3. 산점도

  서로 멀리 떨어져 있는 데이터 포인트를 식별한다.

 

 

#AI 모델

1. 지도 기계 학습

  (1) 특징

  • 정확한 출력 데이터를 효과적으로 생성할 수 있도록 입력 데이터에서 특정 관계나 구조를 찾는 것이 목표이다.
  • 데이터에 레이블이 지정된다. = 분류된 데이터를 사용한다.
  • 사람이 답을 알고 있는 상태에서 AI를 훈련한다.
  • 비지도 학습보다 더 단순하면서 일반적이다.

  (2) 사용

  • 분류(입력을 출력 레이블에 매핑)
  • 회귀(입력을 연속 출력으로 매핑)

 

2. 비지도 기계 학습

  (1) 특징

  • 제공된 레이블을 사용하지 않고 데이터의 구조를 찾는 것이 목표이다.
  • 데이터에 레이블이 지정되지 않는다. = 분류되지 않은 데이터를 사용한다.
  • 사용자가 보다 복잡한 처리 작업을 수행할 수 있도록 한다.

  (2) 사용

  • 클러스터링(개별 기능 간의 관계 학습)
  • 차원 축소(더 적은 열, 기능을 사용하여 데이터를 나타내기 위한 방법)

 

 

#모델의 평가 방법

1. 오차행렬(Confusion Matrix)

  정답 o 정답 x
예측 o 진실 정답(TP) 거짓 정답(FP)
예측 x 거짓 오답(FN) 진실 오답(TN)

 

2. 정확도

  • 모든 관찰 중에서 정확한 예측의 백분율을 말한다.
  • 정확도 = (TP + TN) / (TP + FP + TN + FN), 즉 '정확한 예측 / 모든 경우'

 

3. 정밀도

  • 정답으로 예측되는 경우 중 진실정답의 비율이다.
  • 정밀도 = (TP) / (TP + FP), 즉 '진실 정답 수  / 총 정답 예측 수'

 

4. 재현율(Recall)

  • 총 정답 예측 중 정답 수의 비율이다.
  • 재현율 : (TP) / (TP + FN), 즉 '진실 정답 수 / 총 진실 답(예측+실제) 수'

 

 

#정확도 예제

정확도 : 전체 / 예측 성공

정밀도 : 예측 o전체 / 정답 o - 예측 o

재현율 : 정답 o전체 / 예측 x - 정답 o

 

1번

 
  정답  o 정답 x   정확도 : 0.69
예측 o 15 12   정밀도 : 0.55
예측 x 47 118   재현율 : 0.24

2번

  정답  o 정답 x   정확도 : 0.94
예측 o 0 3   정밀도 : 0
예측 x 3 94   재현율 : 0

3번

  정답  o 정답 x   정확도 : 0.55
예측 o 5 0   정밀도 : 1
예측 x 45 50   재현율 : 0.1

 

 

 

 

참고 자료

https://www.appier.com/ko-kr/blog/what-is-supervised-learning