인텔 AI 교육 - Module-5, 6, 7
(해당 자료들은 인텔 AI for Future Workforce내용을 학습하고 가공한 내용입니다.)
< Module - 5 >
#웹-앱에서 AI의 포용적 활용을 위한 노력
- 편향된 데이터를 취급하지 않으려 한다.
- 협업을 통해 자료의 다양성을 넓힌다.
- 모든 사람에게 도움이 될 수 있도록 한다.
< Module - 6 >
#S.M.A.R.T 목표
Specific (구체적) |
Measurable (측정 가능) |
Achievable (성취 가능성) |
Relevant (연관성) |
Time-bound (시간 제한) |
목표가 구체적일수록 성공률이 증가한다. |
과정을 측정할 수 있는 기준이 있어야 한다. |
도전적이면서도 달성 가능할 만큼 명확해야 한다. |
목표가 본인과 연관성이 있어야 한다. |
시간 마감일이 있어야 한다. |
ex. "내년까지 매일 먹었던 배달음식을 주 1회로 줄이고 그 돈을 저축하여 비어있는 통장에 700만 원을 모을 것입니다."
- Specific : 배달음식을 주 1회로 줄일 것이라는 구체적 목표를 제시했다.
- Measurable : 매일 배달을 시킨 것을 줄인 것이므로 전화나 배달앱을 통해 체감할 수 있다.
- Achievable : 배달 대신 집에서 해 먹는 것으로 대체 가능하므로 가능한 목표이다.
- Relevant : 모은 돈은 자신의 생활에 보탬이 될 수 있다.
- Time-bound : 내년 까지라는 시간제한을 설정했다.
1. 이번 교육과 연관 지어 SMART 목표 설정하기
목표 : 올해 안에 취업을 하고 직무수행에 있어 이후 전반적인 내용들을 1년 안에 이해할 수 있도록 공부를 할 것이다.
- Specific : 올해 취업하기, 직무수행의 어려움이 없을 정도의 직무이해
- Measurable : 취업이라는 명확한 기준선이 존재, 직무수행의 80% 이해 시 이해함으로 간주
- Achievable : 한 번도 해본 적 없는 일이면서 하지 않을 수는 없는 일이기에 적절한 목표라 평가
- Relevant : 해당 목표는 본인의 성장에 연관되어 있으므로 조건에 부합함
- Time-bound : 올해라는 기간을 명시하였고 이후에도 1년이라는 기간을 명시
< Module - 7 >
#AI 프로젝트 사이클
1. 문제 범위 설정 | 2. 데이터 획득 | 3. 데이터 탐색 | 4. 모델링 | 5. 평가 | 6. 배포 |
1. 문제 범위 설정(4W)
누가 문제를 겪고 있는지(Who), 무엇이 문제인지(What), 어디에서 문제가 발생했는지(Where), 그것이 해결할 가치가 있는지(Why) 이 4가지 W를 통해 문제의 범위를 설정해 준다.
우리의 | [이해 관계자] ex. 회사 기계 |
누가 |
~에 대한 문제가 있다 | [이슈, 문제, 니즈] ex. 잦은 고장이 발생 |
무엇을 |
언제/동안 | [맥락, 상황] ex. 몇년동안 불규칙하게 |
어디서 |
이상적인 해결책은 | [그들을 위한 해결책의 이익] ex. 고장 날 때를 예측 or 정기적으로 점검 |
왜 |
2. 데이터 획득
해당 문제를 해결하기 위한 자료들을 찾기 위한 것으로 'kaggle', 'aws', 'WORLD BANK', '공공데이터포털'등 필요한 자료가 있는 사이트를 이용해 데이터를 얻어준다.
3. 데이터 탐색
코드 없이 데이터를 시각화해 주는 도구로 위 3가지가 있다. 간편하지만 유료라는 단점이 있다. 무료로는 보통 파이썬의 넘파이-판다스를 활용하여 자료에서 정보를 추출하고 활용할 수 있도록 가공하는 편이다.
4. 모델링
필요한 정보를 추출하였다면 모델링을 통해 문제를 해결할 수 있는 모델을 선정하고 실행해야 한다.
1. 인공지능(AI) : 컴퓨터가 인간의 지능을 흉내 낼 수 있게 하는 기술
2. 기계학습(ML) : AI의 하위 집합으로 기계가 경험이 있는 업무를 개선할 수 있도록 함
3. 딥 러닝(DL) : 머신러닝의 하위 집합으로 소프트웨어가 방대한 양의 데이터로 직업을 수행하도록 스스로 훈련할 수 있음
머신러닝 모델에는 크게 세 가지 계열의 모델이 존재한다.
(1) 지도 학습
- 학습 데이터에 입력(feature) - 정답(label)의 쌍으로 학습하며 이후 새로운 입력에 대해 학습한 내용을 바탕으로 정답을 도출한다.
- 이미지 분류, 악성 코드 분류, 생체 인식을 이용한 출석 확인 등이 있다.
(2) 비지도 학습
- 학습 데이터에 입력값만 존재하고 정답이 정해져 있지 않으며 입력 데이터들의 특징만으로 비슷한 집단을 묶는다.
- 데이터의 의미 파악이나 기준 마련을 위한 과정이기도 하다.
- 고객 데이터 분석, 전염병 확산 분석 등이 있다.
(3) 강화 학습
- 주어진 환경 내에서 선택 가능한 행동 중 보상을 극대화하는 행동이나 행동 순서를 선택한다.
- 게임에서 주로 활용된다.
5. 평가
각 학습이나 방법에 따라 적절한 평가 방법을 사용하여 평가한다.
지도 학습 | 비지도 학습 | |
분류 | 회귀 | 클러스터링 |
분류 정확도 혼동 행렬(confusion matrix) |
루트 평균 제곱 오차(RSE) 평균 절대 오차(MAE) |
실루엣 방법 |
6. 배포
도출한 내용을 어떻게 배포할지 선택한다.(Web, App, Cloud Server)