반응형
1. 머신러닝의 개념
1) 머신러닝은 지도학습, 비지도학습, 강화학습으로 분류
- 지도학습(supervised learning) : 레이블된 데이터로 학습
- 비지도학습(unsupervised learning) : 레이블 없이 학습/ 다차원 데이터를 많이 넣어서 데이터들끼리의 숨겨진 특징과 구조 발견
- 강화학습(reinforcement learning) : 보상을 많이 받는 쪽으로 점차적으로 시스템이 진화/ 의사결정을 위한 최적의 액션 선택 가능
2. 강화학습 정의 및 원리
1) 강화학습 동작 순서
1. 정의된 주체(agent)가 주어진 환경의 현재 상태를 관찰하여, 이를 기반으로 행동(action)을 취하게 됨
2. 환경의 상태가 변하면서 정의된 주체는 보상(reward)를 받게 됨
3. 보상을 기반으로 정의된 주체는 더 많은 보상을 얻을 수 있는 방향(best action)으로 행동을 학습함
2) 자율주행차에 적용?
- 주체 : 자율주행 차량
- 환경 : 주행환경으로 설정하여 주행 환경에 따라 특정 행동들에 대한 보상을 할당하는 방식으로 모델 구성
퀴즈)
1. 어떤 환경 안에서 정의된 주체가 현재의 상태를 관찰하여 선택할 수 있는 행동들 중에서 가장 최대의 보상을 가져다주는 행동이 무엇인지 학습하는 것은 무엇인가? 답 2
1. 지도학습
2. 강화학습
3. 머신러닝
4. 비지도학습
2. 강화학습 요소의 설명을 잘못 짝지은 것? 답 2(state 상태)
1. agent : 주체
2. state : 요소
3. action : 행동
4. reward : 보상
반응형
'전자공학 > 자율주행' 카테고리의 다른 글
[H-모빌리티 클래스 자율주행 공통 내용 정리] 2. 자율주행 기술의 발전현황 (0) | 2022.02.17 |
---|---|
[H-모빌리티 클래스 자율주행 공통 내용 정리] 1. 자율주행 기술 5단계 개요 (0) | 2022.02.17 |
[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 23. RRT 알고리즘 기초, 24. RRT 알고리즘 이해 (0) | 2022.02.16 |
[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 21. A* 알고리즘 기초, 22. A* 알고리즘 이해 (0) | 2022.02.16 |
[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 19. 자율주행 자동차의 경로생성 기술 개요, 20. 판단/경로생성에서의 주변환경 인식/자차 위치인식의 중요성 (0) | 2022.02.16 |
댓글