본문 바로가기
전자공학/자율주행

[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 25. Reinforcement Learning 기반 경로생성 알고리즘 기초

by ohj921189 2022. 2. 16.
반응형

1. 머신러닝의 개념

 

1) 머신러닝은 지도학습, 비지도학습, 강화학습으로 분류

 

- 지도학습(supervised learning) : 레이블된 데이터로 학습

- 비지도학습(unsupervised learning) : 레이블 없이 학습/ 다차원 데이터를 많이 넣어서 데이터들끼리의 숨겨진 특징과 구조 발견

- 강화학습(reinforcement learning) : 보상을 많이 받는 쪽으로 점차적으로 시스템이 진화/ 의사결정을 위한 최적의 액션 선택 가능

 

2. 강화학습 정의 및 원리

 

1) 강화학습 동작 순서

 

1. 정의된 주체(agent)가 주어진 환경의 현재 상태를 관찰하여, 이를 기반으로 행동(action)을 취하게 됨

2. 환경의 상태가 변하면서 정의된 주체는 보상(reward)를 받게 됨

3. 보상을 기반으로 정의된 주체는 더 많은 보상을 얻을 수 있는 방향(best action)으로 행동을 학습함

 

2) 자율주행차에 적용?

 

- 주체 : 자율주행 차량

- 환경 : 주행환경으로 설정하여 주행 환경에 따라 특정 행동들에 대한 보상을 할당하는 방식으로 모델 구성

 

 

퀴즈)

1. 어떤 환경 안에서 정의된 주체가 현재의 상태를 관찰하여 선택할 수 있는 행동들 중에서 가장 최대의 보상을 가져다주는 행동이 무엇인지 학습하는 것은 무엇인가? 2

 

1. 지도학습

2. 강화학습

3. 머신러닝

4. 비지도학습

 

2. 강화학습 요소의 설명을 잘못 짝지은 것? 2(state 상태)

 

1. agent : 주체

2. state : 요소

3. action : 행동

4. reward : 보상

 
 

 

반응형

댓글