문지원의 AI 공부 노트

❯

❯

기초 수학 이론 및 P MOC

❯

인공지능 기초 개념

❯

Reinforcement Learning

Reinforcement Learning

2025년 12월 01일1 min read

어떤 환경 내에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행독 혹은 행동 순서를 선택하는 방법

그래프 뷰

백링크

Supervised Learning and Unsupervised Learning

Created with Quartz v4.5.2 © 2025

GitHub
Discord Community