強化学習(RL:Reinforcement Learning)とは、プログラムの行動に対するフィードバック(報酬・罰)をトレーニングデータとして使って学習する方法のことである。
Reinforcement Learning (RL) is the science of decision making.
強化学習(RL)は、意思決定の科学です。
強化学習(RL:Reinforcement Learning)とは、プログラムの行動に対するフィードバック(報酬・罰)をトレーニングデータとして使って学習する方法のことである。
Reinforcement Learning (RL) is the science of decision making.
強化学習(RL)は、意思決定の科学です。