1.
kaç agent kaç environment'ı çözdü ben niye çözemedim bu hayatı be markov ?
mdp olarak kısaltılır. reinforcement learning'in temeli bu tanıma dayanır.
mdp olarak kısaltılır. reinforcement learning'in temeli bu tanıma dayanır.
devamını gör...