deep-econom (deep_econom) wrote,
deep-econom
deep_econom

задача на подумать

надо как-нибудь подумать и попробовать закодировать

--------------
dobr_i_trezv:
https://deep-econom.livejournal.com/271026.html?thread=1944754#t1944754

Раз ваш язык универсальный, покажите, что модель Саттона может быть описана в вашем языке. И все наработки Reinforcement learning сходу можно будет перевести в ваш язык. Сможете перегнать в свой язык рисунок из статьи http://old.sztaki.hu/~szcsaba/research/AAAI10_Tutorial/

и перегнать рисунки из этой статьи
http://proceedings.mlr.press/v80/liang18b/liang18b.pdf

или вот
http://horicky.blogspot.com/2017/08/reinforcement-learning-overview.html
----

AAAI-10 Tutorial: Reinforcement Learning Algorithms for MDPs
Sunday, July 11, 2010, 9:00 AM – 1:00 PM
Location: Atlanta Ballroom F, Seventh Floor
http://old.sztaki.hu/~szcsaba/research/AAAI10_Tutorial/

RLlib: Abstractions for Distributed Reinforcement Learning
Eric Liang * 1 Richard Liaw * 1 Philipp Moritz 1 Robert Nishihara 1 Roy Fox 1 Ken Goldberg 1
Joseph E. Gonzalez 1 Michael I. Jordan 1
Ion Stoica 1
http://proceedings.mlr.press/v80/liang18b/liang18b.pdf
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 0 comments