Test new course "Reinforcement Learning"
Л.р. 2
Переформулировать задание, так, чтобы необходимо было просто проверить выполнение уравнения с уже готовой матрицей оценки стоимости состояния.
Л.р. 3
Тяжело было осознать, что нудно выбирать не какие-то конкретные значения вероятностей аренды и возврата машин, а ВСЕ возможные варианты. Может стоит сделать какое-либо указание к решению конкретной задачи?