#1341722
Какой метод используется для балансировки "exploration" и "exploitation" в обучении с подкреплением?
Варианты ответа:
  • Регуляризация
  • Метод опорных векторов
  • Эпсилон-жадный алгоритм (ε-greedy)
  • Метод главных компонент
Курсы в категории: Информационные технологии