#1341722
Какой метод используется для балансировки "exploration" и "exploitation" в обучении с подкреплением?
Варианты ответа:
- Регуляризация
- Метод опорных векторов
- Эпсилон-жадный алгоритм (ε-greedy)
- Метод главных компонент
Курсы в категории:
Информационные технологии