📚
Все вопросы
- В чем основное преимущество использования функции «ReLU» вместо «сигмоидных» функций? #201
- Какова основная цель «глубокого обучения с подкреплением»? #202
- Что означает «обучение от начала до конца» в глубоком обучении? #203
- Что такое обучение с подкреплением? #204
- Какой из следующих алгоритмов используется для оценки функции ценности в обучении с подкреплением? #205
- Как называется функция, определяющая ценность состояния в обучении с подкреплением? #206
- Что такое эпизод в контексте обучения с подкреплением? #207
- Какой из следующих алгоритмов относится к методам обучения с подкреплением? #208
- Что такое политика (policy) в обучении с подкреплением? #209
- … - нейронная сеть, обучаемая с помощью алгоритма обратного распространения ошибки. #210