📚
Все вопросы
- Какой из следующих алгоритмов относится к методам обучения с подкреплением? #101
- Что такое политика (policy) в обучении с подкреплением? #102
- … - нейронная сеть, обучаемая с помощью алгоритма обратного распространения ошибки. #103
- Нейрон отображает: #104
- Что означает термин "exploration" в обучении с подкреплением? #105
- Осуществляется ли правовое регулирование в сфере искусственного интеллекта на территории РФ? #106
- Какой метод используется для балансировки "exploration" и "exploitation" в обучении с подкреплением? #107
- Что такое "reward" в контексте обучения с подкреплением? #108
- Как называется процесс, при котором агент использует текущую политику для сбора данных и обновления модели? #109