Ir al contenido

Aprendizaje por refuerzo

Reinforcement learning online coding tests & interview questions

Python
MEDIO
Habilidades probadas
Duración
72 minutos como máximo.
Evaluación
Automático
Resumen de la prueba

Preguntas de elección

evaluar los conocimientos de Aprendizaje automático, Aprendizaje por refuerzo

Tarea de programación - Nivel: Medio

Python | PyTorch | Aprendizaje por Refuerzo | Deep Q-Network - Completa la implementación del algoritmo DQN.