Aprendizaje por refuerzo

Pruebas de codificación en línea y preguntas de entrevista sobre el aprendizaje por refuerzo

Python
MIDDLE
Habilidades probadas
Duración
72 minutos como máximo.
Evaluación
Automático
Resumen de la prueba

Preguntas de elección

evaluando el conocimiento de Aprendizaje automático, Aprendizaje por refuerzo

Tarea de programación - Nivel: Medio

Python | PyTorch | Aprendizaje por refuerzo | Redes Q profundas - Completa la implementación del algoritmo DQN.