- Habilidades probadas
- Duración
- 72 minutos como máximo.
- Evaluación
- Automático
- Resumen de la prueba
-
Preguntas de elección
evaluar los conocimientos de Aprendizaje automático, Aprendizaje por refuerzo
Tarea de programación - Nivel: Medio
Python | PyTorch | Aprendizaje por Refuerzo | Deep Q-Network - Completa la implementación del algoritmo DQN.