O objetivo deste projeto é resolver problemas que envolvem tomada de decisões sequenciais sob incerteza por meio da construção de agentes que aprendem por reforço. Problemas dessa natureza envolvem situações em que um agente (seja ele humano, uma organização ou um programa de computador) precisa tomar uma série de decisões ao longo do tempo, e cada decisão pode influenciar as futuras opções disponíveis e os resultados possíveis.   EXEMPLOS DE APLICAÇÃO:   RECURSOS DE INFRAESTRUTURA OBRIGATÓRIOS:   FINALIZAÇÃO E ENTREGA DO PROJETO: Todos os protótipos gerados durante o projeto são entregues ao final da 10° semana.