Aplicação de Ciência de Dados e de algoritmos de Aprendizagem Automática para identificação de perfis de risco e antecipação de casos de insucesso e abandono
Na sequência da implementação de alertas no sistema de gestão académica, é possível iniciar-se o processo de monitorização e identificação de situações de potencial abandono, de forma mais automatizada.
No entanto, ao listar os estudantes que obtiveram aprovação a um número de ECTS abaixo da expectativa apenas no final dos semestres letivos, só se permite a identificação a posteriori das situações potencialmente críticas. Quer isto dizer que, para alguns dos casos, o aviso surgirá apenas após a consumação do abandono.
Será desta forma desejável a implementação de um sistema de avisos mais dinâmico, que permita a emissão de alertas em função do comportamento do estudante ao longo do semestre (assiduidade nos casos em que a mesma é obrigatória, resultados de testes intercalares, ritmo de pagamento de propinas). Para que, no futuro, esse sistema possa ser desenhado e implementado no sistema FenixEdu, é importante determinar quais são os perfis de risco que potenciam o insucesso académico e o eventual abandono.
É este o objetivo desta atividade. Pretende-se utilizar os algoritmos da Ciência de Dados para “extrair” e identificar esses perfis de risco utilizando-se para o efeito (de forna anónima) todos os registos académicos de todos os estudantes que estiveram inscritos na ULisboa nos anos mais recentes. Esses dados devem incluir os dados sociodemográficos, os registos relativos ao aproveitamento académico, e os registos associados ao pagamento de propinas.
Este trabalho será realizado em três fases:
- Na primeira, devem ser identificados os dados a coligir e a forma como os mesmos devem ser organizados;
- A segunda fase corresponde à criação da base de dados de trabalho com a exportação de toda a informação necessária a partir dos registos existentes nos sistemas de informação académica e contabilística;
- A terceira fase passa pela exploração e utilização dos algoritmos que possam identificar as condições de risco que potenciam situações de insucesso académico e abandono.