Análise da evasão escolar no ensino técnico federal brasileiro utilizando modelos de aprendizado de máquina
Carregando...
Arquivos
Data
2024-12-31
Autores
Orientador(res)
Pinho Neto, Valdemar Rodrigues de
Métricas
Título da Revista
ISSN da Revista
Título de Volume
Resumo
A evasão escolar no ensino técnico continua sendo um obstáculo crítico para o desenvolvimento educacional e socioeconômico no Brasil. Este trabalho apresenta uma análise detalhada dos fatores que influenciam a evasão escolar em instituições técnicas federais, utilizando aprendizado de máquina para modelagem preditiva. O estudo abrange um conjunto robusto de dados com 769.717 registros de matrículas, incorporando informações sobre características pessoais e demográficas dos estudantes, indicadores institucionais e condições socioeconômicas. Modelos baseados em árvores, como XGBoost, CatBoost e LightGBM, foram empregados, com otimização de hiperparâmetros realizada por meio do Optuna. Para o tratamento das variáveis categóricas, utilizou-se o One-Hot Encoding, que demonstrou compatibilidade com as técnicas de validação cruzada adotadas para garantir a generalização dos modelos. O Gradient Boosting (XGBoost) destacou-se com a melhor AUC (85,91%), indicando maior capacidade discriminativa, enquanto o CatBoost apresentou desempenho competitivo, especialmente em métricas como precisão e acurácia, evidenciando sua adequação para análises focadas em variáveis individuais. A análise da importância das variáveis revelou que fatores institucionais, como a instituição específica, carga horária e o código da unidade, foram os principais preditores de evasão. Variáveis relacionadas aos estudantes, como idade e renda familiar, também tiveram relevância significativa. Alunos provenientes de contextos socioeconômicos adversos, ou que não declararam informações sensíveis como renda ou cor/raça, apresentaram taxas de evasão mais elevadas, sugerindo desigualdades estruturais e barreiras de acesso. Os achados deste estudo sugerem diferentes aplicações práticas: o modelo CatBoost é recomendado para intervenções personalizadas voltadas a características individuais dos estudantes, enquanto o XGBoost é mais indicado para análises estratégicas em nível institucional. Além disso, os resultados ressaltam a necessidade de políticas públicas que combinem estratégias institucionais e de assistência socioeconômica, a fim de mitigar as taxas de evasão escolar no ensino técnico.
