Aprimorando a tomada de decisão em saúde com aprendizado de máquina em problemas de classificação em dados desbalanceados
Visualizar/abrir
Data
2024Autor
Orientador
Nível acadêmico
Doutorado
Tipo
Assunto
Resumo
Essa tese aborda a classificação de dados desbalanceados na área da saúde, propondo um workflow adequado para lidar com essa complexidade por meio de Machine Learning (ML) supervisionado. Composta por três artigos, a pesquisa apresenta estratégias para lidar com o desbalanceamento, além de explorar a generalização e a interpretabilidade dos algoritmos de ML. Os objetivos são: (i) definir um framework para classificação em bancos de dados desbalanceados; (ii) avaliar a capacidade de generalizaçã ...
Essa tese aborda a classificação de dados desbalanceados na área da saúde, propondo um workflow adequado para lidar com essa complexidade por meio de Machine Learning (ML) supervisionado. Composta por três artigos, a pesquisa apresenta estratégias para lidar com o desbalanceamento, além de explorar a generalização e a interpretabilidade dos algoritmos de ML. Os objetivos são: (i) definir um framework para classificação em bancos de dados desbalanceados; (ii) avaliar a capacidade de generalização dos modelos em situações do mundo real; (iii) propor direções futuras para a interpretabilidade dos resultados visando apoiar decisões médicas. Do ponto de vista prático, a aplicação da tese é validada através de dois estudos de caso: o primeiro identificando pacientes com diabetes com maior risco de hospitalização, otimizando o direcionamento de recursos hospitalares e o segundo sobre estimativas de no-show (não comparecimento) em consultas médicas, com o objetivo de melhorar o serviço prestado aos pacientes. ...
Abstract
This dissertation addresses the classification of imbalanced datasets in the healthcare domain, proposing a workflow to deal with such complexity through supervised machine learning. Comprising three articles, the research presents strategies for handling imbalance while exploring the generalization and interpretability of machine learning models. The objectives are: (i) to define a framework for classification in imbalanced databases; (ii) to evaluate the models' generalization ability in real ...
This dissertation addresses the classification of imbalanced datasets in the healthcare domain, proposing a workflow to deal with such complexity through supervised machine learning. Comprising three articles, the research presents strategies for handling imbalance while exploring the generalization and interpretability of machine learning models. The objectives are: (i) to define a framework for classification in imbalanced databases; (ii) to evaluate the models' generalization ability in real-world situations; (iii) to propose future directions for result interpretability to support medical decision-making. From a practical standpoint, the dissertation is validated through two case studies: the first identifying diabetic patients at higher risk of hospitalization, optimizing the allocation of hospital resources, and the second on predictions of no-show in medical appointments, aiming to enhance the service provided to patients. ...
Instituição
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Programa de Pós-Graduação em Engenharia de Produção e Transportes.
Coleções
-
Engenharias (7518)Engenharia de Produção (1242)
Este item está licenciado na Creative Commons License
