Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos

Fontes, Juliana de Abreu

Visualizar/abrir

Texto parcial (419.2Kb)

Data

2024

Autor

Fontes, Juliana de Abreu

Orientador

Anzanello, Michel José

Nível acadêmico

Doutorado

Resumo

A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade. ...

Abstract

The management and analysis of large data volumes are complex challenges driven by technological advancements in the collection and monitoring of processes and products. Emphasizing the importance of careful feature selection and advanced preprocessing strategies, such as data fusion and feature engineering, enhances machine learning model performance. This thesis presents innovative propositions to optimize product quality and authenticity control, reduce operational costs, and improve analytical model performance. The first article aims to identify the most relevant analytical techniques and variables for evaluating the authenticity of Cialis® and Viagra® samples. It integrates the low-level data fusion (LLDF) strategy with the XGBoost classification algorithm and provides a detailed descriptive analysis of the findings. This combination not only delivers precise numerical results but also guides a more detailed interpretation of the problem. The second article proposes a two-phase framework that incorporates an initial pre-selection stage of wavelengths (COs) guided by wavelength clustering, integrated with a wrapper-based approach. The proposal was applied to 11 FTIR/NIR datasets from different domains to classify samples into quality and authenticity levels. Finally, the third article addresses the development and implementation of a method combining feature selection and feature engineering stages. The study evaluates the impact of the proposed approach and the contribution of each stage to the efficacy of machine learning models. The proposal was validated on 8 FTIR/NIR datasets from different domains to classify samples into quality and authenticity levels. ...

Instituição

Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Programa de Pós-Graduação em Engenharia de Produção e Transportes.

Coleções

Engenharias (7492)

Engenharia de Produção (1237)

Outras opções

Mostrar todos os metadados

Estatísticas

Este item está licenciado na Creative Commons License