Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
Visualizar/abrir
Data
2024Autor
Orientador
Nível acadêmico
Mestrado
Tipo
Outro título
Application of multivariate techniques to characterize quality in coffee spectral data
Assunto
Resumo
A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degusta ...
A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos. ...
Abstract
The application of multivariate techniques is essential in analyzing infrared spectroscopy data due to the high volume of noisy variables and elevated collinearity in these datasets. This dissertation aims to apply multivariate techniques to coffee spectral data and identify the most informative wavelengths for two distinct objectives: (i) to predict taster scores and (ii) to classify samples into quality categories. To predict the taster scores, mRMR, Relief, and PLS regression coefficients ar ...
The application of multivariate techniques is essential in analyzing infrared spectroscopy data due to the high volume of noisy variables and elevated collinearity in these datasets. This dissertation aims to apply multivariate techniques to coffee spectral data and identify the most informative wavelengths for two distinct objectives: (i) to predict taster scores and (ii) to classify samples into quality categories. To predict the taster scores, mRMR, Relief, and PLS regression coefficients are initially used to quantify the importance of the wavelengths. Next, an iterative removal process based on the importance index assigned by these selection techniques is applied, comparing the performance of PLS (Partial Least Squares) and XGBoost (Extreme Gradient Boosting) in predicting the scores of the coffee tasters. Predictive performance was evaluated using RMSE (Root Mean Squared Error) and the standard deviation of the residuals. For classifying the samples into two quality categories, the performance of combinations of mRMR and Relief with three classification techniques—kNN (k-Nearest Neighbors), Naive Bayes, and SVM (Support Vector Machine)—is analyzed. The classification models were evaluated using accuracy, sensitivity, and specificity metrics. A backward iterative removal process was also applied to eliminate less relevant wavelengths. Applying these techniques allows more accurate predictions and classifications to be achieved while also reducing the number of irrelevant wavelengths in the models. ...
Instituição
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Programa de Pós-Graduação em Engenharia de Produção e Transportes.
Coleções
-
Engenharias (7518)Engenharia de Produção (1242)
Este item está licenciado na Creative Commons License
