Classificação com inferência para dados de alta dimensão
Visualizar/abrir
Data
2022Autor
Orientador
Co-orientador
Nível acadêmico
Mestrado
Tipo
Assunto
Resumo
Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de ream ...
Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação. ...
Abstract
In this work we propose a classification method with inference for two or more groups in the high dimensional low sample size context. The classification method is compared with a recently proposed methodology, through simulations and application to a real dataset. Furthermore, a hypothesis test is proposed and the asymptotic properties of the test statistics are obtained, however the estimation of the variance is given from a procedure resampling process. Simulation results show that the class ...
In this work we propose a classification method with inference for two or more groups in the high dimensional low sample size context. The classification method is compared with a recently proposed methodology, through simulations and application to a real dataset. Furthermore, a hypothesis test is proposed and the asymptotic properties of the test statistics are obtained, however the estimation of the variance is given from a procedure resampling process. Simulation results show that the classifier is competitive with the existing methodology and the possibility of identifying whether the classification in a certain group is statistically significant makes it possible to control the type I error, proving to be an important tool in classification problems. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Programa de Pós-Graduação em Estatística.
Coleções
-
Ciências Exatas e da Terra (5129)Estatística (27)
Este item está licenciado na Creative Commons License