Análise de dados de altas dimensões
Visualizar/abrir
Data
2010Autor
Orientador
Nível acadêmico
Graduação
Assunto
Resumo
O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se ap ...
O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões. ...
Abstract
Technological progress is enabling new science areas to develop and, thus, new techniques are beginning to emerge. Problems previously considered unsolvable now have a computational solution. And this is not different in statistics. Increasing databases has emerged and, with this, high dimensional data arise. Areas such as chemistry, genetics and life sciences have an increasing interest in analyzing this kind of data. The current multivariate techniques do not apply in this case and, therefore ...
Technological progress is enabling new science areas to develop and, thus, new techniques are beginning to emerge. Problems previously considered unsolvable now have a computational solution. And this is not different in statistics. Increasing databases has emerged and, with this, high dimensional data arise. Areas such as chemistry, genetics and life sciences have an increasing interest in analyzing this kind of data. The current multivariate techniques do not apply in this case and, therefore, new methods must be developed. This monograph has as its main focus to review the existing literature on the topic of high dimensional data. It is shown techniques such as similarity analysis, dimensionality reduction, cluster analysis and measures of distance between DNA sequences. We present the software ImageMaster™ 2D Platinum, which is a viable alternative to the analysis of similarity between images and the software PAST and, finally, three examples illustrate the use of the methods with high dimensional data. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Curso de Estatística: Bacharelado.
Coleções
-
TCC Estatística (295)
Este item está licenciado na Creative Commons License