Avaliação da indexação automática de documentos eletrônicos no software Adobe Acrobat versão 5.0
Visualizar/abrir
Data
2004Autor
Orientador
Nível acadêmico
Graduação
Assunto
Resumo
Avaliação da indexação automática realizada pelo Adobe Acrobat. Este trabalho teve como objetivo a avaliação da indexação automática em documentos eletrônicos em formato PDF realizada pelo recurso Adobe Catalog, disponível na versão 5.0 do Adobe Acrobat, quanto à recuperação de informações, levando-se em conta o nível de especificidade dos termos, gênero (masculino/feminino), número (singular/plural), equivalência e o comportamento do software na recuperação de sintagmas nominais. O universo es ...
Avaliação da indexação automática realizada pelo Adobe Acrobat. Este trabalho teve como objetivo a avaliação da indexação automática em documentos eletrônicos em formato PDF realizada pelo recurso Adobe Catalog, disponível na versão 5.0 do Adobe Acrobat, quanto à recuperação de informações, levando-se em conta o nível de especificidade dos termos, gênero (masculino/feminino), número (singular/plural), equivalência e o comportamento do software na recuperação de sintagmas nominais. O universo estudado foi composto dos 20 Trabalhos de Conclusão de Curso (TCC) do curso de Biblioteconomia da Universidade Federal do Rio Grande do Sul no segundo semestre de 2003. Após a construção automática do índice pelo software, cada uma das palavras-chave atribuídas nos trabalhos de conclusão foram utilizadas como termos de busca e o conjunto de documentos recuperados em cada uma das buscas foi anotado na ficha de observação. Os resultados mostraram que 77% das palavras-chave presentes nos TCC recuperaram seus documentos de origem. As palavras-chave que não trouxeram resultados nas buscas eram sintagmas de segundo e terceiro níveis. Três das cinco variações de gênero não produziram resultados nas buscas. Das 36 palavras flexionadas por número, seis não recuperaram documentos. Não foram detectados problemas na especificidade do vocabulário que interferissem na recuperação de documentos. Os termos equivalentes não apresentaram problemas, exceto quando localizados em trabalhos distintos gerando uma dispersão nos resultados das buscas. Apesar de suas limitações, o Adobe Catalog conseguiu recuperar de maneira satisfatória os documentos indexados em um acervo especializado na área de Ciência da Informação. O aprimoramento desta ferramenta poderá contribuir para o aumento de sua eficácia, justificando também a sua utilização em acervos de cunho geral. ...
Abstract
Evaluation of automatic indexing performed by Adobe Acrobat. This work aimed to evaluate the automatic indexing of electronic documents in PDF format performed by Adobe Catalog feature available in Adobe Acrobat version 5.0. The specificity level of indexing, gender (masculine/feminine), number (singular/plural), equivalence issues and nominal sintagma retrieval were studied. The total of 20 Final Library Science Courseworks presented in the second term of 2003 at the Federal University of Rio ...
Evaluation of automatic indexing performed by Adobe Acrobat. This work aimed to evaluate the automatic indexing of electronic documents in PDF format performed by Adobe Catalog feature available in Adobe Acrobat version 5.0. The specificity level of indexing, gender (masculine/feminine), number (singular/plural), equivalence issues and nominal sintagma retrieval were studied. The total of 20 Final Library Science Courseworks presented in the second term of 2003 at the Federal University of Rio Grande do Sul will be automatically indexed. After the indexing process, each of the keywords presented in those Final Courseworks will be used as search terms and the documents retrieved during those searches will be listed in the observation card. The results showed that 77% of the keywords appearing in those Final Courseworks retrieved its origin documents. The keywords that didn't retrieve any documents belonged to second and third grade nominal sintagma. Three out of five keywords with gender variations didn't retrieve any document. Among 36 keywords with number variations, six produced no results during searches. No major problems were detected due to specificity issues. Equivalence issues were not detected, except when those equivalents were present at different documents. Although its limitations, Adobe Catalog feature fairly retrieved documents in a Library Science digital collection. The improvement of this tool will contribute to achieve a better level of efficacy, justifying its use in general subject collections. ...
Instituição
Universidade Federal do Rio Grande do Sul. Faculdade de Biblioteconomia e Comunicação. Curso de Biblioteconomia.
Coleções
-
TCC Biblioteconomia (816)
Este item está licenciado na Creative Commons License