CompOD : framework de conformidade LGPDpara dados abertos
Visualizar/abrir
Data
2024Orientador
Co-orientador
Nível acadêmico
Mestrado
Tipo
Assunto
Resumo
Dados abertos são um conceito atribuído ao compartilhamento de dados com qualquer pessoa. Além de serem acessados, esses dados podem ser manipulados e redistribuídos. Esta é uma tendência global que incentiva a transparência dos governos e das entidades nas suas transações, além de fornecer à sociedade conhecimento sobre dados relevantes em áreas como infraestrutura, saúde, gastos públicos e meio ambiente. Diversas iniciati vas discutem atualmente a importância dos dados abertos, seja para a so ...
Dados abertos são um conceito atribuído ao compartilhamento de dados com qualquer pessoa. Além de serem acessados, esses dados podem ser manipulados e redistribuídos. Esta é uma tendência global que incentiva a transparência dos governos e das entidades nas suas transações, além de fornecer à sociedade conhecimento sobre dados relevantes em áreas como infraestrutura, saúde, gastos públicos e meio ambiente. Diversas iniciati vas discutem atualmente a importância dos dados abertos, seja para a sociedade ou para uso e suporte em várias áreas, como em tecnologia da informação, durante o treinamento de inteligência artificial que necessitam de um grande volume de dados para operar com precisão. O uso otimizado e intercambiável de dados abertos entre organizações pode levar à chamada inovação aberta, que pode ser entendida como a utilização não apenas de dados internos das organizações, mas também de dados externos para cruzar informações e gerar sistemas e soluções mais completos e inovadores. Sabendo da relevância desse tipo de dados e de seus desafios, foi desenvolvido um framework de análise da dados abertos e verificação de sua conformidade com a lei brasileira de proteção de dados, a LGPD. A partir deste framework, foi realizado um estudo quantitativo e qualitativo de dados abertos no Brasil, e verificada a sua conformidade com a referida lei brasileira de proteção de dados, de modo a avaliar a saúde dos dados abertos disponíveis no Brasil, sendo este o diferencial da solução proposta. A metodologia utilizada nesta dissertação compreende uma análise automatizada de portais de dados abertos brasileiros por meio do sistema de gerenciamento de dados CKAN, utilizado para publicação e compartilha mento de dados abertos no mundo todo. O escopo do estudo abrange todos os estados e instituições governamentais que possuem portais de dados abertos e que são expostos por meio do CKAN. A análise quantitativa validou 1.817 conjuntos de dados, em 19 portais de dados, e verificou que, assim como estudos da literatura mencionam, as principais la cunas nos dados abertos são: dados desatualizados, ausência de metadados para suportar sua utilização e reutilização, especificação de licença de uso imprecisa e heterogeneidade no mododeexposição dos dados entre portais. O módulo de verificação de conformidade com a LGDPanalisou 11.154 recursos, contidos em 812 datasets dos estados brasileiros, e o resultado mostrou que, em quase todas as regiões analisadas, havia conjuntos de da dos com informações pessoais (como CPF) expostas. Logo, apesar do grande potencial dos dados abertos, os obstáculos também se mostraram desafiadores, e as ferramentas de controle e fiscalização necessárias. ...
Abstract
Opendata is a concept attributed to sharing data with anyone. Besides being accessed, this data can be manipulated and redistributed. This is a global trend that encourages transparency by governments and entities in their transactions, in addition to providing society with knowledge about relevant data in areas such as infrastructure, health, pub lic spending and the environment. Several initiatives currently discuss the importance of open data, whether for society or for use and support in di ...
Opendata is a concept attributed to sharing data with anyone. Besides being accessed, this data can be manipulated and redistributed. This is a global trend that encourages transparency by governments and entities in their transactions, in addition to providing society with knowledge about relevant data in areas such as infrastructure, health, pub lic spending and the environment. Several initiatives currently discuss the importance of open data, whether for society or for use and support in different areas, such as artificial intelligence training or models that use machine learning and require a large volume of data to operate accurately. The optimized and interchangeable use of open data between organizations can lead to so-called open innovation, which can be understood as the use not only of organizations’ internal data, but also of external data to cross-reference in formation and generate more complete and innovative systems and solutions. Knowing the relevance of this type of data and its challenges, a quantitative and qualitative study of open data in Brazil was performed, in addition to the development of a prototype that validated the compliance of this data with the Brazilian data protection law, LGPD, this being the differential of the proposed solution. The goal is to assess the health of open data available in Brazil. The methodology used in this article comprises an automated analysis of Brazilian open data portals through the CKAN data management system used in open data portals around the world for publishing and sharing open data. The scope of the study covers all states and government institutions that have open data por tals and are exposed through CKAN. Quantitative analysis validated 1,817 datasets across 19 data portals. It was found that, as studies in the literature mention, the main points of improvement in open data are: outdated data, lack of metadata to support the use and reuse of these, inaccurate usage license specification, and heterogeneity in the way data is exposed between portals. The LGDP compliance verification module analyzed 11,154 resources, contained in 812 datasets from Brazilian states, the result showed that in al most all regions analyzed, there were data sets with personal information (such as CPF) exposed. Therefore, despite the great potential of open data, the obstacles also proved to be challenging, and control and inspection tools are necessary. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.
Coleções
-
Ciências Exatas e da Terra (5135)Computação (1765)
Este item está licenciado na Creative Commons License