Author | Pinto, Clicia | |
Author | Pita, Robespierre | |
Author | Barbosa, George | |
Author | Araújo, Bruno | |
Author | Bertoldo, Juracy | |
Author | Sena, Samila | |
Author | Reis, Sandra | |
Author | Fiaccone, Rosemeire | |
Author | Amorim, Leila | |
Author | Ichihara, Maria Yuri | |
Author | Barreto, Mauricio | |
Author | Barreto, Marcos | |
Author | Denaxas, Spiros | |
Access date | 2024-06-20T12:57:32Z | |
Available date | 2024-06-20T12:57:32Z | |
Document date | 2017 | |
Citation | PINTO, Clicia et al. Probabilistic integration of large Brazilian socioeconomic and clinical databases. In: INTERNATIONAL SYMPOSIUM ON COMPUTER-BASED MEDICAL SYSTEMS (CBMS), 30, Thessaloniki, Greece, 2017. Anais eletrônicos [...] Thessaloniki, Greece: IEEE, 2017. | en_US |
URI | https://www.arca.fiocruz.br/handle/icict/64579 | |
Language | eng | en_US |
Publisher | Institute of Electrical and Electronic Engineers | en_US |
Rights | open access | en_US |
Subject in Portuguese | Integração de dados | en_US |
Subject in Portuguese | Ligação probabilística | en_US |
Subject in Portuguese | Dados de saúde e assistência social | en_US |
Subject in Portuguese | Avaliação de precisão | en_US |
Title | Probabilistic integration of large Brazilian socioeconomic and clinical databases | en_US |
Type | Papers presented at events | en_US |
Abstract | The integration of disparate large and heterogeneous socioeconomic and clinical databases is considered essential to capture and model longitudinal and social aspects of diseases. However, such integration is challenging: databases are stored in disparate locations, make use of different identifiers, have variable data quality, record information in bespoke purpose-specific formats and have different levels of metadata. Novel computational methods are required to integrate them and enable their statistical analyses for epidemiological research purposes. In this paper, we describe a probabilistic approach for constructing a very large population-based cohort comprised of 114 million individuals using linkages between clinical databases from the National Health System and administrative databases from governmental social programmes. We present our data integration model for creating data marts (epidemiological data) and discuss our evaluation results in controlled and uncontrolled scenarios, which demonstrate that our model and tools achieve high accuracy (minimum of 91%) in different probabilistic data integration scenarios. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimento para Saúde (CIDACS), Salvador, BA, Brasil. | en_US |
Affilliation | University College London (UCL). Farr Institute of Health Informatics Research. London, UK. | en_US |
Affilliation | University College London (UCL). Farr Institute of Health Informatics Research. London, UK. | en_US |
Subject | Data integration | en_US |
Subject | Probabilistic linkage | en_US |
Subject | Health and social care data | en_US |
Subject | Accuracy assessment | en_US |
DeCS | Agregação de dados | en_US |
DeCS | Apoio Social | en_US |