Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/67941
TEXT MINING METHOD TO UNRAVEL LONG COVID’S CLINICAL CONDITION IN HOSPITALIZED PATIENTS
Author
Florentino, Pilar Tavares Veras
Araújo, Vinícius de Oliveira
Zatti, Henrique
Luis, Caio Vinícius
Cavalcanti, Célia Regina Santos
Oliveira, Matheus Henrique Citibaldi de
Leão, Anderson Henrique França Figueredo
Bertoldo Junior, Juracy
Barbosa, George G. Caique
Ravera, Ernesto
Cebukin, Alberto
David, Renata Bernardes
Melo, Danilo Batista Vieira de
Machado, Tales Mota
Bellei, Nancy C. J.
Boaventura, Viviane
Barral Netto, Manoel
Smaili, Soraya S.
Araújo, Vinícius de Oliveira
Zatti, Henrique
Luis, Caio Vinícius
Cavalcanti, Célia Regina Santos
Oliveira, Matheus Henrique Citibaldi de
Leão, Anderson Henrique França Figueredo
Bertoldo Junior, Juracy
Barbosa, George G. Caique
Ravera, Ernesto
Cebukin, Alberto
David, Renata Bernardes
Melo, Danilo Batista Vieira de
Machado, Tales Mota
Bellei, Nancy C. J.
Boaventura, Viviane
Barral Netto, Manoel
Smaili, Soraya S.
Affilliation
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Laboratório de Medicina e Saúde Pública de Precisão. Salvador, BA, Brasil / Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil / Universidade Federal da Bahia. Faculdade de Medicina da Bahia. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade de São Paulo. Faculdade de Medicina. São Paulo, SP, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil / Universidade Federal de Ouro Preto. Diretoria de Tecnologia da Informação. Ouro Preto, MG, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Disciplina de Moléstias Infecciosas. São Paulo, SP, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Laboratório de Medicina e Saúde Pública de Precisão. Salvador, BA, Brasil / Universidade Federal da Bahia. Faculdade de Medicina da Bahia. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Laboratório de Medicina e Saúde Pública de Precisão. Salvador, BA, Brasil / Universidade Federal da Bahia. Faculdade de Medicina da Bahia. Salvador, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, SP, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil / Universidade Federal da Bahia. Faculdade de Medicina da Bahia. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, BA, Brasil.
Universidade de São Paulo. Faculdade de Medicina. São Paulo, SP, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Centro de Integração de Dados e Conhecimentos para a Saúde. Salvador, BA, Brasil / Universidade Federal de Ouro Preto. Diretoria de Tecnologia da Informação. Ouro Preto, MG, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Disciplina de Moléstias Infecciosas. São Paulo, SP, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Laboratório de Medicina e Saúde Pública de Precisão. Salvador, BA, Brasil / Universidade Federal da Bahia. Faculdade de Medicina da Bahia. Salvador, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Gonçalo Moniz. Laboratório de Medicina e Saúde Pública de Precisão. Salvador, BA, Brasil / Universidade Federal da Bahia. Faculdade de Medicina da Bahia. Salvador, BA, Brasil.
Universidade Federal de São Paulo. Escola Paulista de Medicina. Departamento de Farmacologia. São Paulo, SP, Brasil.
Abstract
Long COVID is characterized by persistent that extends symptoms beyond established timeframes. Its varied presentation across different populations and healthcare systems poses significant challenges in understanding its clinical manifestations and implications. In this study, we present a novel application of text mining technique to automatically extract unstructured data from a long COVID survey conducted at a prominent university hospital in São Paulo, Brazil. Our phonetic text clustering (PTC) method enables the exploration of unstructured Electronic Healthcare Records (EHR) data to unify different written forms of similar terms into a single phonemic representation. We used n-gram text analysis to detect compound words and negated terms in Portuguese-BR, focusing on medical conditions and symptoms related to long COVID. By leveraging text mining, we aim to contribute to a deeper understanding of this chronic condition and its implications for healthcare systems globally. The model developed in this study has the potential for scalability and applicability in other healthcare settings, thereby supporting broader research efforts and informing clinical decision-making for long COVID patients.
Share