Advisor | Silva, Cícera Henrique da | |
Advisor | Lins, Rosane Abdala | |
Author | Santos, Fatima Cristina Lopes dos | |
Access date | 2023-12-18T18:52:00Z | |
Available date | 2023-12-18T18:52:00Z | |
Document date | 2023 | |
Citation | SANTOS, Fatima Cristina Lopes dos. A representação temática de artigos da área de saúde pública em português: um olhar exploratório da indexação automática. 2023. 186 f. Tese (Doutorado em Informação e Comunicação em Saúde) - Instituto de Comunicação e Informação Científica e Tecnológica em Saúde, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2023. | en_US |
URI | https://www.arca.fiocruz.br/handle/icict/61868 | |
Abstract in Portuguese | Esta tese objetivou verificar o grau de coerência semântica entre a representação temática via linguagem controlada e a indexação automática dos artigos publicados em português na área de saúde pública, com o aporte teórico da mineração de textos. Propôs-se a análise da coerência semântica entre o conteúdo dos artigos científicos selecionados e sua representatividade (palavras-chave e descritores), observando o uso da indexação automática e da linguagem controlada na representação temática dessa informação em saúde. A amostra utilizada na análise foi constituída de 104 textos publicados em português em seis periódicos brasileiros da Coleção Saúde Pública, disponíveis na Scientific Electronic Library - SciELO, publicados no ano de 2020. A pesquisa baseou-se na bibliometria, apoiada no processamento da linguagem natural, com o uso de software para mineração de textos. Trata-se de um estudo exploratório-descritivo, composto por análise quantitativa e qualitativa, que possibilitou a compreensão da forma, estrutura, volume e representação desses textos para a indexação automática dessa produção. O estudo aponta que a coerência dos conteúdos dos artigos estudados com seus termos representativos poderia chegar a um melhor resultado com o uso da indexação automática. O método possibilitou o aumento do quantitativo de termos representativos do conteúdo dos textos, o que é promissor para o campo da recuperação da informação. Foi também possível perceber como esse processo pode colaborar no aprimoramento da representação de conteúdo de artigos na área da saúde pública, apesar de a área analisada possuir um vocabulário controlado | en_US |
Language | por | pt_BR |
Rights | open access | |
Subject in Portuguese | Indexação Automática | pt_BR |
Subject in Portuguese | Linguagem Natural | pt_BR |
Subject in Portuguese | Coerência Semântica | pt_BR |
Subject in Portuguese | Artigos Científicos | pt_BR |
Subject in Portuguese | Saúde Pública | pt_BR |
Subject in Portuguese | Brasil | pt_BR |
Title | A representação temática de artigos da área de saúde pública em português: um olhar exploratório da indexação automática | pt_BR |
Type | Thesis | |
Defense date | 2023 | |
Departament | Instituto de Comunicação e Informação Científica e Tecnológica em Saúde | en_US |
Defense Institution | Fundação Oswaldo Cruz | en_US |
Place of Defense | Rio de Janeiro/RJ | en_US |
Program | Programa de Pós-Graduação em Informação e Comunicação em Saúde | en_US |
Abstract | This thesis aimed to verify the degree of semantic coherence between thematic representation via controlled language and automatic indexing of articles published in Portuguese in the area of public health, with the theoretical support of text mining. It was proposed to analyze the semantic coherence between the content of selected scientific articles and their representativeness (keywords and descriptors), observing the use of automatic indexing and controlled language in the thematic representation of this health information. The sample used in the analysis consisted of 104 texts published in Portuguese in six Brazilian journals of the Public Health Collection, available at the Scientific Electronic Library - SciELO, published in 2020. The research was based on bibliometrics, supported by natural language processing, using text mining software. This is an exploratory-descriptive study, consisting of quantitative and qualitative analysis, which made it possible to understand the form, structure, volume and representation of these texts for the automatic indexing of this production. The study points out that the coherence of the contents of the articles studied could reach a better result with the use of automatic indexing. The method made it possible to increase the number of terms representative of the content of the texts, which is promising for the information retrieval field. It was also possible to see how this process can help improve the representation of the content of articles in the area of public health, despite the area analyzed having a controlled vocabulary | en_US |
Affilliation | Fundação Oswaldo Cruz. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde. Rio de Janeiro, RJ, Brasil. | en_US |
Subject | Automatic Indexing | en_US |
Subject | Natural Language | en_US |
Subject | Semantic Coherence | en_US |
Subject | Scientific Articles | en_US |
Subject | Public Health | en_US |
Subject | Brazil | en_US |
DeCS | Indexação e Redação de Resumos | pt_BR |
DeCS | Processamento de Linguagem Natural | pt_BR |
DeCS | Semântica | pt_BR |
DeCS | Saúde Pública | pt_BR |
xmlui.metadata.dc.subject.ods | 03 Saúde e Bem-Estar | |