Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/61868
Type
ThesisCopyright
Open access
Sustainable Development Goals
03 Saúde e Bem-EstarCollections
Metadata
Show full item record
A REPRESENTAÇÃO TEMÁTICA DE ARTIGOS DA ÁREA DE SAÚDE PÚBLICA EM PORTUGUÊS: UM OLHAR EXPLORATÓRIO DA INDEXAÇÃO AUTOMÁTICA
Linguagem Natural
Coerência Semântica
Artigos Científicos
Saúde Pública
Brasil
Natural Language
Semantic Coherence
Scientific Articles
Public Health
Brazil
Santos, Fatima Cristina Lopes dos | Date Issued:
2023
Affilliation
Fundação Oswaldo Cruz. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde. Rio de Janeiro, RJ, Brasil.
Abstract in Portuguese
Esta tese objetivou verificar o grau de coerência semântica entre a representação temática via linguagem controlada e a indexação automática dos artigos publicados em português na área de saúde pública, com o aporte teórico da mineração de textos. Propôs-se a análise da coerência semântica entre o conteúdo dos artigos científicos selecionados e sua representatividade (palavras-chave e descritores), observando o uso da indexação automática e da linguagem controlada na representação temática dessa informação em saúde. A amostra utilizada na análise foi constituída de 104 textos publicados em português em seis periódicos brasileiros da Coleção Saúde Pública, disponíveis na Scientific Electronic Library - SciELO, publicados no ano de 2020. A pesquisa baseou-se na bibliometria, apoiada no processamento da linguagem natural, com o uso de software para mineração de textos. Trata-se de um estudo exploratório-descritivo, composto por análise quantitativa e qualitativa, que possibilitou a compreensão da forma, estrutura, volume e representação desses textos para a indexação automática dessa produção. O estudo aponta que a coerência dos conteúdos dos artigos estudados com seus termos representativos poderia chegar a um melhor resultado com o uso da indexação automática. O método possibilitou o aumento do quantitativo de termos representativos do conteúdo dos textos, o que é promissor para o campo da recuperação da informação. Foi também possível perceber como esse processo pode colaborar no aprimoramento da representação de conteúdo de artigos na área da saúde pública, apesar de a área analisada possuir um vocabulário controlado
Abstract
This thesis aimed to verify the degree of semantic coherence between thematic representation via controlled language and automatic indexing of articles published in Portuguese in the area of public health, with the theoretical support of text mining. It was proposed to analyze the semantic coherence between the content of selected scientific articles and their representativeness (keywords and descriptors), observing the use of automatic indexing and controlled language in the thematic representation of this health information. The sample used in the analysis consisted of 104 texts published in Portuguese in six Brazilian journals of the Public Health Collection, available at the Scientific Electronic Library - SciELO, published in 2020. The research was based on bibliometrics, supported by natural language processing, using text mining software. This is an exploratory-descriptive study, consisting of quantitative and qualitative analysis, which made it possible to understand the form, structure, volume and representation of these texts for the automatic indexing of this production. The study points out that the coherence of the contents of the articles studied could reach a better result with the use of automatic indexing. The method made it possible to increase the number of terms representative of the content of the texts, which is promising for the information retrieval field. It was also possible to see how this process can help improve the representation of the content of articles in the area of public health, despite the area analyzed having a controlled vocabulary
Keywords in Portuguese
Indexação AutomáticaLinguagem Natural
Coerência Semântica
Artigos Científicos
Saúde Pública
Brasil
Keywords
Automatic IndexingNatural Language
Semantic Coherence
Scientific Articles
Public Health
Brazil
Share