Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/69406
DESENVOLVIMENTO E APLICAÇÃO DE UMA FERRAMENTA DE BIOINFORMÁTICA PARA ANÁLISE INTRA E INTER HOSPEDEIRO DO VÍRUS SARS-COV-2 DURANTE A PANDEMIA DA COVID-19 NO BRASIL
Dezordi, Filipe Zimmer | Date Issued:
2024
Author
Advisor
Affilliation
Fundação Oswaldo Cruz. Instituto Aggeu Magalhães. Rio de Janeiro, RJ, Brasil.
Abstract in Portuguese
AO vírus SARS-CoV-2 (Severe Acute Respiratory Syndrome-related Coronavirus 2) é o agente etiológico da doença COVID-19, notificada pela primeira vez como conjunto de casos de pneumonia pela comissão municipal de Wuhan em 31 de dezembro de 2019. Em 12 de janeiro de 2020, foi disponibilizado o primeiro genoma completo do vírus SARS-CoV-2 em bancos de dados públicos. Desde então, este vírus se espalhou globalmente, originando, conforme publicado pela Organização Mundial da Saúde, uma pandemia de nível global. No Brasil, até 12 de Maio de 2024, foram notificados mais de 38 milhões de casos e mais de 700 mil mortes. No mesmo período, foram disponibilizados publicamente mais de 16,7 milhões de genomas globalmente, sendo mais de 250 mil do Brasil, através de iniciativas de vigilância genômica. A vigilância genômica é o emprego de técnicas laboratoriais e computacionais que permitem acessar dados da diversidade genética das linhagens circulantes em tempo real, dessa forma, é possível, através da análise de genomas completos, entender quais mutações estão se originando, e se espalhando, durante o curso da pandemia. Esta tese teve como objetivo entender a plasticidade genômica do SARS-CoV-2 através do desenvolvimento e do emprego de metodologias computacionais para análise de dados em larga escala. Foi desenvolvido um fluxo de trabalho de análise genômica viral, nomeado ViralFlow, o qual foi a principal ferramenta utilizada para análise de dados genômicos públicos SARS-CoV-2, totalizando mais de 44 mil genomas analisados por essa ferramenta até Maio de 2024. Foi realizada a vigilância genômica do vírus SARS-CoV-2 durante os anos de 2020 a 2022 no estado do Rio Grande do Sul identificando o período de entrada e circulação de diferentes linhagens, incluindo linhagens consideradas de preocupação, como Gama, Delta e Omicron. Foi realizado também o estudo dos padrões de variantes intra hospedeiro, seus impactos em casos de co-infecção e também os padrões de assinaturas mutacionais atreladas a diferentes variantes durante 3 anos de circulação do SARS-CoV-2 em 18 estados Brasileiros, o que ajuda a entender o substrato para a evolução desse vírus.
Abstract
The SARS-CoV-2 virus (Severe Acute Respiratory Syndrome-related Coronavirus 2) is the etiological agent of the COVID-19 disease, first reported as a series of pneumonia cases by the Wuhan municipal commission on December 31, 2019. On January 12, 2020, the first complete genome of the SARS-CoV-2 virus was made publicly available in public databases. Since then, this virus has spread globally, resulting in a worldwide pandemic, as published by the World Health Organization. In Brazil, by May 12, 2024, over 38 million cases and more than 700,000 deaths have been reported. During the same period, over 16.7 million genomes have been made publicly available worldwide, with over 250,000 from Brazil, through genomic surveillance initiatives. Genomic surveillance is the use of laboratory and computational techniques that allow real-time access to the genetic diversity data of circulating lineages. By analyzing complete genomes, it is possible to understand which mutations are emerging and spreading during the course of the pandemic. This thesis aimed to understand the genomic plasticity of SARS-CoV-2 through the development and use of computational methodologies for large-scale data analysis. A viral genomic analysis workflow, named ViralFlow, was developed and served as the main tool for analyzing public SARS-CoV-2 genomic data, totaling more than 44,000 genomes analyzed by this tool by May 2024. Genomic surveillance of the SARS-CoV-2 virus was conducted from 2020 to 2022 in the state of Rio Grande do Sul, identifying the entry and circulation periods of diferente lineages, including lineages of concern such as Gamma, Delta, and Omicron. The study also investigated intra-host variant patterns, their impacts in cases of co-infection, and the mutational signature patterns associated with different variants during 3 years of SARS-CoV-2 circulation in 18 Brazilian states, which helps to understand the substrate for the evolution of this virus.
Share