Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/69041
Type
DissertationCopyright
Open access
Sustainable Development Goals
03 Saúde e Bem-Estar09 Indústria, inovação e infraestrutura
15 Vida terrestre
Collections
Metadata
Show full item record
DETECÇÃO SÍNCRONA DE PATÓGENOS HUMANOS EM METATRANSCRIPTOMAS DE AMOSTRAS AMBIENTAIS
RNA-Seq
Perfilação da Expressão Gênica
Biologia Computacional
Monitoramento Ambiental
Pinto, Ana Lídia Pires de Assis | Date Issued:
2024
Alternative title
Synchronous detection of human parasites in metatrascriptomes of environmental samplesAdvisor
Comittee Member
Affilliation
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Programa de Pós-Graduação em Biologia Computacional e Sistemas. Rio de Janeiro, RJ, Brasil.
Abstract in Portuguese
A vigilância e descoberta de patógenos é um desafio devido à própria diversidade de patógenos e de espécies hospedeiras. As tecnologias de sequenciamento de alto desempenho têm se mostrado promissoras para o desenvolvimento de um único método que possa identificar patógenos de diversas origens em qualquer espécie hospedeira. Embora a metagenômica tenha sido amplamente utilizada nesses esforços, a eficácia desse método ainda apresenta limitações. Metodologias que utilizam como ferramenta a metatranscriptômica têm demonstrado resultados mais promissores. Neste trabalho testamos uma adaptação (a remoção de RNA ribossomal) em um protocolo de metatranscriptômica já descrito para avaliar a melhora na eficiência da captura de sequências de origem viral. Três estratégias de sequenciamento foram aplicadas em cinco diferentes amostras: sequenciamento de DNA, de mRNA e de RNA com depleção ribossomal. As bibliotecas foram sequenciadas gerando leituras pareadas de 100pb. Leituras de baixa qualidade e que mapearam contra os genomas de pombo e de humano foram removidas e as leituras foram classificadas quanto a sua distribuição taxonômica usando o Kraken2 resultando em classificações nos quatro domínios da biodiversidade. Para a validação dos resultados, leituras de patógenos de interesse com diferentes valores de leituras por milhão foram extraídas e mapeadas contra os respectivos genomas para estabelecer limiares de confiança identificando falso-positivos. Após essa validação, conseguimos identificar comemaior confiança potenciais espécies patogênicas de eucariotos, bactérias e vírus presentes nas amostras iniciais. Em seguida, aplicamos a estratégia de extração de RNA com depleção de RNA ribossomal em 14 novas amostras, ampliando a aplicação do método para um conjunto maior de amostras.
Abstract
Pathogen surveillance is challenging due to the diversity of pathogens and host species. High-performance sequencing technologies hold promise for developing a unified method capable of identifying pathogens of various origins in any host species. Many efforts have used metagenomics as a tool but have not been successful. Methodologies utilizing metatranscriptomics as a tool have shown more promising results. In this work, we tested an adaptation (removal of ribosomal RNA) to a previously described metatranscriptomic protocol to assess the improvement in capturing viral-origin sequences efficiency. Three sequencing strategies were applied to five different samples: DNA sequencing, mRNA sequencing, and RNA sequencing with ribosomal depletion. The libraries were sequenced, generating 100bp paired-end reads. Low-quality reads and reads mapping to pigeon and human genomes were removed. Reads were classified by their taxonomic distribution using Kraken2, resulting in classifications across the four domains of biodiversity. For result validation, reads of interest from pathogens with different reads per million values were extracted and mapped against their respective genomes to establish confidence thresholds to identify false positives. After this validation, we were able to more confidently identify potential pathogenic species of eukaryotes, bacteria, and viruses present in the initial samples. Subsequently, we applied the RNA extraction strategy with ribosomal RNA depletion to 14 new samples, expanding the application of the method to a larger set of samples.
Keywords in Portuguese
PatógenosRNA-Seq
Perfilação da Expressão Gênica
Biologia Computacional
Monitoramento Ambiental
Share