Please use this identifier to cite or link to this item: https://www.arca.fiocruz.br/handle/icict/30225
Title: De Supergrupos a Superfamílias, um estudo de homologia em protozoários
Advisor: Rivera Davila, Alberto Martin
Authors: Campos, Darueck Acácio
Affilliation: Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.
Abstract: Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes).
Abstract: Pathogenic protozoa cause major diseases in tropical countries, such as malaria, sleeping sickness, Chagas disease, leishmaniasis, amebiasis and giardiasis, which together threaten millions of people worldwide. In addition, most parasitic diseases caused by protozoa are zoonotic. Understanding the biology of these organisms is crucial in combating the diseases they cause, and studies of comparative genomics may be helpful in understanding the evolutionary relationship between them. Using comparative genomic inference and homology, the present study aimed at three protozoan species of different phyla: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) and Trypanosoma grayi (Euglenozoa), chosen as pathogens that have not yet been studied and the genetic distance between them. The thesis can be divided into 3 parts. In a first part the inference programs OMA and OrthoMCL were used to infer homologous genes and their results were compared and separated into 3 categories according to the level of agreement between them, with emphasis on the identification of homologous groups with greater evolutionary distance and in the CDD (Conserved Domain Database) and Pfam-A (Pfam protein families database) multidomain identification In the second part, we propose a new approach for the identification of homologues, based on the definition of homologous "Supergroups", formed by the reconciliation of the results of both programs; Using as criterion for inference the intersection of proteins and for their validation criteria of high stringency, where all proteins (100%) of the Supergroup must (a) have the same conserved domain (CDD) identified or (b) belong to the same protein family (Pfam-A). In the third and final part, a search was made for distant homologous genes between the same protozoa of different phyla used in the first and second studies using a comparison of profiles of the Occult Markov Model (pHMM - pHMM), with the inference program COMA, aiming at the identification of superfamilies of proteins using the database of families and superfamilies of proteins SUPERFAMILY. Our results showed that it was possible to infer new groups of homologous proteins using the reconciliation (Supergroup homologous) and the pHMM - pHMM (New distant homologous groups) approaches.
keywords: Homologia de Genes
Genômica
Genoma de Protozoário
DeCS: Metodologias Computacionais
Issue Date: 2018
Citation: CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018.
Date of defense: 2018
Place of defense: Rio de Janeiro
Department: Instituto Oswaldo Cruz
Defense institution: Fundação Oswaldo Cruz
Program: Programa de Pós-Graduação em Biologia Computacional e Sistemas
Copyright: open access
Appears in Collections:IOC - PGBCS - Teses de Doutorado

Files in This Item:
File Description SizeFormat 
darueck_campos_ioc_dout_2018.pdf10.76 MBAdobe PDFView/Open


FacebookTwitterDeliciousLinkedInGoogle BookmarksBibTex Format mendeley Endnote DiggMySpace

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.