Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/13624
GENÔMICA COMPARATIVA EM AMBIENTE COMPUTACIONAL DISTRIBUÍDOAPLICABILIDADE E POTENCIAL NO ESTUDO DE HOMOLOGIA ENTRE PROTOZOÁRIOS
Kotowski Filho, Nelson Peixoto | Date Issued:
2015
Advisor
Comittee Member
Affilliation
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil
Abstract in Portuguese
A inferência de homologia entre organismos é uma atividade da genômica comparativa que possibilita compreender melhor a relação entre os mesmos e, por conseguinte, sua distância evolutiva. Especificamente, a identificação de genes ortólogos, ou seja, aqueles que têm sua origem em um ancestral comum, permite oferecer melhorias na anotação funcional de genes, uma vez que genes ortólogos tendem a ter sua função conservada. Com a crescente disponibilidade de genomas através de técnicas de NGS, a construção e atualização de bases de dados de ortólogos representam um desafio constante, pois demandam o estudo e identificação das relações entre os genes de tais organismos, em um volume de dados cada vez mais extenso e a um custo computacional cada vez mais elevado. Nesta tese propomos a solução para nuvem computacional elastic-OrthoSearch, um workflow científico de genômica comparativa inspirado no OrthoSearch, responsável pela inferência de homologia entre organismos com o uso de abordagem baseada em melhores hits recíprocos e perfis de Markov. Também propomos uma metodologia para criação de bases de ortólogos construída através do reuso do OrthoSearch. Esta metodologia mostrou-se capaz de alavancar a oferta de grupos ortólogos e assim auxiliar, por exemplo, na identificação de alvos de protozoários
Abstract
Homology inference among organisms is a comparative genomics tasks which allows for a better understanding on how such organisms are related to each other and on their evolutionary distance. Specifically, the identification of orthologous genes – those who share a common ancestor – allows for functional gene annotation improvements, as orthologous genes tend to preserve their functions.
The increasing amount of genomic data provided by the NGS techniques makes the orthologous databases’ building and update processes a challenging task. It requires the identification and study of the organisms’ genes relationships, in an extensive data volume and at an increasing computational cost.
In this thesis we propose elastic-OrthoSearch, a cloud-enabled comparative genomics scientific workflow, derived from OrthoSearch. It aims at providing homology inference among organisms, in a reciprocal best hits and Markov profiles approach.
We also propose an improved orthologous database creation methodology built on top of OrthoSearch. Such methodology has shown means to offer a broader orthologous groups dataset, which could in turn aid on Protozoa target identification.
Share