ASKGene, um sistema para processamento automatizado de DNA

Universidade Estadual de Santa Cruz. Laboratório de Bioinformática. Itabuna, BA, Brasil.
Universidade Estadual de Santa Cruz. Núcleo de Biologia Computacional e Gestão de Informações Biotecnológicas. Itabuna, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Laboratório de Genômica Funcional e Bioinformática. Rio de Janeiro, RJ, Brasil.
Universidade Estadual de Santa Cruz. Núcleo de Biologia Computacional e Gestão de Informações Biotecnológica. Itabuna, BA, Brasil.

Abstract in Portuguese

Os recursos computacionais se tornaram essenciais para o desenvolvimento de projetos genoma. Vários sistemas distribuídos que gerenciam estruturas complexas e que integram interfaces gráficas voltadas para o usuário, processamento e mineração de grandes quantidades de dados e bancos de dados volumosos, foram propostos. A maioria dos laboratórios de seqüenciamento já consolidados desenvolveu soluções próprias. Entretanto, um sistema portável e escalonável, integrando todos esses aspectos, ainda não está disponível para a comunidade científica. Neste estudo, apresentamos um protótipo de tal sistema em curso de desenvolvimento aberto em http://sourceforge.net/projects/ askgene. Este sistema permite (i) acessibilidade aos dados e processos ao longo de todo o fluxo de dados, (ii) representação de dados e ontologia, (iii) manejo do fluxo de processamento (workflow), (iv) arquitetura e documentação do sistema, (v) desenvolvimento corporativo, anotação manual, (vii) processamento de dados corrompidos, (viii) distribuição e paralelização de processos, (ix) portabilidade e escalonabilidade.

Abstract

Computational resources have become essential for genome project development. Distributed systems managing complex structures integrating graphical user interfaces, expensive data processing, data mining and large databases, have been proposed. Most consolidated sequencing laboratories have developed their own bioinformatics solutions. However, a portable and scalable system integrating all these aspects is not yet available to the scientific community. In this report, we present the prototype of such a system in open development at htttp://sourceforge.net/projects/askgene. It allows for the (i) accessibility of data and processes all along the data flow, (ii) data representation and ontology, (iii) workflow tuning, (iv) system architecture and documentation, (v) corporate development, (vi) manual annotation, (vii) bogus data processing, (viii) process parallelization and distribution, (ix) portability and scalability.

Keywords in Portuguese

Anotação de Gene
Perl
Banco de Dados Relacional
PostgreSQL
Código Aberto

Keywords

Gene Annotation
Perl
Relational Database
PostgreSQL
Open Source

Publisher

Fundação Oswaldo Cruz. Instituto de Comunicação e Informação Cientifica e Tecnológica em Saúde.

Citation

CARDIM, Eden Cardoso etal. ASKGene, um sistema para processamento automatizado de DNA. RECIIS - Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 1, n. 2, p.Sup304-Sup308, 2007.

DOI

10.3395/reciis.v1i2.Sup.100pt

ISSN

1981-6278

Please use this identifier to cite or link to this item: https://www.arca.fiocruz.br/handle/icict/17603

Type

Copyright

Open access

Collections

Share

Statistics

Metadata

Alternative title

Author

Affilliation