Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/17603
ASKGENE, UM SISTEMA PARA PROCESSAMENTO AUTOMATIZADO DE DNA
Alternative title
ASKGene, a system for automate DNA processingAuthor
Affilliation
Universidade Estadual de Santa Cruz. Laboratório de Bioinformática. Itabuna, BA, Brasil.
Universidade Estadual de Santa Cruz. Núcleo de Biologia Computacional e Gestão de Informações Biotecnológicas. Itabuna, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Laboratório de Genômica Funcional e Bioinformática. Rio de Janeiro, RJ, Brasil.
Universidade Estadual de Santa Cruz. Núcleo de Biologia Computacional e Gestão de Informações Biotecnológica. Itabuna, BA, Brasil.
Universidade Estadual de Santa Cruz. Núcleo de Biologia Computacional e Gestão de Informações Biotecnológicas. Itabuna, BA, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Laboratório de Genômica Funcional e Bioinformática. Rio de Janeiro, RJ, Brasil.
Universidade Estadual de Santa Cruz. Núcleo de Biologia Computacional e Gestão de Informações Biotecnológica. Itabuna, BA, Brasil.
Abstract in Portuguese
Os recursos computacionais se tornaram essenciais para o desenvolvimento de projetos genoma. Vários sistemas distribuídos que gerenciam estruturas complexas e que integram interfaces gráficas voltadas para o usuário, processamento e mineração de grandes quantidades de dados e bancos de dados volumosos, foram propostos. A maioria dos laboratórios de seqüenciamento já consolidados desenvolveu soluções próprias. Entretanto, um sistema portável e escalonável, integrando todos esses aspectos, ainda não está disponível para a comunidade científica. Neste estudo, apresentamos um protótipo de tal sistema em curso de desenvolvimento aberto em http://sourceforge.net/projects/ askgene. Este sistema permite (i) acessibilidade aos dados e processos ao longo de todo o fluxo de dados, (ii) representação de dados e ontologia, (iii) manejo do fluxo de processamento (workflow), (iv) arquitetura e documentação do sistema, (v) desenvolvimento corporativo, anotação manual, (vii) processamento de dados corrompidos, (viii) distribuição e paralelização de processos, (ix) portabilidade e escalonabilidade.
Abstract
Computational resources have become essential for genome project development. Distributed systems managing complex structures integrating graphical user interfaces, expensive data processing, data mining and large databases, have been proposed. Most consolidated sequencing laboratories have developed their own bioinformatics solutions.
However, a portable and scalable system integrating all these aspects is not yet available to the scientific community. In this report, we present the prototype of such a system in open development at htttp://sourceforge.net/projects/askgene.
It allows for the (i) accessibility of data and processes all along the data flow, (ii) data representation and ontology, (iii) workflow tuning, (iv) system architecture and documentation, (v) corporate development, (vi) manual annotation, (vii) bogus data processing, (viii) process parallelization and distribution, (ix) portability and scalability.
Share