Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/25162
O IMPACTO DE PEQUENAS DELEÇÕES GENÔMICAS EM DOMÍNIOS PROTÉICOS IDENTIFICADAS A PARTIR DE DADOS DE RNA-SEQ DE AMOSTRAS DE PACIENTES DE ADENOCARCINOMA DE PULMÃO
Wajnberg, Gabriel | Date Issued:
2017
Author
Advisor
Affilliation
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.
Abstract in Portuguese
Inserções e deleções (INDELs) são exemplos de alterações na sequência de DNA. As alterações causadas por deleções genômicas podem modificar nucleotídeos da região codificadora de proteínas com potencial para alterar os aminoácidos codificados e mudar o quadro de leitura da tradução. Estas deleções podem causar modificações substanciais em proteínas envolvidas com a biologia do câncer. Nós inovamos no uso de um método já existente de matrizes ternárias ao utilizá-lo para identificar deleções genômicas com o uso de dados de transcriptoma de alta vazão (RNA-Seq). Foram usados dados de RNA-Seq para identificar pequenas deleções de até 100 nucleotídeos de comprimento dentro de éxons humanos. Apresentamos dados a partir da análise do genoma de referência humano GRCh37/hg19 e de 66 genomas do projeto 1000G. Foram selecionados aleatoriamente três genomas representando cada uma das 22 populações disponíveis para o mapeamento de RNA-Seq de amostras da linhagem H1975, de seis pacientes não fumantes e de 14 pacientes fumantes de câncer de pulmão. Identificamos deleções de até 100 nucleotídeos que também foram identificadas utilizando o programa Varscan com o genoma de referência GRCh37/hg19. Entre elas, podemos citar uma deleção de 15 nucleotídeos no domínio tirosina kinase localizado no éxon 19 do gene EGFR em amostra tumoral de um paciente não fumante Esta deleção também está previamente anotada na base de dados dbSNP. Em outro paciente não fumante foi encontrada uma deleção de quatro nucleotídeos que alterou o quadro de leitura do gene CTSA em amostras normais e tumorais. Encontramos a via de interferon \03B3 com alta probabilidade de estar alterada ao analisar os dados de pacientes fumantes, entre os genes dessa via em que encontramos alterações estão o INFGR1 e o INFGR2. Encontramos deleções a partir do mapeamento dos transcritos com 66 genomas do projeto 1000G que não encontramos com o mapeamento contra o genoma de referência GRCh37/hg19. Dentre elas, encontramos uma pequena deleção de 13 nucleotídeos no gene EPDR1 que altera o domínio ependimina da proteína codificada. Além desta deleção, uma perda de sete nucleotídeos foi encontrada ao utilizar genomas de ancestralidade europeias como referência. No gene supressor tumoral CDH1, encontramos uma pequena deleção de dois nucleotídeos em pacientes não fumantes usando genomas de ancestralidade europeias e americanas. O oncogene AKT1 apresentou uma deleção de cinco nucleotídeos em três pacientes fumantes. Estes achados poderão ser utilizados para o melhor entendimento da biologia do câncer de pulmão para novos métodos de diagnósticos e tratamentos
Abstract
Insertions and deletions (INDELs) are examples of genomic changes in the DNA sequence. One main effect of those deletions is the change of the coding region of proteins with the potential to alter the encoded amino acids and cause frameshift mutations. These deletions can cause substantial modifications in proteins involved with the biology of cancer. We innovated in the use of an already existing method, which uses ternary matrices to identify genomic deletions with the use of highthroughput transcriptome data (RNA-Seq). RNA-Seq data were used to identify small deletions up to 100 nucleotides in length within human exons. Here, we present data from the analysis of the human reference genome GRCh37/hg19 and 66 genomes from the 1000G project. We randomly selected three genomes representing each of the 22 available populations for mapping RNA-Seq data of the H1975 cell line, and samples from six nonsmoker patients and from 14 smokers patients with lung cancer. We identified deletions of up to 100 nucleotides that were also identified using the Varscan software when mapping to the reference genome GRCh37/hg19. We identified a small deletion of 15 nucleotides in tyrosine kinase domain in exon 19 in the EGFR gene in a tumor sample from a non-smoker patient. This deletion has been already present in the dbSNP database. In another non-smoker patient, a fournucleotide deletion was found that caused frameshift mutation in the CTSA gene simultaneously in normal and tumor samples Meanwhile, we found the interferon-\03B3 pathway with a high probability of being altered when analyzing the data of smoking patients, among the genes in which we found changes are INFGR1 and INFGR2. We identified deletions when we mapped the transcripts with 66 genomes of the 1000G project, which we did not find while mapping with the reference genome GRCh37/hg19. We identified a small deletion of 13 nucleotides in the EPDR1 gene that alters the ependymal domain of the encoded protein. In addition to this deletion, a loss of seven nucleotides was identified when using European ancestral genomes as a reference sequence. We also identified a small deletion in the CDH1 tumor suppressor of two nucleotides in nonsmoking patients using European and American ancestry genomes and a deletion of five nucleotides in three smoking patients on the AKT1 oncogene. In conclusion, we could use transcriptome data mapped on different genomes of different ancestry to identify small deletions of up to 100 nucleotides. These findings may be used to improve the lung cancer biology knowledge to develop new diagnosis and treatment methods
Share