Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/3561

Implementación de un programa en lenguaje Perl para el ensamblaje de secuencias nucleotídicas


Thumbnail

View/Open:
 Castejón Navarro, Nuria TFG.pdf
2,78 MB
Adobe PDF
Share:
Title:
Implementación de un programa en lenguaje Perl para el ensamblaje de secuencias nucleotídicas
Authors:
Castejón Navarro, Nuria
Tutor:
Candela Antón, Héctor
Issue Date:
2016-12-14
Abstract:
En este trabajo, hemos creado un programa que permite el ensamblaje de novo de secuencias nucleotídicas. El programa ha sido escrito en lenguaje de programación Perl y utiliza una estrategia basada en la representación de la secuencia mediante un grafo bidirigido de De Bruijn. A partir de secuencias nucleotídicas de pequeño tamaño (las lecturas), el programa produce un archivo en formato FastA con las secuencias de los cóntigos producto del ensamblaje y otro en formato dot con una representación gráfica de la relación existente entre dichos cóntigos. Hemos utilizado el programa para evaluar los efectos de varios parámetros (como la longitud de los k-meros, la cobertura o la tasa de error en las lecturas) sobre la calidad de los ensamblajes resultantes. Además, hemos comprobado que los grafos de De Bruijn son una herramienta interesante para detectar variantes en el procesamiento de los intrones. Por último, consideramos que nuestro programa representa una herramienta docente muy poderosa para que los estudiantes exploren la relación entre la Teoría de Grafos y la Genómica
In this work, we have written a computer program for the de novo assembly of nucleotide sequences. The program has been written using the Perl programming language, and uses a strategy based on bidirected de Bruijn graphs. Starting from short nucleotide sequences (the reads), the program produces a FastA file containing the contig sequences and a dot file that allows one to visualize the relationship among the different contigs. We have used our program in order to evaluate the effects of several parameters (such as the k-mer length, the sequencing coverage or the sequencing error rates) on the quality of the resulting assemblies. In addition, we have found that De Bruijn graphs are an interesting tool that might facilitate the identification of novel splice variants. Finally, we think that our program is a powerful teaching tool that will help the students to investigate the relationships between graph theory and genomics
Keywords/Subjects:
Genomas
Grafos
Bioinformática
Type of document:
application/pdf
Access rights:
info:eu-repo/semantics/openAccess
Appears in Collections:
TFG - Biotecnología



Creative Commons ???jsp.display-item.text9???