Please use this identifier to cite or link to this item:
https://hdl.handle.net/11000/3561
Implementación de un programa en lenguaje
Perl para el ensamblaje de secuencias
nucleotídicas
Title: Implementación de un programa en lenguaje
Perl para el ensamblaje de secuencias
nucleotídicas |
Authors: Castejón Navarro, Nuria |
Tutor: Candela Antón, Héctor |
Issue Date: 2016-12-14 |
URI: http://hdl.handle.net/11000/3561 |
Abstract:
En este trabajo, hemos creado un programa que permite el ensamblaje de novo
de secuencias nucleotídicas. El programa ha sido escrito en lenguaje de programación
Perl y utiliza una estrategia basada en la representación de la secuencia mediante un
grafo bidirigido de De Bruijn. A partir de secuencias nucleotídicas de pequeño tamaño
(las lecturas), el programa produce un archivo en formato FastA con las secuencias de
los cóntigos producto del ensamblaje y otro en formato dot con una representación
gráfica de la relación existente entre dichos cóntigos. Hemos utilizado el programa para
evaluar los efectos de varios parámetros (como la longitud de los k-meros, la cobertura o
la tasa de error en las lecturas) sobre la calidad de los ensamblajes resultantes. Además,
hemos comprobado que los grafos de De Bruijn son una herramienta interesante para
detectar variantes en el procesamiento de los intrones. Por último, consideramos que
nuestro programa representa una herramienta docente muy poderosa para que los
estudiantes exploren la relación entre la Teoría de Grafos y la Genómica
In this work, we have written a computer program for the de novo assembly of
nucleotide sequences. The program has been written using the Perl programming
language, and uses a strategy based on bidirected de Bruijn graphs. Starting from short
nucleotide sequences (the reads), the program produces a FastA file containing the contig
sequences and a dot file that allows one to visualize the relationship among the different
contigs. We have used our program in order to evaluate the effects of several parameters
(such as the k-mer length, the sequencing coverage or the sequencing error rates) on the
quality of the resulting assemblies. In addition, we have found that De Bruijn graphs are
an interesting tool that might facilitate the identification of novel splice variants. Finally, we
think that our program is a powerful teaching tool that will help the students to investigate
the relationships between graph theory and genomics
|
Keywords/Subjects: Genomas Grafos Bioinformática |
Knowledge area: CDU: Ciencias puras y naturales: Biología: Bioquímica. Biología molecular. Biofísica |
Type of document: application/pdf |
Access rights: info:eu-repo/semantics/openAccess |
Appears in Collections: TFG - Biotecnología
|
???jsp.display-item.text9???