Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/3561
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorCandela Antón, Héctor-
dc.contributor.authorCastejón Navarro, Nuria-
dc.date.accessioned2017-04-27T10:54:10Z-
dc.date.available2017-04-27T10:54:10Z-
dc.date.created2016-12-14-
dc.date.issued2017-04-27-
dc.identifier.urihttp://hdl.handle.net/11000/3561-
dc.description.abstractEn este trabajo, hemos creado un programa que permite el ensamblaje de novo de secuencias nucleotídicas. El programa ha sido escrito en lenguaje de programación Perl y utiliza una estrategia basada en la representación de la secuencia mediante un grafo bidirigido de De Bruijn. A partir de secuencias nucleotídicas de pequeño tamaño (las lecturas), el programa produce un archivo en formato FastA con las secuencias de los cóntigos producto del ensamblaje y otro en formato dot con una representación gráfica de la relación existente entre dichos cóntigos. Hemos utilizado el programa para evaluar los efectos de varios parámetros (como la longitud de los k-meros, la cobertura o la tasa de error en las lecturas) sobre la calidad de los ensamblajes resultantes. Además, hemos comprobado que los grafos de De Bruijn son una herramienta interesante para detectar variantes en el procesamiento de los intrones. Por último, consideramos que nuestro programa representa una herramienta docente muy poderosa para que los estudiantes exploren la relación entre la Teoría de Grafos y la Genómicaes
dc.description.abstractIn this work, we have written a computer program for the de novo assembly of nucleotide sequences. The program has been written using the Perl programming language, and uses a strategy based on bidirected de Bruijn graphs. Starting from short nucleotide sequences (the reads), the program produces a FastA file containing the contig sequences and a dot file that allows one to visualize the relationship among the different contigs. We have used our program in order to evaluate the effects of several parameters (such as the k-mer length, the sequencing coverage or the sequencing error rates) on the quality of the resulting assemblies. In addition, we have found that De Bruijn graphs are an interesting tool that might facilitate the identification of novel splice variants. Finally, we think that our program is a powerful teaching tool that will help the students to investigate the relationships between graph theory and genomicses
dc.formatapplication/pdfes
dc.format.extent46es
dc.language.isospaes
dc.rightsinfo:eu-repo/semantics/openAccesses
dc.subjectGenomases
dc.subjectGrafoses
dc.subjectBioinformáticaes
dc.subject.otherCDU::5 - Ciencias puras y naturales::57 - Biología::577 - Bioquímica. Biología molecular. Biofísicaes
dc.titleImplementación de un programa en lenguaje Perl para el ensamblaje de secuencias nucleotídicases
dc.typeinfo:eu-repo/semantics/bachelorThesises
Appears in Collections:
TFG - Biotecnología


Thumbnail

View/Open:
 Castejón Navarro, Nuria TFG.pdf
2,78 MB
Adobe PDF
Share:


Creative Commons ???jsp.display-item.text9???