Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/36963

Sistema para la extracción de entidades médicas a partir de audio clínico mediante procesamiento del lenguaje natural


Thumbnail

View/Open:
 TFG-Navarro Fenoll, Víctor.pdf

4,56 MB
Adobe PDF
Share:
Title:
Sistema para la extracción de entidades médicas a partir de audio clínico mediante procesamiento del lenguaje natural
Authors:
Navarro Fenoll, Víctor
Tutor:
Gimeno Blanes, Francisco Javier
García Jiménez, Raúl
Editor:
Universidad Miguel Hernández de Elche
Department:
Departamentos de la UMH::Ingeniería de Comunicaciones
Issue Date:
2025-06
URI:
https://hdl.handle.net/11000/36963
Abstract:
En este Trabajo de Fin de Grado, se ha desarrollado un sistema capaz de extraer la información clínica relevante a partir de transcripciones de consultas médico-paciente. La documentación precisa y eficiente es fundamental para la práctica médica, pero los métodos tradicionales consumen un tiempo valioso. El objetivo principal del proyecto es facilitar y optimizar este proceso, permitiendo a los médicos dedicar mayor tiempo a la atención directa al paciente. Para lograr nuestro cometido, se llevaron a cabo un importante número de pruebas y experimentos con diversas herramientas de transcripción y LLMs disponibles. Entre las herramientas consideradas para realizar la transcripción, consideramos algunas opciones como Google Speech-to-Text, Whisper o Amazon Transcribe, decantándonos por Faster Whisper para la transcripción debido a su gran rendimiento y eficiencia. En cuanto a los LLMs exploramos variedad de opciones y arquitecturas, como BERT, Mistral o Llama, resultando Llama 3.1-8B el más adecuado para ser adaptado a nuestro proyecto mediante las técnicas QLoRA y fine-tuning. Los resultados obtenidos son prometedores, y sugieren un potencial significativo para mejorar la eficiencia y calidad de la atención médica.
In this Thesis, we have developed a system to extract relevant clinical information from transcripts of medical appointments. Accurate and efficient documentation is fundamental to medical practice, but traditional methods consume valuable time. The main objective of the project is to facilitate and optimize this process, allowing doctors to dedicate more time to direct patient care. As part of the research in the development phase, a significant number of tests and experiments were made with diverse avaliable transcription tools and LLMs. Among all the transcription tools we considered, we evaluated options such as Google Speech-to-Text, Amazon Transcribe or Whisper, ultimately opting for Faster Whisper due to its superior performance and efficency. We also explored a variety of LLM’s architectures and models, including BERT, Mistral or Llama. Resulting Llama 3.1-B in the most suitable to adapt to our project throught QLoRA and fine-tuning techiques. Results were promising, and suggest significant potential for improving the efficency and quality of medical cara.
Keywords/Subjects:
PLN
STT
LLM
NER
Whisper
Llama
Knowledge area:
CDU: Ciencias aplicadas: Ingeniería. Tecnología
Type of document:
info:eu-repo/semantics/bachelorThesis
Access rights:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Appears in Collections:
TFG- Ingeniería de Tecnologías de Telecomunicación



Creative Commons ???jsp.display-item.text9???