Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/11000/36963

Sistema para la extracción de entidades médicas a partir de audio clínico mediante procesamiento del lenguaje natural


Vista previa

Ver/Abrir:
 TFG-Navarro Fenoll, Víctor.pdf

4,56 MB
Adobe PDF
Compartir:
Título :
Sistema para la extracción de entidades médicas a partir de audio clínico mediante procesamiento del lenguaje natural
Autor :
Navarro Fenoll, Víctor
Tutor:
Gimeno Blanes, Francisco Javier
García Jiménez, Raúl
Editor :
Universidad Miguel Hernández de Elche
Departamento:
Departamentos de la UMH::Ingeniería de Comunicaciones
Fecha de publicación:
2025-06
URI :
https://hdl.handle.net/11000/36963
Resumen :
En este Trabajo de Fin de Grado, se ha desarrollado un sistema capaz de extraer la información clínica relevante a partir de transcripciones de consultas médico-paciente. La documentación precisa y eficiente es fundamental para la práctica médica, pero los métodos tradicionales consumen un tiempo valioso. El objetivo principal del proyecto es facilitar y optimizar este proceso, permitiendo a los médicos dedicar mayor tiempo a la atención directa al paciente. Para lograr nuestro cometido, se llevaron a cabo un importante número de pruebas y experimentos con diversas herramientas de transcripción y LLMs disponibles. Entre las herramientas consideradas para realizar la transcripción, consideramos algunas opciones como Google Speech-to-Text, Whisper o Amazon Transcribe, decantándonos por Faster Whisper para la transcripción debido a su gran rendimiento y eficiencia. En cuanto a los LLMs exploramos variedad de opciones y arquitecturas, como BERT, Mistral o Llama, resultando Llama 3.1-8B el más adecuado para ser adaptado a nuestro proyecto mediante las técnicas QLoRA y fine-tuning. Los resultados obtenidos son prometedores, y sugieren un potencial significativo para mejorar la eficiencia y calidad de la atención médica.
In this Thesis, we have developed a system to extract relevant clinical information from transcripts of medical appointments. Accurate and efficient documentation is fundamental to medical practice, but traditional methods consume valuable time. The main objective of the project is to facilitate and optimize this process, allowing doctors to dedicate more time to direct patient care. As part of the research in the development phase, a significant number of tests and experiments were made with diverse avaliable transcription tools and LLMs. Among all the transcription tools we considered, we evaluated options such as Google Speech-to-Text, Amazon Transcribe or Whisper, ultimately opting for Faster Whisper due to its superior performance and efficency. We also explored a variety of LLM’s architectures and models, including BERT, Mistral or Llama. Resulting Llama 3.1-B in the most suitable to adapt to our project throught QLoRA and fine-tuning techiques. Results were promising, and suggest significant potential for improving the efficency and quality of medical cara.
Palabras clave/Materias:
PLN
STT
LLM
NER
Whisper
Llama
Área de conocimiento :
CDU: Ciencias aplicadas: Ingeniería. Tecnología
Tipo de documento :
info:eu-repo/semantics/bachelorThesis
Derechos de acceso:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Aparece en las colecciones:
TFG- Ingeniería de Tecnologías de Telecomunicación



Creative Commons La licencia se describe como: Atribución-NonComercial-NoDerivada 4.0 Internacional.