Fu Shaoze, Gao Gang, Zhao Hongmei
Con el desarrollo de la tecnología de informatización clínica, se ha acumulado una gran cantidad de recursos de datos en el campo médico, entre los cuales los registros médicos electrónicos (EMR) de los atletas son una de las fuentes de datos importantes de la informatización clínica y contienen un rico conocimiento médico; la forma de obtener características biométricas valiosas de estos datos se ha convertido en la base de la investigación de inteligencia médica. Por lo tanto, este documento toma el texto estructurado como punto de entrada y, en primer lugar, se detalla el estado de la investigación de la extracción de información. Además, en el trabajo de reconocimiento biométrico médico electrónico, se agrega texto médico al modelo de lenguaje BERT para el preentrenamiento y el ajuste fino, y se introduce un mecanismo de autoatención de múltiples cabezas para incorporar un modelo LSTM bidireccional para la extracción de características, y las características biométricas se extraen utilizando un campo condicional estocástico como restricción de clasificación. Este diseño omite el paso de segmentación de imágenes a nivel de caracteres para imágenes de líneas de texto, evitando así la degradación general de la precisión causada por la acumulación hacia atrás de errores en la segmentación de caracteres. Finalmente, los resultados experimentales muestran que el modelo puede realizar de manera efectiva las tareas de extracción de características biológicas relacionadas.
With the development of clinical informatization technology, a large amount of data resources hasbeen accumulated in the medical field, among which Athletes’ electronic medical records (EMRs) are one of the important data sources of clinical informatization and contain rich medical knowledge, how to obtain valuable biometric features from these data has become the basis of medical intelligence research. Therefore, this paper takes structured text as the entry point, and firstly, the research status of information extraction is elaborated. Moreover, in the work of e-medical biometrics recognition, medical text is added to the language model BERT for pre-training and fine-tuning, and a multi-head self-attention mechanism is introduced to incorporate a bidirectional LSTM model for feature extraction, and biometric features are extracted by using a stochastic conditional field as a classification constraint. This design bypasses the character-level image segmentation step for text line images, thus avoiding the overall accuracy degradation caused by the backward accumulation of errors in character segmentation. Finally, the experimental results show that the model can effectively accomplish the related biological feature extraction tasks.