Preguntas de toxicología en los exámenes MIR: aciertos en las respuestas de las inteligencias artificiales en comparación con un grupo de expertos en toxicología clínica

Santiago Nogué Xarau; José Ríos Guillermo; Montserrat Amigó Tadín

Preguntas de toxicología en los exámenes MIR: aciertos en las respuestas de las inteligencias artificiales en comparación con un grupo de expertos en toxicología clínica

Santiago Nogué-Xarau ^[2] ; José Ríos-Guillermo ^[3] ; Montserrat Amigó-Tadin ^[1]
1. [1] Hospital Clinic Barcelona
  
  Hospital Clinic Barcelona
  
  Barcelona, España
2. [2] Fundación Española de Toxicología Clínica, España.
3. [3] Departamento de Farmacología Clínica, Hospital Clínic y Unidad de Estadística Médica, Instituto de Investigaciones Biomédicas August Pi i Sunyer (FCRB-IDIBAPS), Barcelona, España.
Mostrar afiliaciones +
Localización: Revista Española de Urgencias y Emergencias, ISSN-e 2951-6552, ISSN 2951-6544, Vol. 5, Nº. 1, 2026, págs. 36-41
Idioma: español
DOI: 10.55633/s3me/REUE058.2025
Títulos paralelos:
- Toxicology questions in Spanish medical licensing exams (MIR): accuracy of artificial intelligence vs a group of clinical toxicology experts
Enlaces
- Texto completo
Resumen
- español
  OBJETIVO. Valorar la capacidad de varios sistemas de inteligencia artificial (IA) para acertar la respuesta correcta a preguntas de toxicología que se han formulado en las convocatorias del Ministerio de Sanidad para obtener plaza de médico-interno-residente (MIR), y compararla con los aciertos que a las mismas preguntas ha ofrecido un grupo de expertos en toxicología clínica. MATERIAL Y MÉTODOS. Se revisaron los cuestionarios de los exámenes MIR de las cinco últimas convocatorias (2019-2023) y se seleccionaron las preguntas de toxicología. Estas preguntas se pasaron a siete chatbots de IA (ChatGPT, Gemini, Copilot, Luzia, Claude, Deepseek y Le Chat), solicitando las respuestas correctas. Las mismas preguntas se formularon también a un grupo de toxicólogos. RESULTADOS. Se incluyeron 44 preguntas. El tiempo cronometrado para completar este examen por las IA fue de 1,01 (0,82-1,52) minutos, mientras que el tiempo estimado que precisaron los toxicólogos fue de 42 (28,5-53,5) minutos (p < 0,001). Las IA acertaron una mediana de 41 (39-42) respuestas, mientras que la mediana de respuestas acertadas por el grupo de toxicólogos fue de 32 (2636) (p < 0,001). En el grupo de toxicólogos no se encontraron diferencias en los aciertos en función de su edad, sexo o especialidad médica. Tampoco se han encontrado diferencias en los aciertos entre preguntas teóricas y casos clínicos. CONCLUSIONES. Los chatbots de IA contestan las preguntas de toxicología de los exámenes MIR más rápidamente y obtienen mejores resultados que un grupo de toxicólogos.
- English
  OBJECTIVE. To assess the ability of several artificial intelligence (AI) systems to correctly answer toxicology questions from Spain’s Médico Interno Residente (MIR) licensing exams and to compare their accuracy with that of a group of clinical toxicologists. MATERIAL AND METHODS. We selected toxicology-related questions from the MIR exams (2019–2023) and showed them to 7 AI chatbots (ChatGPT, Gemini, Copilot, Luzia, Claude, Deepseek, and Le Chat) and to a group of clinical toxicologists. The number of correct answers was recorded for each participant. RESULTS. A total of 44 questions were included. AI systems completed the exam in a median of 1.01 (0.82–1.52) minutes vs 42.00 (28.50–53.50) minutes for toxicologists (P < .001). AI achieved a median of 41 (39–42) correct answers while toxicologists achieved 32 answers (26–36) (P < .001). No differences were found among toxicologists by age, sex, or specialty, nor between theoretical and case report-based questions. CONCLUSIONS. AI chatbots answered toxicology questions from MIR exams faster and with higher accuracy than a group of clinical toxicologists.
Referencias bibliográficas
- Ministerio de Sanidad. Especialidades en Ciencias de la Salud. (Consultado 25 Noviembre 2024). Disponible en: https://www. boe.es/eli/es/rd/2008/02/08/183.
- Ministerio de Sanidad. Especialidad de Medicina de Urgencias y Emergencias. (Consultado 25 Noviembre 2024). Disponible en: https://www.sanidad.gob.es/areas/...
- Vázquez Lima MJ. La Especialidad de Medicina de Urgencias y Emergencias ya es una realidad en España. Emergencias. 2024;36:321-3.
- Supervía A, Córdoba F, Ruíz Antorán B, Martín Pérez B, Martínez Baladrón A, Urdangarín A et al. Registro EPITOX de intoxicaciones en España....
- Socías A, Nogué S, Alcaraz RM, Morán I, Montero FJ, Palomar M, et al. Evolución de las intoxicaciones en las unidades de cuidados intensivos...
- Alexiou VG, Sumpio BE, Vassiliou A, Kakkos SK, Geroulakos G. Artificial Intelligence in Diagnosing and Managing Vascular Surgery Patients:...
- Strubchevska O, Kozyk M, Kozyk A, Strubchevska K. The Role of Artificial Intelligence in Diagnostic Radiology. Cureus. 2024;16:e72173.
- Zaboli A, Brigo F, Ziller M, Massar M, Parodi M, Magnarelli G, et al. Exploring ChatGPT's potential in ECG interpretation and outcome...
- Ministerio de Sanidad. Cuadernos de exámenes para optar a la formación médica especializada. (Consultado 3 Diciembre 2024). Disponible en:...
- Gilson A, Safranek CW, Huang T, Socrates V, Chi L, Taylor RA, et al. How Does ChatGPT Perform on the United States Medical Licensing Examination...
- García-Rudolph A, Sanchez-Pinsach D, Opisso E. ChatGPT's performance in the Specialist Health Practitioner exam for Hospital Emergency,...
- Preiksaitis C, Ashenburg N, Bunney G, Chu A, Kabeer R, Riley F, et al. The Role of Large Language Models in Transforming Emergency Medicine:...
- Sáenz-Abad D, Sachi Martínez-Mihara M, Lahoza-Pérez MC. La inteligencia artificial como herramienta de apoyo diagnóstico en urgencias. Emergencias....
- Romero Olóriz C. Inteligencia artificial en incidentes con múltiples víctimas: estado actual y perspectivas. Emergencias. 2025;37:159-60.
- González-Martínez F, Garrido NJ, Mateo J. Inteligencia artificial en la práctica clínica de urgencias: más realidad que fascinación. Emergencias....
- Ramgopal S, Varma S, Gorski JK, Kester KM, Shieh A, Suresh S. Evaluation of a Large Language Model on the American Academy of Pediatrics'...
- Sabry Abdel-Messih M, Kamel Boulos MN. ChatGPT in Clinical Toxicology. JMIR Med Educ. 2023;9:e46876.
- Altamimi I, Altamimi A, Alhumimidi AS, Altamimi A, Temsah MH. Snakebite advice and counseling from artificial intelligence: An acute venomous...
- Matsler N, Pepin L, Banerji S, Hoyte C, Heard K. Use of large language models to optimize poison center charting. Clin Toxicol (Phila). 2024;62:385-90....
- Nogué-Xarau S, Amigó-Tadín M, Ríos-Guillermo J. Evaluación de los conocimientos de varios sistemas de inteligencia artificial sobre una subespecialidad...
- Nogué-Xarau S, Ríos-Guillermo J, Amigó-Tadin M, Grupo SoCMUETox. Comparación de las respuestas a preguntas sobre intoxicaciones generadas...
- Carballo Cardona C, Iglesias Sigüenza A, Deza Palacios R, Soriano Arroyo R, Rodríguez Fuertes P, Tejada Sorados RM, et al. Inteligencia artificial...
- Relación provisional de los resultados de las pruebas selectivas, año 2021, Medicina. (Consultado 27 Febrero 2025). Disponible en: https://www.consalud.es/uploads/...
- Relación provisional de los resultados de las pruebas selectivas, año 2019, Medicina. (Consultado 12 Febrero 2025). Disponible en: https://blog.promir.es/wp-content/...

Mi Enfispo

Selección

Opciones de artículo

Seleccionado

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Acceso de usuarios registrados

Preguntas de toxicología en los exámenes MIR: aciertos en las respuestas de las inteligencias artificiales en comparación con un grupo de expertos en toxicología clínica

Hospital Clinic Barcelona

Mi Enfispo

Opciones de artículo

Opciones de compartir

Opciones de entorno