Héctor Agustín Rivadeneira Jurado
, Elias Agustín Rivadeneira Jurado
, Daniel Espinoza Freire
, Andrés F. Samaniego
, Ezequiel Lulkin
, Fernando Manuel Bidolegui
, Sebastian Pereira
Introducción: La inteligencia artificial fue presentada formalmente en 1956, luego, se crearon plataformas con un conjunto de información para obtener el resultado apropiado. La clasificación de fracturas de platillo tibial de Kfuri y Schatzker permite hacer un análisis más preciso, especialmente al integrar cortes tomográficos. En este estudio, se comparó la capacidad diagnóstica del modelo ChatGPT-4o con la evaluación del panel de expertos. materiales y métodos: Estudio retrospectivo, observacional para comparar la interpretación del observador experto y la delChatGPT-4o. Se recopilaron 45 reportes de casos publicados por expertos con radiografías y tomografías, en distintas bases de datos, como PubMed, Elsevier, SciELO, que se usaron para mejorar el análisis del ChatGPT-4o. Se seleccionaron 6 reportes de casos de fractura de platillo tibial, que no se habían cargado previamente en la plataforma para analizar la interpretación del ChatGPT-4o basada en el prompt creado antes. El modelo ChatGPT-4o analizó cada uno de los casos y propuso una clasificación basada en el sistema de Schatzker-Kfuri. Las respuestas fueron contrastadas con la información obtenida de reportes de casos. Resultados: El ChatGPT-4o clasificó correctamente los casos analizados. Los componentes de hundimiento, trazo de cizallamiento (split) y disociación epifisodiafisaria fueron identificados, con precisión, en los casos bicondilares. Asimismo, se utilizaron medidas de concordancia kappa de Cohen: 1.00, lo cual se interpreta como concordancia perfecta. Conclusión: El ChatGPT-4o tuvo una alta capacidad diagnóstica en la clasificación de fracturas de platillo tibial según Schatzker-Kfuri, equiparable a la de un experto.
Introduction: Artificial intelligence was formally introduced in 1956, and since then, platforms trained on large datasets have been developed to generate increasingly accurate outputs. The Kfuri-Schatzker classification of tibial plateau fractures enables more precise analysis, particularly when CT imaging is integrated. This study compared the diagnostic accuracy of the ChatGPT-4o model with that of expert evaluators. materials and methods:A retrospective observational study was conducted to compare the interpretations of an expert observer with those generated by ChatGPT-4o. A dataset of 45 expert-published case reports including radiographs and CT scans from databases such as PubMed, Elsevier, and SciELO was used to refine the prompt guid-ing ChatGPT-4o’s analysis. Six additional case reports of tibial plateau fractures, none previously provided to the model, were selected for evaluation. ChatGPT-4o analyzed each case and proposed a classification according to the Schatzker-Kfuri system. Its responses were compared with the expert diagnoses reported in the literature. Results:ChatGPT-4o correctly classified all the cases analyzed. In bicondylar fractures, the model accurately identified components of subsidence, shear (split) pattern, and epiphyseal-diaphyseal dissociation. Cohen’s kappa coefficient was 1.00, indicating perfect agreement. Conclusion:The ChatGPT-4o model demonstrated high diagnostic accuracy in classifying tibial plateau fractures using the Schatzker-Kfuri system, achieving agreement comparable to that of an expert evaluator.