Resumen Introducción las pruebas de opción múltiple son esenciales en la evaluación educativa, especialmente en medicina. Algunos estudios muestran que preguntas con 3, 4 o 5 alternativas tienen índices de dificultad y discriminación comparables. Métodos realizamos un estudio transversal con estudiantes del curso Metodología de la Investigación Científica II, quienes rindieron evaluaciones con 4 y 5 alternativas. Se calcularon los índices de dificultad y discriminación usando Excel y Jamovi. Para el análisis, se emplearon las pruebas de Kruskal-Wallis y coeficiente de correlación de concordancia. La prueba de chi-cuadrado fue utilizada para comparar distribuciones. Resultados participaron 55 alumnos. El índice de dificultad mostró medianas similares tanto para 4 como 5 alternativas (p = 0,824), al igual que el índice de discriminación que tampoco identificó diferencias entre las medianas (p = 0,654). El índice de dificultad tuvo buena concordancia en el examen parcial y final, con valores de 0,925 (IC 95%: 0,866 a 0,959) y 0,889 (IC 95%: 0,822 a 0,932), respectivamente. La concordancia para el índice de discriminación fue baja, con valores de 0,318 (IC 95%:−0,009 a 0,585) y−0,006 (IC 95%:−0,247 a 0,259) en el examen parcial y final, respectivamente. Conclusión no encontramos diferencias significativas en la dificultad y discriminación de preguntas de 4 y 5 alternativas. Sugerimos la elaboración de exámenes objetivos de respuesta única en cursos de investigación utilizando preguntas con 4 alternativas.
Introduction Multiple-choice tests are essential in educational assessment, especially in medicine. Peruvian studies show that 3 and 5 alternatives have similar effectiveness, but the optimal number of alternatives remains debated globally. Methods We conducted a cross-sectional study with students from the assignment “Metodología de la Investigación Científica II”, who took assessments with four and five alternatives. Difficulty and discrimination index were calculated using Excel and Jamovi. Kruskal-Wallis test and concordance correlation coefficient where used fot he analysis, and chi-square test was used to compare distributions. Results A total of 55 students were included. The difficulty index showed similar medians for both 4 and 5 alternatives (p = 0.824), as did the discrimination index, which also did not identify differences between the medians (p = 0.654). The concordance values for the difficulty index indicated good consistency in both the midterm and final exams, with values of 0.925 (95% CI: 0.866 to 0.959) and 0.889 (95% CI: 0.822 to 0.932), respectively. The concordance for the discrimination index was low, with values of 0.318 (95% CI:−0.009 to 0.585) and−0.006 (95% CI:−0.247 to 0.259) for the midterm and final exams, respectively. Conclusion We did not find significant differences in the difficulty and discrimination of questions with 4 and 5 options. We suggest the use of 4 alternative questions in objective exams in research courses.