Augusto Parcemon Cortéz Vásquez
Desde tiempos remotos, el tratamiento de enfermedades con plantas medicinales ha sido una práctica muy común en las comunidades rurales. La terminología utilizada difiere textualmente, sin embargo se pueden relacionar en función de sus conceptos. Para ello se utiliza técnicas como la indexación semántica latente que busca categorizar conceptos más que textos, asimismo se utiliza la técnica de índices invertidos con el fin de asociar los textos que contengan términos a consultar por los usuarios. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d, luego mediante un análisis string kernel encuentre el grado de similitud entre dos textos. Se utilizan asimismo la técnica de punteros invertidos a fin de encontrar documentos que contienen los términos a consultar. Dos textos son más similares mientras tengas más subsecuencias en común. Se presenta una aplicación de clasificación que haga corresponder a un documento (texto de propiedades medicinales de una planta) una categoría C que serán las propiedades mismas de las plantas.