Arxiv intelligente: Ordenar los artículos diarios mediante el aprendizaje de las preferencias de los usuarios
Modelamos un artículo científico para que se construya como una combinación de diferentes conocimientos científicos de diversos temas en un nuevo problema. Aplicamos entonces la técnica de aprendizaje automático (sin supervisión) LDA para construir y extraer temas del corpus de documentos. Obtenemos los pesos de los temas de los trabajos disponibles y nuevos en Arxiv, y determinamos las preferencias de cada usuario en los temas de acuerdo con las preferencias de cada usuario en los trabajos.
Esto nos permite determinar la preferencia personal en los nuevos trabajos de acuerdo con la distribución de pesos por temas. Hemos creado la interfaz web IArxiv.org donde los usuarios pueden leer las publicaciones diarias de Arxiv clasificadas personalmente (y más) mientras el algoritmo aprende sus preferencias. Lo que permite una clasificación más precisa cada día. La versión actual de IArxiv.org funciona en las categorías astro-ph, gr-qc, hep-ph y hep-th.