Arxiv intelligente: Ordenar los artículos diarios mediante el aprendizaje de las preferencias de los usuarios

2020-02-21
12:15
CSIC
Sala Alberto Lobo (ICE building, UAB Campus)
Intelligent Arxiv: Sort daily papers by learning users topic preferences
Presentamos y discutimos algunas aplicaciones novedosas de la técnica de Análisis Discriminatorio Lineal (LDA) de Aprendizaje Automático (ML). Primero en el campo de las búsquedas de Nueva Física (NP) en el LHC, donde actualmente estamos aplicando esta técnica de ML sin supervisión para encontrar NP como temas emergentes. Motivados por esta poderosa herramienta perseguimos el objetivo de clasificar los trabajos diarios de Arxiv en determinados campos según las preferencias de cada usuario.

Modelamos un artículo científico para que se construya como una combinación de diferentes conocimientos científicos de diversos temas en un nuevo problema. Aplicamos entonces la técnica de aprendizaje automático (sin supervisión) LDA para construir y extraer temas del corpus de documentos. Obtenemos los pesos de los temas de los trabajos disponibles y nuevos en Arxiv, y determinamos las preferencias de cada usuario en los temas de acuerdo con las preferencias de cada usuario en los trabajos.

Esto nos permite determinar la preferencia personal en los nuevos trabajos de acuerdo con la distribución de pesos por temas. Hemos creado la interfaz web IArxiv.org donde los usuarios pueden leer las publicaciones diarias de Arxiv clasificadas personalmente (y más) mientras el algoritmo aprende sus preferencias. Lo que permite una clasificación más precisa cada día. La versión actual de IArxiv.org funciona en las categorías astro-ph, gr-qc, hep-ph y hep-th.

Share This