Expositor: Igor Barahona Torres

21 de febrero de 2018 

Título: Construcción de un espacio semántico (diccionario) para el idioma Español sobre el dominio de la Wikipedia.

  Resumen:

El análisis de Semántica Latente (LSA, por sus siglas en inglés) fue concebido inicialmente desde el área de la psicología cognitiva. Desde su aparición en la década de los 90s, el LSA ha sido utilizado para modelar procesos cognitivos, corregir textos académicos, comparar obras literarias y analizar discursos, entre otras.

Sobre la base de métodos estadísticos multivariados de reducción de dimensionalidad, aplicados a la Wikipedia en texto plano, este trabajo propone la construcción de un espacio semántico (diccionario) para el idioma Español. Nuestros resultados incluyen una matriz documentos palabras (con dimensiones de 1.3X106 renglones y 5.9X106 columnas). Los valores singulares de tal matriz, son utilizados para comparar semánticamente dos o más textos.

 

Temas:

Computación, Lógica, Teoría de categorías

Viernes, May 17, 2024