Uso de Wikidata y Wikipedia para la generación asistida de un vocabulario estructurado multilingüe sobre la pandemia de Covid-19

Autores/as

DOI:

https://doi.org/10.3145/epi.2020.sep.09

Palabras clave:

Vocabularios controlados, Metadatos, Etiquetas, Palabras clave, Ontologías, Medios de comunicación, Vocabularios para medios, Web semántica, Organización del conocimiento, Emergencias, Catástrofes, Pandemias, Covid-19, Coronavirus, Wikidata, Wikipedia, SKOS

Resumen

Se propone un método para la construcción ágil y dinámica de vocabularios controlados, especialmente para los medios de comunicación, utilizando Wikidata y Wikipedia como fuentes de información terminológica. El método se aplica a la construcción de un vocabulario sobre la pandemia de Covid-19. Para ello se propone la explotación de la estructura de items y propiedades de Wikidata y de los enlaces salientes y entradas de los artículos de Wikipedia. Mediante un proceso de definición de reglas de expansión de relaciones de Wikidata se ha diseñado un algoritmo en el que se parte de un conjunto de items iniciales y en sucesivas iteraciones y revisión de resultados se recopilan las declaraciones relevantes a la temática del vocabulario. El algoritmo se ha implementado en una aplicación cuyo código y resultados de recopilación del vocabulario sobre la pandemia de Covid-19 se ha publicado en un repositorio abierto. Esto permite utilizar el algoritmo tanto para verificar los resultados usando las mismas u otras reglas de expansión como para su aplicación a la recopilación de vocabularios de otras temáticas. En los resultados también se analizan los elementos recopilados en cada iteración, la propuesta de validación mediante los enlaces entrantes y salientes de los artículos, dejando como futuros trabajos la aplicación de SKOS para la representación interoperable de los vocabularios obtenidos mediante este método.

Descargas

Publicado

2020-09-13

Cómo citar

Saorín, T., Pastor-Sánchez, J.-A., & Baños-Moreno, M.-J. (2020). Uso de Wikidata y Wikipedia para la generación asistida de un vocabulario estructurado multilingüe sobre la pandemia de Covid-19. Profesional De La Información, 29(5). https://doi.org/10.3145/epi.2020.sep.09

Número

Sección

Artículos de investigación Covid-19 / Covid-19 research articles

Descargas

La descarga de datos todavía no está disponible.