Inteligencia artificial aplicada a programas informativos de radio. Estudio de caso de segmentación automática de noticias en RNE
DOI:
https://doi.org/10.3145/epi.2021.may.20Palabras clave:
RTVE, RNE, Inteligencia artificial, Tecnologías del lenguaje, Transcripción de voz a texto, Programas de radio, Archivos audiovisuales, Archivos de radio, Documentación audiovisual, Documentación radiofónica, Diarización, Segmentación de noticias, WER, Word error rate, Precisión, Control de calidadResumen
Se presentan los resultados del proyecto para la segmentación en noticias de los informativos de Radio Nacional de España (RNE) llevado a cabo por el Área de Innovación Tecnológica de Radio Televisión Española (RTVE) en colaboración con la Dirección de Medios de RNE. El objetivo de este proyecto es aplicar la inteligencia artificial para el cortado automático de las noticias que componen un informativo radiofónico, para su posterior difusión en la web de RTVE y en medios de comunicación social. El proyecto se planificó en dos fases: una primera de configuración y ajuste del sistema, y una segunda de prestación del servicio propiamente dicho. Los criterios de calidad mínimos exigibles se definieron previamente, tanto para la transcripción automática del habla a texto, para la que se estableció una tasa de error por palabra máxima (WER) del 10%, como para la segmentación de noticias, para la que se definió una tasa de precisión superior al 85%. El rendimiento del sistema tanto en la transcripción como en la segmentación se considera suficiente, si bien se espera alcanzar un mayor grado de precisión en el cortado de noticias en los próximos meses. Los resultados ponen de manifiesto que, a pesar de ser tecnologías bastante maduras, son necesarios procesos de ajuste y aprendizaje con la intervención humana.
Descargas
Citas
Associated Press (2020). Automated insigts customer stories. https://automatedinsights.com/customer-stories/associated-press
Bazán-Gil, Virginia (2018). "El renacimiento de los archivos: inteligencia artificial y semántica aplicada a la descripción de contenidos audiovisuales". En: IX Encuentros de Centros de Documentación de Arte Contemporáneo. Explotación, Integración y Difusión de Conocimiento de las Instituciones Patrimoniales. https://biblioteca.artium.eus/Record/164617
Bazán-Gil, Virginia (2020). "Artificial intelligence: an object of desire". In: FIAT/IFTA, 13 May. http://fiatifta.org/index.php/media/archivalreads/archivalreads-artificial-intelligence
Bazán-Gil, Virginia; Guerrero-Gómez-Olmedo, Ricardo (2018). "Descripción automática de archivos audiovisuales: NeuralTalk, un modelo de video2text aplicado al archivo de RTVE". BiD: Textos universitaris de biblioteconomia i documentació, n. 41. https://doi.org/10.1344/BiD2018.41.7
Bazán-Gil, Virginia; Lleida-Solano, Eduardo; Pérez-Cernuda, Carmen; Gómez-Zotano, Manuel J.; De-Prada, Alberto (2019). "Tecnologías del habla: nuevas oportunidades para los archivos de televisión". En: 14º Congreso ISKO España. http://eprints.rclis.org/38447/1/CatedraRTVEUnizar_ISKO2019.pdf
BBC (2020). The equality project 50:50. https://www.bbc.co.uk/5050
Calero, Juan F. (2020). "La inteligencia artificial que lleva a otro nivel el subtitulado automático en informativos de TV o conferencias". Madri+d, 23 julio. http://www.madrimasd.org/notiweb/noticias/inteligencia-artificial-que-lleva-otro-nivel-subtitulado-automatico-en-informativos-tv-o-conferencias
Cátedra RTVE (2017). http://catedrartve.unizar.es
Corral, David (2020). "Periodismo tecnológico o ¿tecnología para el periodismo? En tiempos de pandemia". RTVE, 30 abril. https://www.rtve.es/rtve/20200430/periodismo-tecnologico-tecnologia-para-periodismo-tiempos-pandemia/2013145.shtml
Data for hope (2020). https://dataforhope.com
Doukhan, David (2019). "Gender equality monitor". In: FIAT/IFTA World Conference in Dubrovnik. https://es.slideshare.net/fiatifta/doukhan-gender-equality-monitor
EBU (2019). The next newsroom: Unlocking the power of AI for public service journalism. News report 2019. https://www.ebu.ch/publications/strategic/login_only/report/news-report-2019
Etiqmedia (2020). Etiqmedia. Radio indexing. http://www.etiqmedia.com/soluciones/radio-indexing.php
Fraunhofer-Gesellschaft (2019). "Software that can automatically detect fake news". Phys org, February 1. https://phys.org/news/2019-02-software-automatically-fake-news.html
Galvez, Giovanni (2020). "AI machine translation of subtitling for live news and sports". In: MDN Workshop. https://tech.ebu.ch/contents/publications/presentations/2020/mdn2020/ai-machine-translation-of-subtitling-for-live-news-and-sports.html
Graves, Lucas (2018). Understanding the promise and limits of automated fact-checking. Reuters Institute. https://reutersinstitute.politics.ox.ac.uk/sites/default/files/2018-02/graves_factsheet_180226%20FINAL.pdf
Grothaus, Michael (2019). "Machine learning isn´t effective at identifying fake news". Fast Company, 15 October. https://www.fastcompany.com/90417625/machine-learning-isnt-effective-at-identifying-fake-news
Herrero-Diz, Paula; Varona-Aramburu, David (2018). "Uso de chatbots para automatizar la información en los medios españoles". El profesional de la información, v. 27, n. 4, pp. 742-749. https://doi.org/10.3145/epi.2018.jul.03
IPTC (2020). News codes. https://iptc.org/standards/newscodes
Jones, Bronwyn; Jones, Rhianne (2019). "Public service chatbots: Automating conversation with BBC News". Digital journalism, v. 7, n. 8, pp. 1032-1053. https://doi.org/10.1080/21670811.2019.1609371
Lempinen, Jaakko; Kokko, Jan; Matusiak, Marek (2020). "Applications of automated media extraction from Yle Areena videos". In: MDN Workshop. https://tech.ebu.ch/contents/publications/presentations/2020/mdn2020/applications-of-automated-media-extraction-from-yle-areena-videos.html
León-Carpio, Antonio; López-De-Quintana, Eugenio (2020). "Artificial Intelligence for a role change in television archives: the Atresmedia experience". In: IASA - FIAT/IFTA. https://2020iasafiatiftaconference.sched.com/event/eLpP
Lleida-Solano, Eduardo (2020). Iberspeech 2020 evaluation challenges. Cátedra RTVE - Universidad de Zaragoza, Albayzín Evaluations. http://catedrartve.unizar.es/albayzin2020.html
Lleida-Solano, Eduardo; Ortega-Giménez, Alfonso; Miguel, Antonio; Bazán-Gil, Virginia; Pérez-Cernuda, Carmen; Gómez-Zotano, Manuel; De-Prada, Alberto (2018). RTVE2018 Database Description. http://catedrartve.unizar.es/reto2018/RTVE2018DB.pdf
Lleida-Solano, Eduardo; Ortega-Giménez, Alfonso; Miguel, Antonio; Bazán-Gil, Virginia; Pérez-Cernuda, Carmen; Gómez-Zotano, Manuel; De-Prada, Alberto (2019a). "The IberSpeech-RTVE challenge on speech technologies for Spanish broadcast media". Applied sciences, v. 9. https://www.mdpi.com/2076-3417/9/24/5412
Lleida-Solano, Eduardo; Ortega-Giménez, Alfonso; Miguel, Antonio; Bazán-Gil, Virginia; Pérez-Cernuda, Carmen; Gómez-Zotano, Manuel; De-Prada, Alberto (2019b). "Albayzin 2018 evaluation: The IberSpeech-RTVE". Applied sciences, n. 22. https://www.mdpi.com/2076-3417/9/24/5412/pdf
Lleida-Solano, Eduardo; Ortega-Giménez, Alfonso; Miguel, Antonio; Bazán-Gil, Virginia; Pérez-Cernuda, Carmen; Gómez-Zotano, Manuel; De-Prada, Alberto (2020). RTVE2020 Database Description. http://catedrartve.unizar.es/reto2020/RTVE2020DB.pdf
LSE (2020). JournalismAI Case studies. The London School of Economics and Political science. https://www.lse.ac.uk/media-and-communications/polis/JournalismAI/Case-studies
Molumby, Conor; Whitwell, Joe (2019). "General election 2019: Semi-automation makes it a night of 689 stories". BBC news labs, 13 diciembre. https://bbcnewslabs.co.uk/news/2019/salco-ge
Nixon, Lyndon (2020). "Metadata-driven TV content repurposing and republication". In: MDN Workshop. https://tech.ebu.ch/contents/publications/events/presentations/mdn2020/metadata-driven-tv-content-repurposing-and-republication
Opoku-Boateng, Judith; Asano, Jun (2020). "NHK´s diversification of search methods using AI". In: IASA - FIAT/IFTA conference. https://2020iasafiatiftaconference.sched.com/event/eLoy
Parmentier, Matthieu (2020). "Analysing political debates to feed data journalists". In: MDN Workshop. https://tech.ebu.ch/contents/publications/presentations/2020/mdn2020/analysing-political-debates-to-feed-data-journalists.html
Prensa RTVE (2018). RTVE lanza el proyecto "˜Journalism Innovation Hub´ para estudiar la transformación digital de los informativos. https://www.rtve.es/rtve/20180222/rtve-lanza-proyecto-journalism-innovation-hub-para-estudiar-transformacion-digital-informativos/1682664.shtml
Proyecto covid 19 (2020). https://covid19tracking.narrativa.com
Rath, Sid; Veerwaijen, Christiaan; Forster, Christoph (2020). "AI-enabled hyper-tagging engines for football archives". In: IASA - FIAT/IFTA Conference. https://2020iasafiatiftaconference.sched.com/event/eLoj
Rehm, Georg (2020). Research for CULT Committee - The use of artificial intelligence in the audiovisual sector. European Parliament, Policy Department for Structural and Cohesion Policies, Brussels. https://www.europarl.europa.eu/thinktank/en/document.html?reference=IPOL_IDA(2020)629221
ReTV (2020). https://retv-project.eu
RNE (2020a). Madrid Informativos de RNE. https://www.rtve.es/alacarta/audios/informativo-de-madrid
RNE (2020b). RNE 14h. https://www.rtve.es/alacarta/audios/14-horas
Rozalén-Serrano, Miguel-Ángel; Aranda-Jiménez, Álvaro (2020). "Generación automática de palabras clave para monitorizar dominios en redes sociales". En: Actas del IV Congreso ISKO España-Portugal 2019, XIV Congreso ISKO España 2019. https://dialnet.unirioja.es/servlet/libro?codigo=766025
Rozalén-Serrano, Miguel-Ángel; Aranda-Jiménez, Álvaro; Rodríguez, Francisco; Álvarez-Rodríguez, José-María (2020). Proyecto Social Media Radar. Madrid. ISBN: 108283064X
RTVE (2019). Portal de licitaciones. https://licitaciones.rtve.es/licitacion/licitaciones/detalle?id=744264
RTVE (2020). Portal de licitaciones. https://licitaciones.rtve.es/licitacion/licitaciones/detalle?id=1208797
Saarikoski, Lauri (2020). "How do the end-users find all this automated metadata?". In: MDN Workshop. https://tech.ebu.ch/contents/publications/presentations/2020/mdn2020/how-do-the-end-users-find-all-this-automated-metadata.html
Sanjinés, Diana (2020a). "Cómo RTVE implementa la personalización de contenido en sus aplicaciones". Noticias OI2. http://oi2media.es/2020/07/03/como-rtve-implementa-la-personalizacion-de-contenido-en-sus-aplicaciones
Sanjinés, Diana (2020b). "OI2 publica el tercer informe sobre periodismo e inteligencia artificial". Publicaciones OI2. http://oi2media.es/2020/11/06/oi2-publica-el-tercer-informe-sobre-periodismo-e-inteligencia-artificial
Túñez-López, Miguel; Toural-Bran, Carlos; Cacheiro-Requeijo, Santiago (2018). "Uso de bots y algoritmos para automatizar la redacción de noticias: percepción y actitudes de los periodistas en España". El profesional de la información, v. 27, n. 4, pp. 750-758. https://doi.org/10.3145/epi.2018.jul.04
Túñez-López, Miguel; Toural-Bran, Carlos; Valdiviezo-Abad, Cesibel (2019). "Automatización, bots y algoritmos en la redacción de noticias. Impacto y calidad del periodismo artificial". Revista latina de comunicación social, n. 74, pp. 1411-1433. https://doi.org/10.4185/RLCS-2019-1391
Vállez, Mari; Codina, Lluís (2018). "Periodismo computacional: evolución, casos y herramientas". El profesional de la información, n. 27, n. 4. https://doi.org/10.3145/epi.2018.jul.05
Van-Rijsselbergen, Dieter (2020). "Metadata proccessing in the H2020 Memad prototype platform". In: MDN Workshop. https://tech.ebu.ch/contents/publications/presentations/2020/mdn2020/metadata-processing-in-the-h2020-memad-prototype-platform.html
WashPostPR (2017). "The Washington Post leverages automated storytelling to cover high school football". Washington Post, 1 September. https://www.washingtonpost.com/pr/wp/2017/09/01/the-washington-post-leverages-heliograf-to-cover-high-school-football
Yle (2018). Yle releases code for "˜robot journalist´ Voitto. https://yle.fi/uutiset/osasto/news/yle_releases_code_for_robot_journalist_voitto/10126261
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Condiciones de difusión de los artículos una vez son publicados
Los autores pueden publicitar libremente sus artículos en webs, redes sociales y repositorios
Deberán respetarse sin embargo, las siguientes condiciones:
- Solo deberá hacerse pública la versión editorial. Rogamos que no se publiquen preprints, postprints o pruebas de imprenta.
- Junto con esa copia ha de incluirse una mención específica de la publicación en la que ha aparecido el texto, añadiendo además un enlace clicable a la URL: http://revista.profesionaldelainformacion.com
La revista Profesional de la información ofrece los artículos en acceso abierto con una licencia Creative Commons BY.