BIBLIORed 3.0: "Web scraping en medios de comunicación": XIII Seminario Hispano-Mexicano de Investigación en Bibliotecología y Documentación (14-15/04/2016)

martes, 19 de abril de 2016

"Web scraping en medios de comunicación": XIII Seminario Hispano-Mexicano de Investigación en Bibliotecología y Documentación (14-15/04/2016)

Web scraping en medios de comunicación, temática a cargo de Manuel Blázquez, profesor en la Facultad de Ciencias de la Documentación de la Universidad Complutense. El autor presentó el viernes 15 de abril de 2016 en Ciudad de México una ponencia sobre el tema con motivo del XIII Seminario Hispano-Mexicano de Investigación en Bibliotecología y Documentación Uso ético de la información: implicaciones y desafíos organizado por el IIBI-UNAM (Instituto de Investigación Bibliotecológica y de la Información-Universidad Nacional Autónoma de México), la Universidad Complutense (Dpto. de Biblioteconomía y Documentación) y la Universidad Autónoma de San Luis Potosí.

Uno de los métodos indicados para generar big data en medios de comunicación digital se basa en el desarrollo de técnicas de web scraping, que sean capaces de reconocer la estructura de las noticias en los portales de contenidos. Si bien la técnica preferida para realizar el seguimiento informativo son los canales de sindicación, la información disponible a través de ellos es en muchas ocasiones muy limitada por el editor. Esta situación obliga a los investigadores a crear nuevos métodos que permitan la recopilación masiva de informaciones para su posterior estudio y correlación en forma de big data. En este experimento se aborda la recuperación de todas las noticias de portada en tiempo real de la prensa digital de El Mundo, El País, ABC y la radiotelevisión española RTVE.

Más información sobre "Web scraping en medios de comunicación".