Vídeo | Así hicimos Verba, una herramienta para analizar los telediarios a través de los subtítulos
Una presentación de David Cabo, codirector de Civio, para la comunidad de Elastic
Verba es una aplicación web de código abierto que captura y procesa el contenido de los informativos de La 1 de Televisión Española a través de sus subtítulos, lo que permite analizar sus coberturas.
Con Verba puedes…
- Acceder a las transcripciones del Telediario 1 (15h) y del Telediario 2 (21h) de Televisión Española desde 2014 hasta hoy.
- Buscar menciones a términos, personas, entidades y lugares en los contenidos de estos informativos.
- Comprobar visualmente la evolución del número de referencias a un término concreto a lo largo del tiempo.
- Encontrar el fragmento exacto del informativo en el que se hizo mención al objeto de tu búsqueda.
- Descargar los resultados de tu búsqueda en formato .csv.
Compartimos el vídeo de la presentación que David Cabo, codirector de Civio, hizo para la comunidad de Elastic. ¿Te interesan las tecnologías de búsqueda, el procesamiento de lenguaje natural y las tecnologías con un propósito cívico? Entonces no te pierdas esta sesión, con el foco puesto en la arquitectura y aspectos técnicos de Verba.
¿Nos ayudas?
Hemos empezado por ahí, pero nuestra idea es ir poco a poco más allá.
Nos gustaría aplicar poco a poco técnicas de Procesamiento del Lenguaje Natural (PLN) para mejorar las funcionalidades actuales y añadir otras nuevas. Creemos que se trata de campo lleno de posibilidades para analizar la ingente cantidad de información que generan las administraciones públicas. ¿Tienes experiencia en la materia y te apetece ayudarnos?
- Comunidad Civio: ¿Sabes de machine learning y PLN? ¿Nos ayudas a mejorar Verba?