Piattaforma di aggregazione e memorizzazione persistente dei flussi di notizie


#1

I flussi informativi sul terremoto e la ricostruzione sono molteplici e provengono da fonti istituzionali, dai media, da fonti locali, ecc. Singole notizie estemporanee possono essere segnalate attraverso l’apposito form di TCI oppure essere salvate in un bookmark manager condiviso (es. http://condividi.ricostruzionetrasparente.it/). Esistono però anche flussi informativi interamente dedicati all’argomento, che andrebbero monitorati e indicizzati interamente.

Al momento è in funzione un’applicazione che aggrega vari feed RSS dedicati alla ricostruzione: http://ricostruzionetrasparente.it/cosa-puoi-fare/informati/news/. Si tratta però di un’applicazione solo di frontend, che legge e aggrega i feed registrati al caricamento della pagina, ma non ne memorizza gli articoli.

Anche per abilitare in futuro una ricerca di archivio delle notizie relative alla ricostruzione, serve un’applicazione lato server che monitori, aggreghi e indicizzi opportunamente i flussi registrati e ne metta a disposizione i contenuti per ricerche full-text o ulteriori elaborazioni.

Sono possibili due strade:

  • sfruttare un applicativo open source di aggregazione e syndication di feed RSS come Tiny Tiny RSS;
  • sviluppare un applicativo di monitoraggio e indicizzazione simile al feed indexer degli albi pretori che indicizzi le notizie in Elasticsearch e le renda navigabili mediante un’interfaccia grafica ad hoc.

Persone

Responsabile: @jenkin

Task

  1. Scelta di una delle due soluzioni su proposte
  • Definizione e realizzazione di un processo di gestione delle liste di feed curati e monitorati
  • Sviluppo e messa in produzione del processo di monitoraggio e indicizzazione degli articoli dei feed
  • Progettazione di un’interfaccia grafica di ricerca e navigazione degli articoli indicizzati
  • Sviluppo e messa in produzione dell’interfaccia grafica

Milestones e tempistiche

Dipendono dalla soluzione scelta. Al momento si consideri l’8 ottobre come data di conclusione del lavoro.

Output atteso

Un processo automatizzato di monitoraggio, aggregazione e indicizzazione di articoli da una lista di feed curati. La definizione di un processo di gestione, mantenimento e aggiornamento delle liste di feed curati. Un’interfaccia grafica di navigazione e ricerca dell’archivio di notizie indicizzate.