Raccolta informazioni da monitorare


#31

Io ho trovato questi (tutti comuni abruzzesi, inseriti di recente nel cratere):

Esiti agibilità Barete
http://www.comune.barete.aq.it/images/EMERGENZA_SISMA_2017/elenco%20agibilita.pdf

Esiti agibilità Pizzoli
http://www.comune.pizzoli.aq.it/index.php?option=com_content&view=category&id=151&Itemid=195

Esiti agibilità Farindola
http://www.comune.farindola.pe.gov.it/attachments/article/160/ELENCO%20ESITI%20SOPRALLUOGHI%20FAST.pdf

Esiti agibilità Castelcastagna
http://www.comunedicastelcastagna.gov.it/attachments/article/339/17.12.16(13)_L.pdf

E poi altri dati sui sopralluoghi effettuati nei Comuni abruzzesi sono sul sito del Cor Abruzzo: http://cor.regione.abruzzo.it/index.php/news/49-sopralluoghi-effettuati


#32

Grazie, domani li carico su drive, poi provo ad elaborarli per estrarre il riepilogo dei dati (numero schede, numero di valutazioni per tipo. @gamba.davide mi dai una mano? @cristigalasso hai mai usato tabula per estrarre dati? Ti interessa vedere come si fa? cc @andrea.borruso


#33

Ho sentito parlare di Tabula ma non l’ho mai usata e certo mi piacerebbe imparare ad usarla! E sul sito di Ondata, giusto? Ci darò un’occhiata…

Intanto sul sito del Cor Abruzzo ho trovato questa relazione sullo stato di tutti gli interventi nei Comuni terremotati aggiornata al 2 dicembre. È un file zeppo di dati: verifiche di agibilità su chiese/scuole/edifici pubblici e privati, messa in sicurezza beni culturali, assistenza alla popolazione, istituzione zone rosse, domande Sae e stalle provvisorie, danni alle infrastrutture, spese sostenute.


#34

Ciao @lorenzo_perone, ciao @cristigalasso, ho estratto con tabula il dati del comune di Barete e il primo documento del comune di Pizzoli (questo) e li ho caricati nella cartella condivisa.
Se volete domani proseguo con Pizzoli.
I documenti di Farindola e Castel Castagna non sono pdf ma immagini quindi tabula non funziona; esiste un metodo alternativo?


#35

@cristigalasso tabula è online qui. Provalo quando vuoi :slight_smile:

@gamba.davide occorre fare estrazione con OCR. Online ci sono molti tool, li trovi semplicemente cercando “ocr online tool”. Se fai delle prove e ne trovi alcuni che ti sembrano buoni, tieni da parte il link, magari servirà suggerirlo ad altri!


#36

Ciao @gamba.davide @cristigalasso se volete possiamo fare un hangout per vedere e condividere le modalità di utilizzo di questi strumenti, ho pensato che questo thread possa essere utile per iniziare a condividere le nostre competente.
Riguardo all’OCR io vi suggerisco di fare un account gratuito su Archive.org, oltre alla funzione di OCR ha una funzionalità davvero utile da un pdf scansionato crea un nuovo pdf con l’aspetto del precedente ma con testo vettoriale (cioè selezionabile), non ho fatto la prova ma in linea teorica una tabella scansionata può essere convertita in un pdf con testo vettoriale che Tabula potrebbe essere in grado di interpretare.
@gamba.davide se riesci aggiungi informazioni sui dati delle schede FAST che inserisci nel foglio di calcolo META in modo da avere una vista sui dati caricati ed un riepilogo delle informazioni per ogni comune.


#37

@gamba.davide ora provo con Archive e ti dico come va


#38

Ciao @lorenzo_perone ho provato un servizio on-line e sembra funzionare. Sto testando il documento di Farindola, entro sera condivido. Aggiungo i metadati sui documenti prodotti ieri. Grazie per il suggerimento di archive.org… proverò.


#39

Ciao Davide, ho caricato io il file di Farindola su Archive.org, lo puoi vedere qui in questo momento è in lista per essere processato ma puoi vedere come funziona Archive sui documenti che ho già caricato, ho scritto anche un documento per gestire i metadati dei documenti che ho caricato. Appena convertito ti allego il link per scaricare il pdf vettoriale


#40

Vedo che procediamo spediti :wink: appena sono un po’ tranquilla provo anch’io OCR e Tabula!


#41

Ciao @gamba.davide @cristigalasso questo è il pdf con testo convertito in vettoriale (selezionabile) prodotto dall’OCR di Archive.org.
Durante l’estrazione vengono prodotti per ciascun file diversi formati di dati in output, per il file in questione li trovate qui.
@jenkin ho provato con Tabula ma evidentemente il pdf generato è un mix tra immagine rasterizzata e vettoriale, c’è un modo pratico per estrarre i dati dalla tabella?


#42

Ciao, ho provato il servizio http://www.onlineocr.net (registrato ti danno 21 pagine gratis poi a pagamento) e ho caricato il pdf con le schede di Farindola;
mi ha prodotto questo xlsx

https://drive.google.com/open?id=0B6W4brmPa74hLUtKbW15ZGFQMEk

non male, ma da correggere a mano; comunque è un servizio a pagamento: 1000 pagine ca 4 cnt/pagina


#43

Grazie @guenter.richter un risultato decisamente migliore del mio, Archive.org non offre un granché nella conversione di tabelle scansionate, peccato sia a pagamento…
Comunque in questo caso direi che la tabella è tutta sul foglio di calcolo, vero?


#44

In questo caso io utilizzo una stampante virtuale che mi ristampa il pdf, basta suddividere la stampa selezionando da pag 1 a 99 ed in questo modo creo tanti pezzi del documento. E’ un po lungo ma aggiro il limite delle 100 pagine.


#45

Ho provato un altro: www.freepdfconvert.com
qui il risultato ( free fa solo 2 pagine)
https://drive.google.com/open?id=0B6W4brmPa74hWWRJNzlDQ2tUbTA

mi sembra superiore a www.onlineocr.net - costo 99$ lifetime


#46

penso di si; non ho controllato; ma in teoria pdf -> xsl fa una tabella


#47

Ci dai un’occhiata? Se ci sono tutte le righe c’è solo da ripulire il file.


#48

In questa recensione sono riportati molti strumenti.
Questo è in beta gratuita e mi sembra funzioni bene.


#49

Confermo buon risultato


#50

qui il risultato di tabstract beta: https://drive.google.com/open?id=0B6W4brmPa74hM3NvM3JiZm15cm8

crea 3 tabelle ! con risultato accettabile ma sembra inferiore a www.freepdfconvert.com