Ciao, se usi linux potresti provare ad utilizzare pdfgrep che è in grado di estrarre del testo da un pdf e poi lo reindirizzi ad esempio in un file txt. Io l'ho usato per rinominare dei file pdf in maniera ricorsiva prendendo del testo dall'interno che era posizionato sempre nella stessa riga. La cosa funziona ma ci vuole un pò di lavoro esempio (con una fattura pdf) dico a pdfgrep di intercettare nel pdf la riga con la parola "imposta" e tirare fuori il testo della riga reindirizzandolo in un file txt
*pdfgrep -in imposta *.pdf > test.txt* quello che poi trovo nel file txt è questo (estratto dal modello fattura allegato) *1: Imposta IVA 220,00* ok ho il testo, a questo punto devo decidere quanto sbattermi per estrarre i dati che mi interessano e organizzarmi per poi avere una tabella, se ne vale la pena in termini di tempo risparmiato Il giorno ven 14 gen 2022 alle ore 11:31 Valerio Messina <e...@iol.it> ha scritto: > On 1/14/22 9:45 AM, Edoardo Ingrassia wrote: > > Ho un numero molto elevato di > > fatture in formato PDF (tutte di uguale formato). Vorrei prendere solo > > alcuni dati di queste fatture, cioè numero fattura, la data, > > l'imponibile e l'IVA pagata. Questi dati devono essere riportati tutti > > su un foglio di calc. Faccio un esempio, il foglio dovrebbe avere 4 > > colonne dove c'è nella prima numero fattura, nella seconda la data, > > poi l'imponibile e poi l'IVA. Fino ad adesso ho inserito tutto a mano > > e volevo sapere se esiste una soluzione "automatizzata" dato che è > > tutto in formato elettronico > > LibreOffice non è lo strumento giusto per fare quella cosa. > > Io userei la libreria poppler e le poppler-utils, trovi comandi che > convertono i PDF in testo o HTML in modo automatizzato, poi con uno > script di bash, estrai i campi di interesse e produci facilmente un file > CSV che poi importi in OpenOffice. > > Richiede un minimo di smanettamento. > > Se usi Windows visto che la libreria non è pre-installata, esiste un > port già pre-compilato, lo trovi linkato su Wikipedia: > https://en.wikipedia.org/wiki/Poppler_%28software%29 > > -- > Valerio > > -- > Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org > Problemi? > https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ > Linee guida per postare + altro: > https://wiki.documentfoundation.org/Local_Mailing_Lists/it > Archivio della lista: https://listarchives.libreoffice.org/it/users/ > Privacy Policy: https://www.documentfoundation.org/privacy > -- Fabio Mura -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy