se devo cercare un valore numerico va bene e funziona esattamente come
per la stringa. Però il quesito è come estrarre i dati dalle fatture. Se
devo impostare il valore numerico per ogni fattura, è più conveniente
caricarli a mano. Si fa prima.

Capisco anche che LO non è lo strumento adatto, perché considera i pdf
come immagini e li apre i draw.

Lo strumento più adatto è acrobat dc pro che converte i pdf direttamente
in excel ma costa 90€ con rinnovo annuale.

Gian Paolo

Il 14/01/22 18:40, Valerio Messina ha scritto:
> come su grep esiste "-A NUM", esiste anche su pdfgrep
>
> Valerio
>
>
>
> On 1/14/22 5:30 PM, gianpaolo_marcolongo wrote:
>> Ciao a tutti.
>>
>> Avendo linux ho provato pdfgrep ma non funziona nel senso che estrae la
>> riga con la voce segnata.
>>
>> Costruito un pdf così
>>
>> nrofattura, data,imponibile,iva
>>
>> con sotto le singole voci numeri, date, ecc.
>>
>> il comando pdfgrep -i iva *.pdf --*NB vuole *.pdf e non il singolo file*
>> - viene estratta una riga che contiene le stringhe
>> nrofattura,data,imponibile, iva che ovviamente non serve a nulla. Per
>> funzionare dovrei avere una colonna con la stringa uguale ripetuta su
>> ogni riga, cosa che non è possibile se la fattura non è costruita ad hoc
>> ovvero una riga costruita così
>>
>> nrofattura x data gg/mm/aaaa imponibile nnnnn iva ii%
>>
>> direi che sia abbastanza improbabile.
>>
>> Diciamo che pdfgrep va benissimo se ho un testo in formato pdf e voglio
>> estrarre una singola voce con annesso numero di riga.
>>
>> Marcolongo
>>
>>
>> Il 14/01/22 13:21, Fabio Mura ha scritto:
>>> Ciao, se usi linux potresti provare ad utilizzare pdfgrep che è in
>>> grado di
>>> estrarre del testo da un pdf e poi lo reindirizzi ad esempio in un file
>>> txt. Io l'ho usato per rinominare dei file pdf in maniera ricorsiva
>>> prendendo del testo dall'interno che era posizionato sempre nella
>>> stessa
>>> riga.
>>> La cosa funziona ma ci vuole un pò di lavoro
>>> esempio (con una fattura pdf) dico a pdfgrep di intercettare nel pdf la
>>> riga con la parola "imposta" e tirare fuori il testo della
>>> riga  reindirizzandolo in un file txt
>>>
>>> *pdfgrep -in imposta *.pdf > test.txt*
>>> quello che poi trovo nel file txt è questo (estratto dal modello
>>> fattura
>>> allegato)
>>>
>>> *1:
>>>       Imposta IVA                   220,00*
>>>
>>> ok ho il testo, a questo punto devo decidere quanto sbattermi per
>>> estrarre
>>> i dati che mi interessano e organizzarmi per poi avere una tabella,
>>> se ne
>>> vale la pena in termini di tempo risparmiato
>>>
>>>
>>>
>>>
>>>
>>>
>>> Il giorno ven 14 gen 2022 alle ore 11:31 Valerio Messina
>>> <e...@iol.it> ha
>>> scritto:
>>>
>>>> On 1/14/22 9:45 AM, Edoardo Ingrassia wrote:
>>>>> Ho un numero molto elevato di
>>>>> fatture in formato PDF (tutte di uguale formato). Vorrei prendere
>>>>> solo
>>>>> alcuni dati di queste fatture, cioè numero fattura, la data,
>>>>> l'imponibile e l'IVA pagata. Questi dati devono essere riportati
>>>>> tutti
>>>>> su un foglio di calc. Faccio un esempio, il foglio dovrebbe avere 4
>>>>> colonne dove c'è nella prima numero fattura, nella seconda la data,
>>>>> poi l'imponibile e poi l'IVA. Fino ad adesso ho inserito tutto a mano
>>>>> e volevo sapere se esiste una soluzione "automatizzata" dato che è
>>>>> tutto in formato elettronico
>>>> LibreOffice non è lo strumento giusto per fare quella cosa.
>>>>
>>>> Io userei la libreria poppler e le poppler-utils, trovi comandi che
>>>> convertono i PDF in testo o HTML in modo automatizzato, poi con uno
>>>> script di bash, estrai i campi di interesse e produci facilmente un
>>>> file
>>>> CSV che poi importi in OpenOffice.
>>>>
>>>> Richiede un minimo di smanettamento.
>>>>
>>>> Se usi Windows visto che la libreria non è pre-installata, esiste un
>>>> port già pre-compilato, lo trovi linkato su Wikipedia:
>>>> https://en.wikipedia.org/wiki/Poppler_%28software%29
>>>>
>>>> -- 
>>>> Valerio
>>>>
>>>> -- 
>>>> Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
>>>> Problemi?
>>>> https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
>>>> Linee guida per postare + altro:
>>>> https://wiki.documentfoundation.org/Local_Mailing_Lists/it
>>>> Archivio della lista: https://listarchives.libreoffice.org/it/users/
>>>> Privacy Policy: https://www.documentfoundation.org/privacy
>>>>
>>>
>>
>
>

-- 
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Rispondere a