Ciao Il giorno sab 12 gen 2019, 11:49 salvatore monaco < salvatore.mon...@gmail.com> ha scritto:
> Ciao Francesco, > io in condizioni analoghe uso tika > https://tika.apache.org/ > Dovrebbe già essere integrato in solr, quindi il metodo suggerito con haystack dovrebbe funzionare senza particolari sforzi, almeno così mi sembra di capire dalla documentazione e dal codice Python. Non avendo mai utilizzato solr lascio comunque la parola ai più esperti. Ad ogni modo l'estrazione di testo da pdf si può fare anche con Python, ci sono un paio di packages interessanti: pdfminer e pdf2 toolkit. Sani Strap PS: evitiamo il top quoting, giusto? ;-)
_______________________________________________ Python mailing list Python@lists.python.it https://lists.python.it/mailman/listinfo/python