Re: [Python] solr e hystack

Strap Lab Sat, 12 Jan 2019 03:56:48 -0800

Ciao

Il giorno sab 12 gen 2019, 11:49 salvatore monaco <
[email protected]> ha scritto:


> Ciao Francesco,
> io in condizioni analoghe uso tika
> https://tika.apache.org/
>

Dovrebbe già essere integrato in solr, quindi il metodo suggerito con
haystack dovrebbe funzionare senza particolari sforzi, almeno così mi
sembra di capire dalla documentazione e dal codice Python.
Non avendo mai utilizzato solr lascio comunque la parola ai più esperti.

Ad ogni modo l'estrazione di testo da pdf si può fare anche con Python, ci
sono un paio di packages interessanti: pdfminer e pdf2 toolkit.

Sani
Strap

PS: evitiamo il top quoting, giusto? ;-)

_______________________________________________
Python mailing list
[email protected]
https://lists.python.it/mailman/listinfo/python

Re: [Python] solr e hystack

Rispondere a