Hallo,
vorweg: Ich habe (aus Zeitgründen) die bisherige Diskussion nur
sporadisch verfolgt, ich erinnere, Du nutzt LINUX?
Folgender Abschnitt ist mir aufgefallen:
Am 10.01.20 um 09:48 schrieb Rainer:
Abgesehen davon scheint mir die Sache aussichtslos: Auf meinem System
befinden sich dermaßen viele pdf-Dokumente, die so verstreut sind, dass
ich mir nicht vorstellen kann, wie sie alle ins PDF/A-Format zu bringen
sein könnten. Hinzu kommt, dass sie aus verschiedensten Quellen stammen
(LO, Scanner, Download, etc.) und verschiedene Format-Angaben
enthalten. Und auf das Format neuer Dokumente, die mittels Druckfunktion
von Websites generiert werden, habe ich keinen Einfluss (müssten also -
sofern möglich - vom abgespeicherten Format wieder ins PDF/A
konvertiert werden). Meine Einschätzung: Praktisch nicht umsetzbar,
weil der Aufwand viel zu groß.
Ich denke, Du kannst mit einem BASH / find eine Liste aller PDF-Dateien
erzeugen, egal wo sie auf Deiner Platte gespeichert sind.
So weit ich in Erinnerung hatte, prüft OCRmyPDF, ob bereits
durchsuchbarer Text vorhanden ist und fügt ihn hinzu, falls dies noch
nicht vorhanden ist; siehe hierzu diese Diskussion.
<https://github.com/jbarlow83/OCRmyPDF/issues/72>
Ich habe es nicht getestet, aber wenn das so funktioniert, könntest Du
wieder per BASH Deine Liste durch OCRmyPDF schicken und die neue
erzeugten Files speichern lassen. Schließlich - wenn gewünscht - die
alten Dateien nach Listeneinträgen löschen und die neuen nach den
Listeneinträgen umbenennen.
Gruß
Michael
--
Liste abmelden mit E-Mail an: users+unsubscr...@de.libreoffice.org
Probleme?
https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy