Hallo Matthias, Am Mon, 06 Jan 2020 12:18:49 +0100 schrieb Matthias Müller Posteo.de <matth_mueller_...@posteo.de>: > Das ist der Punkt. Die Textdaten müssen extrahiert werden,
Nach Allem, was ich gelesen habe und auch hier diskutiert wurde, läuft es (bis auf eine Ausnahme) wohl darauf hinaus - und das ufert leicht aus. > was einigermaßen komfortabel nur für ODT-Daten funktioniert und auch > nur hier automatisiert werden kann. Wobei mir nicht klar ist, wie dieser Schritt zzgl. die Rückkonvertierung ins odt-Format für viele Dateien in einem Rutsch möglich wäre (ich vermute: gar nicht). > Das ist vermutlich der einfachere Teil des Workflows. Word-Daten sind > komplett binär, das ist nix mit automatisch den Textteil extrahieren. > Erst nach dem Extrahieren ist es möglich mit einem Tool wie recode oä > zu konvertieren. > > Ab hier wird es beliebig komplex..... > Eben. Ich aber kann mir solch einen Aufwand nicht ans Bein binden. > Diese Ausführlichkeit, hat einen einfachen Grund: Ich habe schon mit > solch einem Problem gekämpft und dann frustriert aufgegeben. Und das > waren bereits Textdaten, die allerdings von Windows nach Linux > transferiert wurden. > Au weia... > Falls du es doch versuchen willst, läuft das ganze auf Scripten raus. > Werkzeuge mit denen du dann arbeiten müsstest wären > "gzip" / "gunzip" um die SO-/LO-Daten zu entpacken > "find" um sie zu finden und sie dann mit > "mv" oder "cp" zu verschieben oder kopieren > Für das Ersetzen der seltsamen (eigentlich regulären Unicode-) > Zeichen kommen diverse Werkzeuge in Frage: "tr", "sed", "recode" und > wahrscheinlich noch ein paar. > s.o.: Scheitert am Aufwand. Der muss in Grenzen bleiben. > Aus meiner Sicht die einfachste Methode, allerdings auch die mit dem > meisten Stumpsinn (und deshalb durchaus fehleranfäälig): > Mit LO öffnen und über Suchen/ersetzen (eventl mit RegEx-Hilfe) die > Dateien einzeln zu bearbeiten. Ja, ist wohl die (handwerklich) einfachste, aber eben auch sehr aufwändig, weil jede einzelne Datei bearbeitet werden muss. Insofern scheint sich mit der hier vorgeschlagenem (und von mir als bereits angewandt entdeckten) Makro-Variante das Ganze noch etwas komfortabler zu gestalten. Offenbar gibt es kein Mittel, solch ein Makro über viele Dateien auf einmal zu jagen. Hilfreich wäre nun für mich ein Tipp, wie ich das vorhandene Makro um weitere Zeichen aufstocke. Gibt es in der entsprechenden Maske dafür Schalter, Buttons, o.ä.? > Danach sofort als PDF/A exportieren. PDF/A deshalb, weil es ein > ISO-genormtes Archivformat ist, siehe > https://de.wikipedia.org/wiki/PDF/A > Exportiert LO denn nicht in PDF/A? Viele Grüße Rainer -- Liste abmelden mit E-Mail an: users+unsubscr...@de.libreoffice.org Probleme? https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/ Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de Listenarchiv: https://listarchives.libreoffice.org/de/users/ Datenschutzerklärung: https://www.documentfoundation.org/privacy