Hallo Jörg,
Am 16.10.2019 um 17:05 schrieb Jörg Schmidt:
Hallo,
die Frage steht eigentlich bereits im Betreff. Ein Kunde von mir meint das die
Rechtschreibprüfung in LO 6.3.1 auffallend besser sein soll als in anderen
LO-Versionen.
Gab es da relevante Änderungen?
(Evtl. auch in 'zeitnahen' vorherigen Versionen?)
_Meine_ Annahme ist aber zunächst nur, das sich vielleicht die mitgeliefertern
Wörterbücher verändert haben, und das vielleicht zufällig um Begriffe die mein
Kunde bevorzugt benutzt.
*Rückblick und Ausblick*
Die Hunspell-Technologie gibt es seit rund zehn Jahren. Die letzten
Extensions für die deutsche Rechtschreibung (DE, AT, CH) habe ich am
12.01.2017 veröffentlicht:
https://extensions.libreoffice.org/extensions/german-de-de-frami-dictionaries
https://extensions.libreoffice.org/extensions/german-de-at-frami-dictionaries
https://extensions.libreoffice.org/extensions/german-de-ch-frami-dictionaries
Zuvor gab es zumeist ein Update pro Jahr. Der Umfang der aufgenommenen
Wörter ist im Laufe der Jahre beträchtlich angewachsen auf
zwischenzeitlich fast 260 000 Wörter. Damit dürfte es zurzeit das
größte Wörterbuch für Rechtschreibung im Open-Source-Bereich sein. Aber
angesichts des riesigen Wortschatzes der deutschen Sprache kommt einer
solchen Aussage nur relative Bedeutung zu.
Dabei spielt es keine Rolle, ob jemand die o.g. "originalen" Extensions
verwendet oder die "vorinstallierten" Extensions. Der einzige
Unterschied ist, dass die vorinstallierten Extensions DE, AT und CH zu
einer einzigen Extension vereinigt sind. Wenn ein Wörterbuch-Update
erscheint, wird es immer auch zeitnah in die neue LO- bzw. AOO-Version
übernommen.
Eine Schwachstelle kommt bisher der automatischen Silbentrennung zu. Im
Gegensatz zur Rechtschreibung arbeitet diese mit Patterns auf
einstufiger algorithmischer Basis. Das funktioniert im Englischen und
Französischen gut - aber nicht mit hochkomplexen Sprachen, wie bspw.
Deutsch mit seiner Unzahl an Präfixen, Suffixen, Fremdwörtern und
kreativen Zusammensetzungen. Deshalb arbeite ich seit fast vier Jahren
an einer "Generalrevision" der alten Silbentrennung.
Die künftige Version arbeitet mit einer hybriden Technik: Es gibt eine
Liste mit Grundwörtern, aber auch mit möglichen Zusammensetzungen mit
ihren unterschiedlichen Nahtstellen. In der ersten Stufe werden
Zusammensetzungen in ihre Bestandteile zerlegt, in der zweiten Stufe
werden jeweils alle Einzelbestandteile getrennt - beide Stufen arbeiten
jeweils auf algorithmischer Basis.
Ein Extension-Update ist m.E. erst dann sinnvoll, wenn auch die neue
automatische Silbentrennung fertig ist. Und das wird noch etwas dauern.
Viele Grüße
Karl
--
Liste abmelden mit E-Mail an: discuss+unsubscr...@de.libreoffice.org
Probleme?
https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/discuss/
Datenschutzerklärung: https://www.documentfoundation.org/privacy