Mi pensas, ke mi jam menciis Äi tie programeton, kiun mi uzas por
kontroli literumon kaj aldoni dividstrekojn. Specifi tian programon
estas pli malfacile ol realigi Äin, sed mi Äus krei malneton de
manpaÄo, kiun vi povas legi sube.
Mi bonvenigus komentojn.
La programo mem ne jam tute kongruas kun la manpaÄo, sed mi povos
baldaÅ publikigi Äin, se iu interesiÄas. Temas pri ÄirkaÅ 300 linioj
da Perl-galimatio.
Edmundo
-----------------------------------------------------------------------
espell [-NIVELO] [-d | -l | -a | -s | -v] VORTARO TEKSTOJ ...
NIVELO estas cifero difinanta la akceptemon de la vortrekonilo:
0 Rekoni nur vortojn, kiuj aperas eksplicite en la vortaro.
1 Rekoni ankaÅ kunmetaÄojn el vortoj en la vortaro.
9 Rekoni Äiujn vortojn per divenado.
La implicita valoro de la NIVELO dependas de la funkcio.
La funkcioj estas:
-d Dividi vortojn en vorterojn (NIVELO=9 implicite).
{...} kun | indikas plurajn dividojn trovitajn.
{...} sen | indikas nerekonitan vorton.
Ekzemple: Sinjoro Bimbam estas sentema poeto.
-> Sinjor`o {Bimbam} est`as {sent`em`a|sen`tem`a} poet`o.
-l Listigi nerekonitajn vortojn (NIVELO=0 implicite).
-a Diveni aldonojn por la vortaro (NIVELO=9 implicite).
La eligo konsistas el registro por la vortaro por Äiu rekonita
vorto, kiu ne jam estas eksplicite en la vortaro. Se vorto estas
plurmaniere rekonita, pluraj ebloj aperas en la sama linio. Necesas
redakti tiajn liniojn, antaÅ ol aldoni ilin al la vortaro.
Kompreneble, se la kontrolata teksto eble havas erarojn aÅ
fremdaÄojn, oni volas Äiuokaze kontroli la eligon de -a.
Ekzemple: La sendana Bimbam fomas la knipon.
-> send'an'a4 sen'dan'a4
Bimbam0
fom8
knip'o4
-s Aldoni dividstrekojn (NIVELO=0 implicite).
La Äusta maniero dividi Esperantajn vortojn estas temo de eterna
diskutado. Äi tiu programo arbitre aplikas la sekvan proceduron.
Unue, dividu la vorton laÅ Äiaj vorteroj, sed ignorante la dividojn
antaÅ gramatika finaÄo (o a j n e i as is os us u).
Due, kie mankas divido inter du vokaloj, dividu la konsonantojn
laÅeble egale, kun pli granda parto post la divido Äe nepara nombro
de konsonantoj; tamen, farante tion oni ignoru la literon Å post
vokalo kaj la literon J post vokalo kaj antaÅ konsonanto.
Se vorto estas plurmaniere rekonita, unue Äi estas dividita laÅ Äiu
analizo, kaj poste la dividoj estas kunigitaj, tiel ke dividstreko
eblas nur tie, kie estas divido laÅ Äiu analizo.
Ekzemple: nigraharulineto
-> nig\-ra\-har\-ul\-in\-e\-to
teo teko tekso teksto ekstra
-> te\-o te\-ko tek\-so tek\-sto eks\-tra
majo naÅa kanto pajnto aÅskulti
-> ma\-jo naÅ\-a kan\-to pajn\-to aÅs\-kul\-ti
sentema
-> sente\-ma
-v Eligi vortaron de la uzataj vortoj (NIVELO=9 implicite).
La eligo konsistas el Äiuj registroj el la vortaro, kiuj estis
uzataj dum traktado de la teksto. Traktado de la teksto per la nova
subvortaro donos samajn rezultojn kiel traktado per la originala
vortaro.
Se oni uzas la programon kun -s por komposti dokumenton el fonto en
CVS, oni eble deziras, ke ankaÅ la vortaro estu en CVS, por ke oni
ricevu saman rezulton el sama fonto. Per -v oni povas meti en CVS
nur la bezonatan subvortaron.
La VORTARO havas unu vorton en Äiu linio, dividitan en vorterojn per
apostrofoj. La lasta signo en Äiu linio montras la vortspecon:
1 Sen gramatikaj finaÄoj.
2 AnkaÅ kun -N (2 ebloj).
4 AnkaÅ kun -J kaj -N (4 ebloj).
8 Kun Äiuj finaÄoj de netransitiva verbo (33 ebloj).
9 Kun Äiuj finaÄoj de transitiva verbo (60 ebloj).
- Prefikso.
/ Sufikso.
0 Neesperanta vorto.
Ekzemple:
mal'pli1
neni'o2
pun'labor'ej'o4
re'lev'iÄ8
sub'ten9
al-
ist/
sappho0
Äe nivelo 1 la vortrekonilo akceptas ankaÅ kunmetaÄojn el du vortojn
el la vortaro. Jenaj specoj de kunmetaÄo estas akceptataj:
RADIKO + (a|e|i|o) + RADIKO + FINAÄO
PREFIKSO + RADIKO + FINAÄO
RADIKO + SUFIKSO + FINAÄO
RADIKO signifas ion, kio aperas en la vortaro kun finaÄo `[aeo][124]
aÅ [89], kaj FINAÄO inkluzivas ankaÅ participojn (sume 70 eblojn).
Ekzemple: est`i`bon`o vid`hom`at`a`j`n al`hom`e`n est`ist`as
Ne necesas meti en la vortaron prefikson aÅ sufikson, kiu estas ankaÅ
radiko, Äar la reguloj same facile kunmetos mal`rid`i kaj hom`in`o el
mal`o kaj in`o kiel el mal- kaj in/. La vortklasoj 0 kaj 1 estas
ekvivalentaj laÅ la nuna regularo: nek sappho0 nek ju1 partoprenas en
kunmetado.
MANKOJ
Eble indus havi pli komplikajn regulojn pri derivado kaj kunmetado.
Estu eble konverti la vortaron al datenbanka dosiero por pli rapida
konsultado.
Estu ia rekonado de apostrofoj kaj dividstrekoj en la teksto.