Ola Adrián e Antón,

Por empezar respondendo polo doado: polo tema das licenzas e de traballar en 
GitHub non debería haber problema ningún. 

Pero a partir de aquí pouco máis teño ca dúbidas e preguntas. Comezo por unha 
de concepto: 
Fala Adrián de que o corrector permite "ter varias versións con vocabulario 
distinto segundo as necesidades do usuario". Entendo que iso significa que eu 
podo deseñar e "empaquetar para a distribución" versións do corrector que 
sexan, por exemplo 'xeral + dereito', 'xeral + química', 'xeral + dereito + 
química', etc. 

Pero pregunto: como ten que facer o usuario final para cambiar de versión? 
Desinstalar a actual e instalar unha nova? Ou pode simplemente ter varias 
instaladas e 'residentes' e ir activando/desactivando as que necesite, como se 
pode facer agora cos dicionarios personalizados?

Entrando xa en aspectos máis técnicos... Creo que entendo a lóxica que está 
detrás da creación dos distintos 'dicionarios' (ou módulos do corrector):  
créase un módulo para a terminoloxía de cada un dos ámbitos temáticos, e 
despois fanse paquetes á carta combinando da forma que se queira eses módulos.
Pero espero que para xerar os módulos non haxa que saber Python (porque non 
teño nin idea) e abonde con ir aplicando as regras que aparecen en 
https://github.com/meixome/hunspell-gl/blob/master/src/norma/xeral.aff.
Se é así, creo que vou precisar algunha axuda para aplicar a sintaxe das regras 
ás listas de léxico que extraiamos de bUSCatermos.

En fin, moitas grazas pola axuda e pola boa colaboración, e seguimos falando.

Xusto


-----Mensaxe orixinal-----
De: Adrian Chaves [mailto:adr...@chaves.io] 
Enviado: luns, 04 de xuño de 2018 18:32
Para: Lista de correo de Proxecto Trasno
 RODRIGUEZ RIO XUSTO ALEXANDRE
Asunto: Re: [hunspell] Dicionarios personalizados por especialidades

Como dixo Antón, deixade esa loucura :)

Hai uns anos reestruturamos as fontes do corrector de Hunspell para 
galego, modulariándoo, de xeito que permitise precisamente o que 
queredes, ter varias versións con vocabulario distinto segundo as 
necesidades do usuario. De feito un deses módulos chámase «usc», e 
contén abreviaturas, siglas e símbolos extraídos de documentación da 
USC¹.

A miña recomendación:
1. Engadide os módulos que queirades dentro do módulo «usc» do proxecto 
«hunspell-gl».
2. Xerade a lista de palabras para Microsoft Word a partir do de 
hunspell-gl.

A documentación sobre como crear módulos de hunspell-gl non está moi 
completa (temos traballo pendente nesta área), pero non debería ser 
complicado, un compañeiro de Trasno que se meteu a colaborar hai nada 
non necesitou máis que unha tarde. Mentres todo o voso vocabulario 
flexione de forma similar a vocabulario do DRAG, non teredes máis que 
copiar e pegar dos módulos existentes e modificar a palabra base. Unha 
mesma palabra con todas as súas flexións adoita requerir unha liña, dous 
no caso dos verbos.

Unha vez creados os módulos, pódense construír variantes do corrector 
con distintas combinacións de módulos. Está descrito de maneira moi 
resumida no ficheiro README.rst². No voso caso sería algo como «scons 
aff=norma,unidades dic=rag,unidades,usc/química» para o de química, por 
exemplo.

O segundo paso, o de xerar a lista de palabras, idealmente podería 
facerse coa ferramenta «unmunch» de hunspell, pero non funciona ben coas 
regras numéricas que usamos no hunspell-gl³. Porén, facer un script en 
Python que fixese o que fai unmunch ben coa fracción da sintaxe de 
hunspell que necesitamos non é unha tarea difícil, e co tempo que ides 
aforrar ao non ter que escribir a man todas as flexións verbais davos de 
sobra para facer isto. Podo afirmalo porque isto mesmo fixérao eu no 
pasado (e acabei eliminando o código por parvo) e tiña pensado facelo de 
novo a longo prazo para lidiar con algunhas das cousas que queremos 
facer en hunspell-gl, como prohibir palabras concretas⁴.

Calquera cousa estamos aquí, especialmente se vos animades a incluír o 
voso traballo no repositorio de hunspell-gl en vez de simplemente 
descargar as fontes como punto de partida e facelo todo pola vosa conta 
:)

—
¹ https://github.com/meixome/hunspell-gl/tree/master/src/usc
² https://github.com/meixome/hunspell-gl
³ https://github.com/hunspell/hunspell/issues/319https://github.com/meixome/hunspell-gl/issues/226

On 2018-06-04 11:54, RODRIGUEZ RIO XUSTO ALEXANDRE wrote:

> Ola,
> 
> No Servizo de Normalización Lingüística da USC estamos traballando para 
> aproveitar toda a terminoloxía especializada que temos recollida en 
> bUSCatermos e ir elaborando con ela "dicionarios personalizados" 
> (dicionarios definidos polo usuario) instalables en MS Office e 
> LibreOffice. A nosa idea sería ter tres ou catro deses dicionarios 
> (dereito, química e algún outro máis) de cara ao último trimestre de 
> 2018.
> 
> De momento, estamos xerando as flexións nominais e verbais "a machado", 
> unha forma antieconómica pero, polo que vimos, a única que permite MS 
> Office.
> 
> O que quería preguntar é se existe algunha forma de integrar as regras 
> de hunspell neste tipo de dicionarios, de forma que non haxa que 
> multiplicar as formas incluídas para reproducir a flexión verbal. A 
> partir de aquí, son todo oídos para escoitar calquera proposta ou idea 
> que se vos ocorra en relación con iso (desde a ignorancia máis absoluta 
> sobre a programación do corrector). Ou se vedes algunha vía para 
> integrar o corrector e os dicionarios personalizados nun único 
> "produto", ou o que se vos pase pola cabeza...
> 
> Xusto
> 
> - Lista de correo de Proxecto Trasno - Enviar correo a - 
> proxecto@trasno.gal
> - Correo do administrador - administra...@trasno.gal - de - Proxecto 
> Trasno
> - Cancelar a subscrición  no URL: 
> http://trasno.gal/web?confirm_unsubscribe=indeed&m=2220&h=6918180c09a65e719cc1d2e67f346a8d75464ccb&sa=58187334

- Lista de correo de Proxecto Trasno - Enviar correo a - proxecto@trasno.gal
- Administrador - administra...@trasno.gal - de - Proxecto Trasno
- Cancelar a subscrición no URL : 
http://trasno.gal/web?confirm_unsubscribe=indeed&m=2263&h=72fc7c5378aa726c11613f32a72046fa8d1ce625&sa=777198082

Responderlle a