Aínda onte subín varios ficheiros fonte de temáticas específicas que hai que reducir a listas e incorporar no corrector.
A vía correcta útil para facer o da USC é efectivamente que se sumen como colaboradores de listas de vocabulario ao proxecto en hunspell-gl. Ou tamén aquí, como paso previo de material sen codificar https://github.com/meixome/listas-base Como o sistema está modularizado, logo poden construír correctores "personalizados" ou globais a gusto. Obviamente, supón aceptar a licenza GPL v.3 Teriamos que estudar o de MSOffice, lamentablemente non coñezo ningunha ferramenta de corrección ortográfica libre que sirva en ambas plataformas (hunspell e MS), e a limitación de acceso ao código do corrector ortográfico deles é insalvable. O truquiño que di Adrián quizais funcione. En resumo sería: construíde o vocabulario para o corrector coas regras do libre e, logo, tradúcese mecanicamente para MS. O 18:34 do 4 de xuño de 2018, Adrian Chaves <adr...@chaves.io> escribiu: > Como dixo Antón, deixade esa loucura :) > > Hai uns anos reestruturamos as fontes do corrector de Hunspell para > galego, modulariándoo, de xeito que permitise precisamente o que > queredes, ter varias versións con vocabulario distinto segundo as > necesidades do usuario. De feito un deses módulos chámase «usc», e > contén abreviaturas, siglas e símbolos extraídos de documentación da > USC¹. > > A miña recomendación: > 1. Engadide os módulos que queirades dentro do módulo «usc» do proxecto > «hunspell-gl». > 2. Xerade a lista de palabras para Microsoft Word a partir do de > hunspell-gl. > > A documentación sobre como crear módulos de hunspell-gl non está moi > completa (temos traballo pendente nesta área), pero non debería ser > complicado, un compañeiro de Trasno que se meteu a colaborar hai nada > non necesitou máis que unha tarde. Mentres todo o voso vocabulario > flexione de forma similar a vocabulario do DRAG, non teredes máis que > copiar e pegar dos módulos existentes e modificar a palabra base. Unha > mesma palabra con todas as súas flexións adoita requerir unha liña, dous > no caso dos verbos. > > Unha vez creados os módulos, pódense construír variantes do corrector > con distintas combinacións de módulos. Está descrito de maneira moi > resumida no ficheiro README.rst². No voso caso sería algo como «scons > aff=norma,unidades dic=rag,unidades,usc/química» para o de química, por > exemplo. > > O segundo paso, o de xerar a lista de palabras, idealmente podería > facerse coa ferramenta «unmunch» de hunspell, pero non funciona ben coas > regras numéricas que usamos no hunspell-gl³. Porén, facer un script en > Python que fixese o que fai unmunch ben coa fracción da sintaxe de > hunspell que necesitamos non é unha tarea difícil, e co tempo que ides > aforrar ao non ter que escribir a man todas as flexións verbais davos de > sobra para facer isto. Podo afirmalo porque isto mesmo fixérao eu no > pasado (e acabei eliminando o código por parvo) e tiña pensado facelo de > novo a longo prazo para lidiar con algunhas das cousas que queremos > facer en hunspell-gl, como prohibir palabras concretas⁴. > > Calquera cousa estamos aquí, especialmente se vos animades a incluír o > voso traballo no repositorio de hunspell-gl en vez de simplemente > descargar as fontes como punto de partida e facelo todo pola vosa conta > :) > > — > ¹ https://github.com/meixome/hunspell-gl/tree/master/src/usc > ² https://github.com/meixome/hunspell-gl > ³ https://github.com/hunspell/hunspell/issues/319 > ⁴ https://github.com/meixome/hunspell-gl/issues/226 > > On 2018-06-04 11:54, RODRIGUEZ RIO XUSTO ALEXANDRE wrote: > > > Ola, > > > > No Servizo de Normalización Lingüística da USC estamos traballando para > > aproveitar toda a terminoloxía especializada que temos recollida en > > bUSCatermos e ir elaborando con ela "dicionarios personalizados" > > (dicionarios definidos polo usuario) instalables en MS Office e > > LibreOffice. A nosa idea sería ter tres ou catro deses dicionarios > > (dereito, química e algún outro máis) de cara ao último trimestre de > > 2018. > > > > De momento, estamos xerando as flexións nominais e verbais "a machado", > > unha forma antieconómica pero, polo que vimos, a única que permite MS > > Office. > > > > O que quería preguntar é se existe algunha forma de integrar as regras > > de hunspell neste tipo de dicionarios, de forma que non haxa que > > multiplicar as formas incluídas para reproducir a flexión verbal. A > > partir de aquí, son todo oídos para escoitar calquera proposta ou idea > > que se vos ocorra en relación con iso (desde a ignorancia máis absoluta > > sobre a programación do corrector). Ou se vedes algunha vía para > > integrar o corrector e os dicionarios personalizados nun único > > "produto", ou o que se vos pase pola cabeza... > > > > Xusto > > > > - Lista de correo de Proxecto Trasno - Enviar correo a - > > proxecto@trasno.gal > > - Correo do administrador - administra...@trasno.gal - de - Proxecto > > Trasno > > - Cancelar a subscrición no URL: > > http://trasno.gal/web?confirm_unsubscribe=indeed&m=2220&h= > 6918180c09a65e719cc1d2e67f346a8d75464ccb&sa=58187334 > > - Lista de correo de Proxecto Trasno - Enviar correo a - > proxecto@trasno.gal > - Administrador - administra...@trasno.gal - de - Proxecto Trasno > - Cancelar a subscrición no URL : http://trasno.gal/web?confirm_ > unsubscribe=indeed&m=2227&h=d6d3539402691c68723a82c51bf0f9 > 8a650a2066&sa=418748867 > > - Lista de correo de Proxecto Trasno - Enviar correo a - proxecto@trasno.gal - Administrador - administra...@trasno.gal - de - Proxecto Trasno - Cancelar a subscrición no URL : http://trasno.gal/web?confirm_unsubscribe=indeed&m=2232&h=a7757bd2078da8bd604e966f4b9d0eac099d91bb&sa=1247845685