Non, OSM a des données aussi pour bien autre chose que les liens Wikimedia,
notamment pour les libellés (name:* et variantes) qui sont en de bien plus
nombreuses langues (et écritures).

Pour les liens wikipedia, il n'y a pas besoin de la conformité BCP 47 car
oui dans ce cas ce ne sont que des étiquettes de noms de domaines.
Cependant dans les deux cas la casse n'est pas imposée, il y a juste une
casse recommandée et qu'on peut normaliser en minuscules (même si pour
BCP47 il est fait référence à des casses alternatives concernant les codes
ISO 3166-1 (à 2 lettres uniquement, éventuellement augmenté par des codes
de subdivisions de l'ISO 3166-2, avec un séparateur facultatif, donc lui
aussi ce second sous-code devrait être en capitales, mais ce cas ne
concerne pas les codes de langues régionalisés qui n'utilisent pas du tout
les codes ISO 3166-2) normalement en capitales uniquement, et les codes ISO
15924 avec l'initiale seule en capitale.

Pour OSM, tout ce qui concerne la codification des langues de base devrait
être en minuscules (mais les extensions de code peuvent varier en casse, et
on ne doit pas supprimer les séparateurs, et OSM devrait normaliser partout
les capitales requises pour les codes régions et l'initiale seulement des
codes d'écriture, sinon tout le reste en minuscules uniquement: on a des
tags dont les noms qui ont des extensions, préfixées ou suffixées avec ":"
qui dinstingue soit par pays, soit par langue; et aussi des extensions ":"
d'usage privé qui devraient être en minuscules mais d'autres en capitales
et on a le risque de collision avec des codes langue ou codes
géographiques, et c'est un peu le "bordel" dans ces extensions qui
devraient éviter tout risque de collision avec les codes langues ou
géographiques, en normalisant ces dernières de la façon recommandée par
BCP47, afin que les autres extension OSM n'utilisent aucune de ces formes;
cependant il n'y a pas de collision si les extensions OSM ne sont PAS 2 ou
3 lettres ou 3 chiffres éventuellement suivis d'un trait d'union et là on a
un peu toutes les formes; mais il y a encore certaines extensions privées
d'OSM qui entrent en collision avec les codes langues et géographiques avec
leur capitalisation normalisée : OSM initialement a émis des
recommandations n'utilisant que les minuscules mais ce n'est pas tenable et
les tags privées d'OSM ont une casse significative par défaut: on doit donc
normaliser la casse de ces codes même si ni BCP 47 ni les codes ISO, ni les
noms de domaines Wikimedia ne l'imposent, et ça traîne depuis des années et
continue à compliquer les requêtes et à poser des problèmes d'évolution
pour plus de langues ou de régions).


Le mer. 27 nov. 2019 à 00:36, Yves P. <yves.prat...@gmail.com> a écrit :

>
> Concernant les préfixes de langue il n'y a pas que les tirets, mais si on
> les accepte il faudrait aussi valider la syntaxe. Visiblement ne sont
> acceptés que les codes langue en minuscules
>
> En fait c’est plus simple, on n’accepte que les codes de langues des sites
> wikipedia existants.
> cf. API wikimedia ou requêtes SPARQL : https://w.wiki/Cqb
>
> Minuscules ou majuscules, ce sont des noms de domaines, donc (pour le
> moment) ça ne change rien.
>
> —
> Yves
>
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à