Ceci est une ancienne révision du document !


Gestion du multilinguisme

Langues des contenus

Pour les différents contenus du format ScrutariData, il y a deux politiques différentes :

  • Toutes les fiches sont monolingues : c'est l'élément <lang> contenu dans l'élément <fiche> qui indique la langue de la fiche
  • Les autres contenus (intitulés des bases, corpus, thésaurus et mots-clés) sont potentiellement multilingues, les intitulés dans les différentes langues sont indiqués par une suite d'élément <lib> avec l'attribut @xml:lang avec le code de langue au format ISO.

Le format ScrutariData ne demande pas de déclarer explicitement les langues présentes : c'est le serveur Scrutari qui se charge de recenser les langues disponibles en fonction des valeurs des éléments <lang> ou <lib xml:lang=“”>. Un fichier peut très bien proposer deux thésaurus différents dont un est multilingue et l'autre ne l'est pas, ne serait-ce que parce que la traduction du second n'a pas encore été réalisée.

L'ordre des éléments <lib> est important puisque lorsqu'un intitulé est demandé dans une langue non disponible, c'est la valeur du premier élément <lib> de la liste qui est pris comme valeur par défaut. On mettra donc comme première valeur les langues les plus répandues.

Le monolinguisme est imposé aux fiches pour des raisons de simplicité de traitement. Cette langue indique également la langue des titres, sous-titres et champs complémentaires de la fiche en question.

Lorsque une base de données est structurée pour gérer des documents multilingues, la solution est de générer autant d'éléments fiches que nécessaire dans l'extraction au format ScrutariData.

Par exemple, supposons qu'une base possède le document 374 en anglais (en), français (fr) ou espagnol (es), le xml comprendrait trois éléments <fiche> différents (rappelons que l'identifiant d'une fiche n'est pas forcément un nombre) :

<fiche fiche-id="374_en">
<titre>titre en anglais</titre>
</fiche>
<fiche fiche-id="374_fr">
<titre>titre en français</titre>
</fiche>
<fiche fiche-id="374_es">
<titre>titre en espagnol</titre>
</fiche>
scrutaridata/details/multilinguisme.1243952685.txt.gz · Dernière modification: 2009/12/17 11:26 (modification externe)
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0