Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
scrutaridata:details:multilinguisme [2009/06/02 16:25] vincent |
— (Version actuelle) | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Gestion du multilinguisme ====== | ||
- | ===== Langues des contenus ===== | ||
- | |||
- | Pour les différents contenus du format ScrutariData, il y a deux politiques différentes : | ||
- | |||
- | * Toutes les fiches sont monolingues : c'est l'élément //<lang>// contenu dans l'élément //<fiche>// qui indique la langue de la fiche | ||
- | * Les autres contenus (intitulés des bases, corpus, thésaurus et mots-clés) sont potentiellement multilingues, les intitulés dans les différentes langues sont indiqués par une suite d'élément !!<lib>!! avec l'attribut !!@xml:lang!! avec le code de langue au format ISO. | ||
- | |||
- | |||
- | Le format ScrutariData ne demande pas de déclarer explicitement les langues présentes : c'est le serveur Scrutari qui se charge de recenser les langues disponibles en fonction des valeurs des éléments //<lang>// ou //<lib xml:lang="">//. Un fichier peut très bien proposer deux thésaurus différents dont un est multilingue et l'autre ne l'est pas, ne serait-ce que parce que la traduction du second n'a pas encore été réalisée. | ||
- | |||
- | L'ordre des éléments //<lib>// est important puisque lorsqu'un intitulé est demandé dans une langue non disponible, c'est la valeur du premier élément //<lib>// de la liste qui est pris comme valeur par défaut. On mettra donc comme première valeur les langues les plus répandues. | ||
- | |||
- | Le monolinguisme est imposé aux fiches pour des raisons de simplicité de traitement. Cette langue unique indique également la langue des titres, sous-titres et champs complémentaires de la fiche en question. | ||
- | |||
- | Lorsque une base de données est structurée pour gérer des documents multilingues, la solution est de générer autant d'éléments fiches que nécessaire dans l'extraction au format ScrutariData. | ||
- | |||
- | Par exemple, supposons qu'une base possède le document 374 en anglais (en), français (fr) ou espagnol (es), le xml comprendrait trois éléments //<fiche>// différents (rappelons que l'identifiant d'une fiche n'est pas forcément un nombre) : | ||
- | |||
- | <code xml> | ||
- | <fiche fiche-id="374_en"> | ||
- | <titre>titre en anglais</titre> | ||
- | </fiche> | ||
- | <fiche fiche-id="374_fr"> | ||
- | <titre>titre en français</titre> | ||
- | </fiche> | ||
- | <fiche fiche-id="374_es"> | ||
- | <titre>titre en espagnol</titre> | ||
- | </fiche> | ||
- | </code> |