Ceci est une ancienne révision du document !


Fichier categories.xml : définir des catégories de corpus

Le moteur Scrutari permet de regrouper des corpus issus de bases différentes au sein de « catégories ». Dans la Coredem, par exemple, tous les corpus des différents sites qui correspondent à des dossiers sont réunis dans la catégorie « dossiers ».

Le nombre de catégories n'est pas limité. Il existe toujours une catégorie « par défaut » dans lequel sont placés tous les corpus dont la catégorie n'est pas explicitement définie dans le fichier de configuration (si ce dernier n'existe pas, tous les corpus sont dans la catégorie par défaut).

Les catégories sont ordonnées. Cette ordonnencement joue un grand rôle dans l'ordre des fiches puisque toutes les fiches d'une catégorie supérieure sont placées avant les fiches d'une catégorie inférieure. Dans la Coredem, l'ordre des catégories est la suivante : Concepts > Sites > Dossiers > Ouvrages > Textes et documents (cette dernière catégorie étant la catégorie par défaut).

Structure du format XML

L'élément racine est l'élément <categories>. Il contient un nombre illimité d'éléments <category> qui définissent les catégories. Un élément <category> possède l'attribut @name qui correspond au nom de la catégorie et il contient un nombre illimité d'éléments <lib> indiquant l'intitulé de la catégorie dans une langue donnée.

Les intitulés de la catégorie par défaut peuvent être définis en insérant un élément <category> avec comme valeur _default pour l'attribut @name.

L'ordre des éléments <category> est important car il définit l'ordre des catégories (dans l'ordre décroissant : les premières catégories définies sont placées en premier). La catégorie par défaut n'est pas obligatoirement la dernière, elle peut être placée avant d'autres catégories (si on définit par exemple une catégorie « archives » qui contient des fiches de moindre importance).

Ensuite, l'élément <corpus-classes> contient un nombre illimité d'éléments <corpus-list> (normalement, un par catégorie). Un élément <corpus-list> possède l'attribut @classe-name qui a pour valeur le nom de la catégorie correspondant à la liste et il contient des éléments <uri> qui ont comme valeur l'URI des corpus en question.

Exemple

L'exemple suivant est la définition des catégories de la Coredem (en septembre 2014). Cinq catégories sont définies : Lexicommon (avec un seul corpus), Sites (un seul corpus également), Dossiers (huit corpus), Ouvrages (quatre corpus), Revues (Un corpus).

La catégorie par défaut a comme intitulé en français « Textes et documents ».

<categories>
    <category name="concept">
        <lib xml:lang="fr">Lexicommon</lib>
        <lib xml:lang="en">Lexicommon</lib>
        <lib xml:lang="es">Lexicommon</lib>
        <lib xml:lang="pt">Lexicommon</lib>
    </category>
    <category name="site">
        <lib xml:lang="fr">Sites ressources</lib>
        <lib xml:lang="en">Websites</lib>
        <lib xml:lang="es">Sitios de recursos</lib>
        <lib xml:lang="pt">Sites-fonte</lib>
    </category>
    <category name="dossier">
        <lib xml:lang="fr">Dossiers</lib>
        <lib xml:lang="en">Dossiers</lib>
        <lib xml:lang="es">Dosiers</lib>
        <lib xml:lang="pt">Dossiês</lib>
    </category>
    <category name="ouvrage">
        <lib xml:lang="fr">Ouvrages</lib>
        <lib xml:lang="en">Books</lib>
        <lib xml:lang="es">Libros</lib>
        <lib xml:lang="pt">Livros</lib>
    </category>
    <category name="revue">
        <lib xml:lang="fr">Revues et cahiers</lib>
        <lib xml:lang="en"></lib>
        <lib xml:lang="es"></lib>
        <lib xml:lang="pt"></lib>
    </category>
    <category name="_default">
        <lib xml:lang="fr">Textes et documents</lib>
        <lib xml:lang="en">Texts and documents</lib>
        <lib xml:lang="es">Textos y documentos</lib>
        <lib xml:lang="pt">Textos e documentos</lib>
    </category>
	<corpus-list category-name="concept">
                <uri>corpus:/7121aba0-5232-11e1-b86c-0800200c9a66/coredem_lexicommmon/lexicommon</uri>
	</corpus-list>
	<corpus-list category-name="site">
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/sitecoredem/site</uri>
	</corpus-list>
	<corpus-list category-name="dossier">
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/dph/dossiers</uri>
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/irenees/dossier</uri>
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/rsp/dossier</uri>
                <uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/ire/dossier</uri>
                <uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/culturemedia/dossier</uri>
                <uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/cetim/dossier</uri>
                <uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/agter/dossier</uri>
                <uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/premiermai/selection</uri>
	</corpus-list>
    <corpus-list category-name="revue">
        <uri>corpus:/7121aba0-5232-11e1-b86c-0800200c9a66/passerelles/passerelles</uri>
    </corpus-list>
	<corpus-list category-name="ouvrage">
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/eclm/eclm</uri>
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/ire/ouvrage</uri>
		<uri>corpus:/e17a05b0-c45e-11d8-9669-0800200c9a66/cetim/publication</uri>
		<uri>corpus:/7121aba0-5232-11e1-b86c-0800200c9a66/passerelles/passerelles</uri>
	</corpus-list>
</categories>

DTD

<!ELEMENT categories (category*,corpus-list*)>
 
<!ELEMENT category (lib*)>
   <!ATTLIST category name NMTOKEN #REQUIRED>
 
 
<!ELEMENT corpus-list (uri*)>
 
   <!ELEMENT uri (#PCDATA)>
 
 
 
<!ELEMENT lib (#PCDATA)>
   <!ATTLIST lib xml:lang NMTOKEN #REQUIRED>
serveurscrutari/config/categories.1411555580.txt.gz · Dernière modification: 2014/09/24 12:46 par vincent
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0