Ceci est une ancienne révision du document !


Fichier sources.xml : définir les sources de données

Le fichier de configuration sources.xml est un fichier essentiel puisque c'est lui qui liste les sources de données du moteur Scrutari. L'absence de ce fichier n'entrainera d'erreur, simplement le moteur tournera à vide !

Chaque source de données est identifiée par un nom qui doit être unique, ne contenir que des minuscules (sans acccent), des chiffres ou le tiret bas _. Pour chaque source, il faut indiquer au moins une URL qui peut être de deux types :

  • Soit il s'agit directement de l'URL d'un fichier au format ScrutariData et dans ce cas il faut également indiquer la fréquence (en nombre de jours de mise à jour)
  • Soit il s'agit de l'URL d'un fichier qui suit le format des fichiers d'information

Pointer directement vers un fichier au format ScrutariData est plus simple. En revanche, un fichier d'information donne plus de possibilités, en particulier celles de tronçonner les données en plusieurs fichiers.

Structure du format XML

L'élément racine est l'élément <sources> qui contient un seul type d'élément : l'élément <source> qui a un attribut obligatoire @name et qui peut contenir soit des éléments <info-url>, soit des éléments <scrutaridata-url> ; ces deux éléments doivent avoir comme valeur une URL valide et un élément <scrutaridata-url> peut posséder un attribut @freq qui indique la fréquence de mise à jour en nombre de jours (la valeur par défaut est « 1 » ce qui signifie que le fichier sera vérifié tous les jours.

L'élément <source> peut également posséder un élément <uri> (indiquant l'URI de la base à utiliser en lieu et place de l'URI indiqué par le fichier au format ScrutariData) ou plusieurs éléments <alias> (permettant d'indiquer des anciens URI équivalents à l'URI actuel). Voir ci-dessous.

Exemple

L'exemple suivant est le fichier de configuration de la Coredem en mars 2014

<?xml version="1.0" encoding="UTF-8"?>
<sources>
    <source name="irenees">
        <info-url>http://bases.basedefiches.net/irenees/pub/scrutari/coredem.scrutari-info.xml</info-url>
	</source>
    <source name="dph">
        <info-url>http://bases.basedefiches.net/dph/pub/scrutari/coredem.scrutari-info.xml</info-url>
	</source>
    <source name="irg">
        <info-url>http://bases.basedefiches.net/irg/pub/scrutari/coredem.scrutari-info.xml</info-url>
	</source>
    <source name="eclm">
        <info-url>http://bases.basedefiches.net/fph/pub/scrutari/eclm_coredem.scrutari-info.xml</info-url>
	</source>
    <source name="chinaeuropa">
        <info-url>http://base.china-europa-forum.net/xml/scrutari/coredem.scrutari-info.xml</info-url>
    </source>
    <source name="terrecitoyenne">
        <info-url>http://terre-citoyenne.org/fileadmin/scrutari/AITC/scrutari-entete.xml</info-url>
	</source>
    <source name="sitecoredem">
        <info-url>http://scrutari.coredem.info/infos/xml/sitecoredem.scrutari-info.xml</info-url>
	</source>
    <source name="fngm">
        <info-url>http://scrutari.coredem.info/infos/php/info.php?base=fngm</info-url>
	</source>
    <source name="lexicommon">
        <info-url>http://lexicommon.coredem.info/spip.php?page=scrutari_entete&amp;id_exportscrutari=1</info-url>
	</source>
    <source name="arga">
        <info-url>http://bases.basedefiches.net/gouvafrique/pub/scrutari/coredem.scrutari-info.xml</info-url>
	</source>
    <source name="cafolis">
        <info-url>http://www.cafolis.org/cgi-bin/scrutari/HEAD</info-url>
	</source>
    <source name="rsp">
        <info-url>http://bases.basedefiches.net/rsp/pub/scrutari/coredem.scrutari-info.xml</info-url>
	</source>
    <source name="premiermai">
        <info-url>http://bases.basedefiches.net/premiermai/pub/scrutari/coredem.scrutari-info.xml</info-url>
    </source>
    <source name="ire">
        <info-url>http://scrutari.i-r-e.org/bdf/sitecoredem.scrutari-info.xml</info-url>
	</source>
    <source name="edd">
        <info-url>http://scrutari.coredem.info/infos/php/info.php?base=edd</info-url>
	</source>
    <source name="aei">
        <info-url>http://scrutari.coredem.info/infos/xml/aei.scrutari-info.xml</info-url>
	</source>
    <source name="culturemedia">
        <info-url>http://scrutari.coredem.info/infos/xml/culturemedia.scrutari-info.xml</info-url>
    </source>
    <source name="vecam">
        <info-url>http://vecam.org/spip.php?page=scrutari-entete</info-url>
    </source>
    <source name="partagedeseaux">
        <info-url>http://www.partagedeseaux.info/spip.php?page=scrutari-entete</info-url>
    </source>
    <source name="modop">
        <info-url>http://bases.basedefiches.net/modop/pub/scrutari/coredem.scrutari-info.xml</info-url>
    </source>
    <source name="cetim">
        <info-url>http://scrutari.coredem.info/infos/php/info.php?base=cetim</info-url>
    </source>
    <source name="agter_bdf">
        <info-url>http://bases.basedefiches.net/agter/pub/scrutari/coredem.scrutari-info.xml</info-url>
    </source>
    <source name="bienscommuns">
        <info-url>http://scrutari.coredem.info/infos/php/info.php?base=bienscommuns</info-url>
    </source>
    <source name="socioeco">
        <info-url>http://bases.basedefiches.net/ess/pub/scrutari/coredem.scrutari-info.xml</info-url>
    </source>
    <source name="aitec">
        <info-url>http://aitec.reseau-ipam.org/spip.php?page=scrutari_entete&amp;id_exportscrutari=1</info-url>
    </source>
    <source name="soletcivilisation">
        <info-url>http://bases.basedefiches.net/soletcivilisation/pub/scrutari/coredem.scrutari-info.xml</info-url>
    </source>
    <source name="coredem_passerelles">
        <info-url>http://www.coredem.info/scrutari-info_passerelles.xml</info-url>
    </source>
    <source name="veblen">
        <info-url>http://www.veblen-institute.org/spip.php?page=scrutari_entete&amp;id_exportscrutari=1</info-url>
    </source>
    <source name="ritimo">
        <info-url>http://www.ritimo.org/spip.php?page=scrutari_entete&amp;id_exportscrutari=1</info-url>
    </source>
    <source name="alimenterre">
        <info-url>http://scrutari.coredem.info/csvconversion/alimenterre/ressources.scrutari-info.xml</info-url>
    </source>
    <source name="alliancesud">
        <info-url>http://www.alliancesud.ch/multimedia/spip.php?page=scrutari_entete&amp;id_exportscrutari=1</info-url>
    </source>
    <source name="agter_spip">
        <info-url>http://www.agter.asso.fr/spip.php?page=scrutari_entete&amp;id_exportscrutari=2</info-url>
    </source>
    <source name="globalchance">
        <info-url>http://www.global-chance.org/spip.php?page=scrutari_info</info-url>
    </source>
    <source name="infogm">
        <info-url>http://scrutari.coredem.info/infos/php/info.php?base=infogm</info-url>
    </source>
</sources>

Plusieurs URL

Comme indiqué ci-dessous, les éléments <info-url> et les éléments <scrutaridata-url> peuvent exister en plusieurs exemplaires. C'est utile si la source est elle même composée de plusieurs sources différentes. Ces sources différentes doivent être elles-mêmes être des sources valides et elles doivent comporter des corpus et des thésaurus avec des noms différents.

Les métadonnées de la base (URI, intitulés, langues d'interface, icones) sont déterminées à partir du premier fichier de sources indiqué.

Voici l'exemple pour le site Agter qui est composé de deux parties (http://www.agter.org et http://www.agter.asso.fr) régies par des logiciels différents.

  <source name="agter">
        <info-url>http://bases.basedefiches.net/agter/pub/scrutari/coredem.scrutari-info.xml</info-url>
        <info-url>http://www.agter.asso.fr/spip.php?page=scrutari_entete&amp;id_exportscrutari=2</info-url>
  </source>

URI et alias

Les fichiers ScrutariData provenant de sources diverses, il peut arriver que celles-ci modifient l'URI de la base alors que le contenu lui-même ne change pas. Cette modification d'URI « casse » l'historique du moteur car le contenu apparait comme du nouveau contenu. Il peut également provoquer des dysfonctionnements dans des filtres basés sur l'URI. Pour éviter ce type de problème, deux mécanismes sont proposés à l'administrateur du moteur afin de mieux contrôler l'URI de la base :

  • fixer l'URI un élément <uri>, la valeur indiquée supplantant celle fournie par le fichier ScrutariData
  • indiquer des alias via un ou plusieurs éléments <alias>, ces alias seront convertis dans la bonne valeur de l'URI aussi bien dans l'historique que dans les filtres.

<uri> et <alias> ont la même syntaxe : leur texte doit être un URI de base valide (l'indication du protocole base: n'est pas obligatoire).

DTD

<!ELEMENT sources (source*)>
 
<!ELEMENT source (info-url?|scrutaridata-url?|uri?|alias*)>
   <!ATTLIST source name NMTOKEN #REQUIRED>
 
<!ELEMENT info-url (#PCDATA)>
 
<!ELEMENT scrutaridata-url (#PCDATA)>
   <!ATTLIST scrutaridata-url freq NMTOKEN '1'>
serveurscrutari/config/sources.1468858640.txt.gz · Dernière modification: 2016/07/18 18:17 par vincent
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0