Différences

Ci-dessous, les différences entre deux révisions de la page.

--- scrutaridata:impl:spip [2009/09/25 17:53]
vincent
+++ scrutaridata:impl:spip [2016/07/06 18:33] (Version actuelle)
vincent [Exemple d'un squelette Spip d'exportation au format ScrutariData]
@@ Ligne 3: / Ligne 3: @@
 Dans le cadre de la Coredem, plusieurs sous Spip exportent leurs méta-données au format ScrutariData : par exemple, [[http://www.rinoceros.org|Rinoceros]] et le [[http://www.world-governance.org|forum pour une nouvelle gouvernance mondiale]]. Les squelettes de Spip peuvent effectivement être utilisés pour créer du code XML plutôt que du HTML (les flux RSS créés par Spip sont aussi gérés par des boucles).
-L'exemple ci-dessous est du site [[http://eau.d-p-h.info/|Ressources pour une gestion durable de l'eau]]. Ces boucles doivent être adaptées à chaque site.
+L'exemple ci-dessous est du site [[http://eau.d-p-h.info/|Ressources pour une gestion durable de l'eau]] et a été réalisé par Thierry Eraud. Ces boucles doivent être adaptées à chaque site.
 En effet, il est rare d'inclure tous les articles d'un site Spip dans l'export au format Scrutari (par exemple, on n'exporte pas la page Contacts) : seules les articles correspondant à des ressources sont à exporter. La façon dont ces articles sont distingués des autres articles dépend de l'organisation du site. Cela peut-être par un mot-clé ou une rubrique. Dans le site donné en exemple, c'est la rubrique avec l'identifiant 1 qui sert à regrouper tous les articles correspondant à une ressource.
@@ Ligne 9: / Ligne 9: @@
 Pour les mots-clés, le problème est le même : tous les mots-clés utilisés par un site Spip ne sont pas pertinents (on peut par exemple utiliser des mots-clés dans un but technique de sélection de telle ou telle page). Dans ce cas-là, la solution est de répartir les mots-clés dans des groupes et de ne garder que les groupes concernés. Dans le cas de l'exemple, tous les mots-clés sont exportés sauf ceux du groupe « reserve ».
-===== Exemple de boucles Spip suivant le format ScrutariData =====
+===== Exemple d'un squelette Spip d'exportation au format ScrutariData =====
+Ce squelette Spip est enregistré dans le dossier squelettes/ et sera appelé comme n'importe quel autre squelette. Par exemple, s'il est enregistré sous le nom ''scrutari.html'', il sera appelé via ''spip.php?page=scrutari''.
 <code xml>
@@ Ligne 17: / Ligne 18: @@
 	<base-metadata>
 		[(#REM)
-			authority-uuid est un identifiant universel propre au producteur de base
+			authority permet d'identifier le producteur de la base, il peut s'agir d'un nom de domaine ou, comme ici, d'identifiant universel
 			base-name est le nom technique de la base (en minuscules sans accent ni espace)
 		]
-		<authority-uuid>15f2bd12-f4d0-8314-0800200c9a66</authority-uuid>
+		<authority>15f2bd12-f4d0-8314-0800200c9a66</authority>
 		<base-name>ressouces_eau</base-name>
@@ Ligne 101: / Ligne 102: @@
 	]
 <BOUCLE_groupe_mots(GROUPES_MOTS){titre != reserve}>
-	<thesaurus thesaurus-name="[(#TITRE|texte_backend)]">
+	<thesaurus thesaurus-name="groupe_[(#ID_GROUPE)]">
 		<thesaurus-metadata>
 			<intitule-thesaurus>
@@ Ligne 128: / Ligne 129: @@
 <BOUCLE_themes_indexation(GROUPES_MOTS){titre != reserve}>
-	<indexation-group corpus-path="[(#_ressources:TITRE|supprimer_numero|texte_backend)]" thesaurus-path="[(#TITRE|texte_backend)]">
+	<indexation-group corpus-path="ressources" thesaurus-path="groupe_[(#ID_GROUPE)]">
 	<BOUCLE_sous_themes_indexation(MOTS){id_groupe}>
 		<BOUCLE_articles_lies_sous_themes(ARTICLES){id_mot}{branche}><indexation fiche-id='#ID_ARTICLE' motcle-id='#ID_MOT'/></BOUCLE_articles_lies_sous_themes>
@@ Ligne 142: / Ligne 143: @@
 ===== Exemple de fichier d'information =====
+Comme il est indiqué à la page sur les [[serveurscrutari:config:scrutariinfo|fichiers d'information]], le serveur Scrutari ne charge pas directement le fichier au format ScrutariData. Il passe par un intermédiaire qui est un fichier de très petite taille qui indique si une mise à jour à eu lieu depuis le dernier passage du robot du serveur Scrutari.
+L'exemple suivant, toujours tiré du même site, est un squelette très simple permettant de générer le fichier d'information.
+<code xml>
+[(#HTTP_HEADER{Content-type: text/xml; charset=UTF-8})]<?xml version="1.0" encoding="UTF-8"?>
+<header>
+	[(#REM)
+		Seuls les articles de la rubrique ressources sont pris en compte.
+		On recupere la date du dernier article de la rubrique.
+	]
+	<BOUCLE_date(RUBRIQUES){id_rubrique=1}>
+	<date>[(#DATE|affdate{'Y-m-d'})]</date>
+	</BOUCLE_date>
+	<path>spip.php?page=scrutari</path>
+</header>
+</code>