Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
scrutaridata:impl:spip [2009/09/25 17:53]
vincent
scrutaridata:impl:spip [2016/07/06 18:33] (Version actuelle)
vincent [Exemple d'un squelette Spip d'exportation au format ScrutariData]
Ligne 3: Ligne 3:
 Dans le cadre de la Coredem, plusieurs sous Spip exportent leurs méta-données au format ScrutariData : par exemple, [[http://​www.rinoceros.org|Rinoceros]] et le [[http://​www.world-governance.org|forum pour une nouvelle gouvernance mondiale]]. Les squelettes de Spip peuvent effectivement être utilisés pour créer du code XML plutôt que du HTML (les flux RSS créés par Spip sont aussi gérés par des boucles). Dans le cadre de la Coredem, plusieurs sous Spip exportent leurs méta-données au format ScrutariData : par exemple, [[http://​www.rinoceros.org|Rinoceros]] et le [[http://​www.world-governance.org|forum pour une nouvelle gouvernance mondiale]]. Les squelettes de Spip peuvent effectivement être utilisés pour créer du code XML plutôt que du HTML (les flux RSS créés par Spip sont aussi gérés par des boucles).
  
-L'​exemple ci-dessous est du site [[http://​eau.d-p-h.info/​|Ressources pour une gestion durable de l'​eau]]. Ces boucles doivent être adaptées à chaque site.+L'​exemple ci-dessous est du site [[http://​eau.d-p-h.info/​|Ressources pour une gestion durable de l'​eau]] ​et a été réalisé par Thierry Eraud. Ces boucles doivent être adaptées à chaque site.
  
 En effet, il est rare d'​inclure tous les articles d'un site Spip dans l'​export au format Scrutari (par exemple, on n'​exporte pas la page Contacts) : seules les articles correspondant à des ressources sont à exporter. La façon dont ces articles sont distingués des autres articles dépend de l'​organisation du site. Cela peut-être par un mot-clé ou une rubrique. Dans le site donné en exemple, c'est la rubrique avec l'​identifiant 1 qui sert à regrouper tous les articles correspondant à une ressource. En effet, il est rare d'​inclure tous les articles d'un site Spip dans l'​export au format Scrutari (par exemple, on n'​exporte pas la page Contacts) : seules les articles correspondant à des ressources sont à exporter. La façon dont ces articles sont distingués des autres articles dépend de l'​organisation du site. Cela peut-être par un mot-clé ou une rubrique. Dans le site donné en exemple, c'est la rubrique avec l'​identifiant 1 qui sert à regrouper tous les articles correspondant à une ressource.
Ligne 9: Ligne 9:
 Pour les mots-clés, le problème est le même : tous les mots-clés utilisés par un site Spip ne sont pas pertinents (on peut par exemple utiliser des mots-clés dans un but technique de sélection de telle ou telle page). Dans ce cas-là, la solution est de répartir les mots-clés dans des groupes et de ne garder que les groupes concernés. Dans le cas de l'​exemple,​ tous les mots-clés sont exportés sauf ceux du groupe « reserve ». Pour les mots-clés, le problème est le même : tous les mots-clés utilisés par un site Spip ne sont pas pertinents (on peut par exemple utiliser des mots-clés dans un but technique de sélection de telle ou telle page). Dans ce cas-là, la solution est de répartir les mots-clés dans des groupes et de ne garder que les groupes concernés. Dans le cas de l'​exemple,​ tous les mots-clés sont exportés sauf ceux du groupe « reserve ».
  
-===== Exemple ​de boucles ​Spip suivant le format ScrutariData =====+===== Exemple ​d'un squelette ​Spip d'​exportation au format ScrutariData =====
  
 +Ce squelette Spip est enregistré dans le dossier squelettes/ et sera appelé comme n'​importe quel autre squelette. Par exemple, s'il est enregistré sous le nom ''​scrutari.html'',​ il sera appelé via ''​spip.php?​page=scrutari''​.
  
 <code xml> <code xml>
Ligne 17: Ligne 18:
  <​base-metadata>​  <​base-metadata>​
  [(#REM)  [(#REM)
- authority-uuid est un identifiant universel propre au producteur de base+ authority ​permet d'​identifier le producteur de la base, il peut s'agir d'un nom de domaine ou, comme ici, d'​identifiant universel
  base-name est le nom technique de la base (en minuscules sans accent ni espace)  base-name est le nom technique de la base (en minuscules sans accent ni espace)
  ]  ]
- <​authority-uuid>​15f2bd12-f4d0-8314-0800200c9a66</​authority-uuid>+ <​authority>​15f2bd12-f4d0-8314-0800200c9a66</​authority>​
  <​base-name>​ressouces_eau</​base-name>​  <​base-name>​ressouces_eau</​base-name>​
  
Ligne 101: Ligne 102:
  ]  ]
 <​BOUCLE_groupe_mots(GROUPES_MOTS){titre != reserve}>​  <​BOUCLE_groupe_mots(GROUPES_MOTS){titre != reserve}>​
- <​thesaurus thesaurus-name="​[(#​TITRE|texte_backend)]">​+ <​thesaurus thesaurus-name="​groupe_[(#ID_GROUPE)]">​
  <​thesaurus-metadata>​  <​thesaurus-metadata>​
  <​intitule-thesaurus>​  <​intitule-thesaurus>​
Ligne 128: Ligne 129:
  
 <​BOUCLE_themes_indexation(GROUPES_MOTS){titre != reserve}>​  <​BOUCLE_themes_indexation(GROUPES_MOTS){titre != reserve}>​
- <​indexation-group corpus-path="​[(#​_ressources:​TITRE|supprimer_numero|texte_backend)]" thesaurus-path="​[(#​TITRE|texte_backend)]">​+ <​indexation-group corpus-path="​ressources" thesaurus-path="​groupe_[(#ID_GROUPE)]">​
  <​BOUCLE_sous_themes_indexation(MOTS){id_groupe}>​  <​BOUCLE_sous_themes_indexation(MOTS){id_groupe}>​
  <​BOUCLE_articles_lies_sous_themes(ARTICLES){id_mot}{branche}><​indexation fiche-id='#​ID_ARTICLE'​ motcle-id='#​ID_MOT'/></​BOUCLE_articles_lies_sous_themes>​   <​BOUCLE_articles_lies_sous_themes(ARTICLES){id_mot}{branche}><​indexation fiche-id='#​ID_ARTICLE'​ motcle-id='#​ID_MOT'/></​BOUCLE_articles_lies_sous_themes>​
Ligne 142: Ligne 143:
 ===== Exemple de fichier d'​information ===== ===== Exemple de fichier d'​information =====
  
 +Comme il est indiqué à la page sur les [[serveurscrutari:​config:​scrutariinfo|fichiers d'​information]],​ le serveur Scrutari ne charge pas directement le fichier au format ScrutariData. Il passe par un intermédiaire qui est un fichier de très petite taille qui indique si une mise à jour à eu lieu depuis le dernier passage du robot du serveur Scrutari.
  
 +L'​exemple suivant, toujours tiré du même site, est un squelette très simple permettant de générer le fichier d'​information.
 +
 +<code xml>
 +[(#​HTTP_HEADER{Content-type:​ text/xml; charset=UTF-8})]<?​xml version="​1.0"​ encoding="​UTF-8"?>​
 +<​header>​
 + [(#REM)
 + Seuls les articles de la rubrique ressources sont pris en compte.
 + On recupere la date du dernier article de la rubrique.
 + ]
 + <​BOUCLE_date(RUBRIQUES){id_rubrique=1}>​
 + <​date>​[(#​DATE|affdate{'​Y-m-d'​})]</​date>​
 + </​BOUCLE_date>​
 + <​path>​spip.php?​page=scrutari</​path>​
 +</​header>​
 +</​code>​
  
scrutaridata/impl/spip.1253894026.txt.gz · Dernière modification: 2009/12/17 11:26 (modification externe)
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0