Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
scrutaridata:impl:spip [2009/09/25 17:53] vincent |
scrutaridata:impl:spip [2016/07/06 18:33] (Version actuelle) vincent [Exemple d'un squelette Spip d'exportation au format ScrutariData] |
||
---|---|---|---|
Ligne 3: | Ligne 3: | ||
Dans le cadre de la Coredem, plusieurs sous Spip exportent leurs méta-données au format ScrutariData : par exemple, [[http://www.rinoceros.org|Rinoceros]] et le [[http://www.world-governance.org|forum pour une nouvelle gouvernance mondiale]]. Les squelettes de Spip peuvent effectivement être utilisés pour créer du code XML plutôt que du HTML (les flux RSS créés par Spip sont aussi gérés par des boucles). | Dans le cadre de la Coredem, plusieurs sous Spip exportent leurs méta-données au format ScrutariData : par exemple, [[http://www.rinoceros.org|Rinoceros]] et le [[http://www.world-governance.org|forum pour une nouvelle gouvernance mondiale]]. Les squelettes de Spip peuvent effectivement être utilisés pour créer du code XML plutôt que du HTML (les flux RSS créés par Spip sont aussi gérés par des boucles). | ||
- | L'exemple ci-dessous est du site [[http://eau.d-p-h.info/|Ressources pour une gestion durable de l'eau]]. Ces boucles doivent être adaptées à chaque site. | + | L'exemple ci-dessous est du site [[http://eau.d-p-h.info/|Ressources pour une gestion durable de l'eau]] et a été réalisé par Thierry Eraud. Ces boucles doivent être adaptées à chaque site. |
En effet, il est rare d'inclure tous les articles d'un site Spip dans l'export au format Scrutari (par exemple, on n'exporte pas la page Contacts) : seules les articles correspondant à des ressources sont à exporter. La façon dont ces articles sont distingués des autres articles dépend de l'organisation du site. Cela peut-être par un mot-clé ou une rubrique. Dans le site donné en exemple, c'est la rubrique avec l'identifiant 1 qui sert à regrouper tous les articles correspondant à une ressource. | En effet, il est rare d'inclure tous les articles d'un site Spip dans l'export au format Scrutari (par exemple, on n'exporte pas la page Contacts) : seules les articles correspondant à des ressources sont à exporter. La façon dont ces articles sont distingués des autres articles dépend de l'organisation du site. Cela peut-être par un mot-clé ou une rubrique. Dans le site donné en exemple, c'est la rubrique avec l'identifiant 1 qui sert à regrouper tous les articles correspondant à une ressource. | ||
Ligne 9: | Ligne 9: | ||
Pour les mots-clés, le problème est le même : tous les mots-clés utilisés par un site Spip ne sont pas pertinents (on peut par exemple utiliser des mots-clés dans un but technique de sélection de telle ou telle page). Dans ce cas-là, la solution est de répartir les mots-clés dans des groupes et de ne garder que les groupes concernés. Dans le cas de l'exemple, tous les mots-clés sont exportés sauf ceux du groupe « reserve ». | Pour les mots-clés, le problème est le même : tous les mots-clés utilisés par un site Spip ne sont pas pertinents (on peut par exemple utiliser des mots-clés dans un but technique de sélection de telle ou telle page). Dans ce cas-là, la solution est de répartir les mots-clés dans des groupes et de ne garder que les groupes concernés. Dans le cas de l'exemple, tous les mots-clés sont exportés sauf ceux du groupe « reserve ». | ||
- | ===== Exemple de boucles Spip suivant le format ScrutariData ===== | + | ===== Exemple d'un squelette Spip d'exportation au format ScrutariData ===== |
+ | Ce squelette Spip est enregistré dans le dossier squelettes/ et sera appelé comme n'importe quel autre squelette. Par exemple, s'il est enregistré sous le nom ''scrutari.html'', il sera appelé via ''spip.php?page=scrutari''. | ||
<code xml> | <code xml> | ||
Ligne 17: | Ligne 18: | ||
<base-metadata> | <base-metadata> | ||
[(#REM) | [(#REM) | ||
- | authority-uuid est un identifiant universel propre au producteur de base | + | authority permet d'identifier le producteur de la base, il peut s'agir d'un nom de domaine ou, comme ici, d'identifiant universel |
base-name est le nom technique de la base (en minuscules sans accent ni espace) | base-name est le nom technique de la base (en minuscules sans accent ni espace) | ||
] | ] | ||
- | <authority-uuid>15f2bd12-f4d0-8314-0800200c9a66</authority-uuid> | + | <authority>15f2bd12-f4d0-8314-0800200c9a66</authority> |
<base-name>ressouces_eau</base-name> | <base-name>ressouces_eau</base-name> | ||
Ligne 101: | Ligne 102: | ||
] | ] | ||
<BOUCLE_groupe_mots(GROUPES_MOTS){titre != reserve}> | <BOUCLE_groupe_mots(GROUPES_MOTS){titre != reserve}> | ||
- | <thesaurus thesaurus-name="[(#TITRE|texte_backend)]"> | + | <thesaurus thesaurus-name="groupe_[(#ID_GROUPE)]"> |
<thesaurus-metadata> | <thesaurus-metadata> | ||
<intitule-thesaurus> | <intitule-thesaurus> | ||
Ligne 128: | Ligne 129: | ||
<BOUCLE_themes_indexation(GROUPES_MOTS){titre != reserve}> | <BOUCLE_themes_indexation(GROUPES_MOTS){titre != reserve}> | ||
- | <indexation-group corpus-path="[(#_ressources:TITRE|supprimer_numero|texte_backend)]" thesaurus-path="[(#TITRE|texte_backend)]"> | + | <indexation-group corpus-path="ressources" thesaurus-path="groupe_[(#ID_GROUPE)]"> |
<BOUCLE_sous_themes_indexation(MOTS){id_groupe}> | <BOUCLE_sous_themes_indexation(MOTS){id_groupe}> | ||
<BOUCLE_articles_lies_sous_themes(ARTICLES){id_mot}{branche}><indexation fiche-id='#ID_ARTICLE' motcle-id='#ID_MOT'/></BOUCLE_articles_lies_sous_themes> | <BOUCLE_articles_lies_sous_themes(ARTICLES){id_mot}{branche}><indexation fiche-id='#ID_ARTICLE' motcle-id='#ID_MOT'/></BOUCLE_articles_lies_sous_themes> | ||
Ligne 142: | Ligne 143: | ||
===== Exemple de fichier d'information ===== | ===== Exemple de fichier d'information ===== | ||
+ | Comme il est indiqué à la page sur les [[serveurscrutari:config:scrutariinfo|fichiers d'information]], le serveur Scrutari ne charge pas directement le fichier au format ScrutariData. Il passe par un intermédiaire qui est un fichier de très petite taille qui indique si une mise à jour à eu lieu depuis le dernier passage du robot du serveur Scrutari. | ||
+ | L'exemple suivant, toujours tiré du même site, est un squelette très simple permettant de générer le fichier d'information. | ||
+ | |||
+ | <code xml> | ||
+ | [(#HTTP_HEADER{Content-type: text/xml; charset=UTF-8})]<?xml version="1.0" encoding="UTF-8"?> | ||
+ | <header> | ||
+ | [(#REM) | ||
+ | Seuls les articles de la rubrique ressources sont pris en compte. | ||
+ | On recupere la date du dernier article de la rubrique. | ||
+ | ] | ||
+ | <BOUCLE_date(RUBRIQUES){id_rubrique=1}> | ||
+ | <date>[(#DATE|affdate{'Y-m-d'})]</date> | ||
+ | </BOUCLE_date> | ||
+ | <path>spip.php?page=scrutari</path> | ||
+ | </header> | ||
+ | </code> | ||