Ceci est une ancienne révision du document !


Journal de recherche pour un mois donné

Il est possible d'obtenir le journal des recherches effectuées sur le serveur Scrutari à l'adresse suivante : /explore/lists/log_{code du mois}.xml où le code du mois est sous la forme annéé-mois (aaaa-mm, par exemple, « 2009-96 »). C'est un fichier XML codé en UTF-8 qui comprend, d'une part, les recherches effectuées sur Scrutari et, d'autre part, des statistiques qui permettent de suivre l'évolution du contenu du serveur Scrutari.

Structure du format XML

L'élément racine est l'élément <log> qui possède les attributs suivants :

  • @y : année du mois en question
  • @m : numéro du mois en question de 1 à 12 (avec 0 pour devant pour les mois à un chiffre)
  • @c : expression complète de l'année et du mois sous la forme : aaaa-mm

Un élément <log> contient des éléments <day>, un pour chaque jour où a été effectué au moins une recherche. L'élément <log> sera donc vide si aucune recherche n'a été effectuée sur le serveur Scrutari pour le mois en question. Un élément <day> possède les attributs suivants :

  • @n : numéro du jour en question sous forme numérique (i.e. sans 0 devant pour les jours à un chiffre)
  • @s : numéro du jour en question avec un 0 devant pour les jours à un chiffre
  • @fiche : nombre total de fiches traitées par le serveur à la date du jour en question
  • @motcle : nombre total de mots-clés traités par le serveur à la date du jour en question
  • @corpus : nombre total de corpus traités par le serveur à la date du jour en question
  • @thesaurus : nombre total de thésaurus traités par le serveur à la date du jour en question
  • @base : nombre total de bases auxquelles le le serveur à la date du jour en question
  • @lexie : nombre de mots relevés dans les fiches et mots-clés des différentes bases à la date du jour en question
  • @indexation : nombre total des liens entre fiches et mots-clés à la date du jour en question

Un élément <day> comprend ensuite un nombre illimité d'éléments <ip> qui regroupent toutes les requêtes du jour provenant de la même adresse IP (c'est un regroupement indicatif, l'adresse IP elle-même n'est pas transmise). Un élément <ip> n'a pas d'attribut et il comprend un nombre illimité d'éléments <q> qui décrit la recherche effectuée.

Un élément <q> possède uniquement des attributs qui sont les suivants :

serveurscrutari/exploration/monthlog.1245752115.txt.gz · Dernière modification: 2009/12/17 11:26 (modification externe)
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0