Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
scrutaridata:exemples [2009/06/02 16:42] – créée vincentscrutaridata:exemples [2023/10/03 12:53] (Version actuelle) vincent
Ligne 1: Ligne 1:
 ====== Exemples de fichiers au format ScrutariData ====== ====== Exemples de fichiers au format ScrutariData ======
  
-Les exemples suivants sont tirés de sites appartenant à la [[http://www.coredem.info|Coredem]] :+Chaque moteur Scrutari permet de récupérer au format ScrutariData les données qu'il a lui-même collectéL'avantage de cette récupération, c'est que ces données ont été nettoyées d'erreurs éventuelles.
  
-===== Wiki Coredem français =====+Pour la [[https://www.coredem.info|Coredem]], cette liste est accessible à l'adresse [[https://sct1.scrutari.net/sct/coredem/export/source-list.html|sct1.scrutari.net/sct/coredem/export/source-list.html]].
  
-Fichier XML http://scrutari.coredem.info/infos/php/coredem.scrutari-data.php?lang=fr+On pourra prendre comme exemple simple [[https://sct1.scrutari.net/sct/coredem/export/data-lexicommon.xml|lexicommon]] qui ne propose qu'un seul corpus avec comme seul champ de texte le titre. Des sources comme [[https://sct1.scrutari.net/sct/coredem/export/data-socioeco.xml|socioeco]] (site [[https://www.socioeco.org|Socioeco.org]]) ou [[https://sct1.scrutari.net/sct/coredem/export/data-citego.xml|citego]] (site [[https://www.citego.org/|Citégo]]) vont être plus complètes avec différents corpus et thésaurus (plusieurs Mio chacune). 
 + 
 +Autre exemple plus complexe, l'export d'Autour du 1er mai qui comprend de nombreux champs complémentaires et d'attributs, notamment dans les fiches films avec le texte complet d'une fiche : [[https://sct1.scrutari.net/sct/premiermai/export/data-premiermai.xml|sct1.scrutari.net/sct/premiermai/export/data-premiermai.xml]] (plus d'une dizaine de Mio).
  
-C'est une des extractions les plus simples qui soient puisqu'il n'y un seul corpus, aucun thésaurus et les fiches ne comprennent qu'un titre.   
scrutaridata/exemples.1243953729.txt.gz · Dernière modification : 2009/12/17 11:26 (modification externe)
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0