Ceci est une ancienne révision du document !


Exemples de fichiers au format ScrutariData

Chaque moteur Scrutari permet de récupérer au format ScrutariData les données qu'il a lui-même collecté. L'avantage de cette récupération, c'est que ces données ont été nettoyées d'erreurs éventuelles.

Pour la [http://www.coredem.info|Coredem]], cette liste est accessible à l'adresse https://sct1.scrutari.net/sct/coredem/export/source-list.html.

On pourra prendre comme exemple simple le Lexicommon (https://sct1.scrutari.net/sct/coredem/export/data-lexicommon.xml) qui ne propose qu'un seul corpus avec comme seul champ de texte le titre. Des sources comme socioeco (https://sct1.scrutari.net/sct/coredem/export/data-socioeco.xml) (site Socioeco.org ou citego (https://sct1.scrutari.net/sct/coredem/export/data-citego.xml) (site Citégo) font être beaucoup plus complètes (plusieurs Mio chacune).

Autre exemple plus complet, l'export d'Autour du 1er mai qui comprend de nombreux champs complémentaires et d'attributs, notamment dans les fiches films avec le texte complet d'une fiche : https://sct1.scrutari.net/sct/premiermai/export/data-premiermai.xml

scrutaridata/exemples.1696330131.txt.gz · Dernière modification: 2023/10/03 12:48 par vincent
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0