Ceci est une ancienne révision du document !


Implémentation de l'API en Python

L'implémentation de l'API se présente sous la forme d'un fichier unique qui comprend les différentes classes de l'API ainsi que des classes utilitaires. Ce fichier est disponible à cette adresse : http://python.scrutari.net/scrutaridataexport.py

Cette implémentation est notamment utilisée dans des scripts qui génèrent un fichier au format ScrutariData à partir des pages Web elles-mêmes. Cette solution est adoptée lorsque les responsables du site n'ont pas les capacités financières ou techniques de « scrutariser » leurs données directement à partir de leurs données brutes. D'une certaine manière, ces scripts fonctionnent comme les robots des moteurs de recherche avec un travail fin de filtre pour ne conserver que les données utiles.

Deux scripts sont disponibles sur http://python.scrutari.net/ : le script de récupération du site http://www.recma.org et celui du site http://www.ijccr.net/. Outre les modules de base de python, ces scripts doivent beaucoup au module BeautifulSoup (http://www.crummy.com/software/BeautifulSoup/) qui permet de circuler facilement dans le code HTML d'une page.

scrutaridata/exportapi/python.1426626430.txt.gz · Dernière modification: 2015/03/17 22:07 par vincent
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0