Différences

Ci-dessous, les différences entre deux révisions de la page.

--- scrutaridata:exportapi:python [2015/03/17 22:07]
vincent créée
+++ scrutaridata:exportapi:python [2023/10/03 12:55] (Version actuelle)
vincent
@@ Ligne 1: / Ligne 1: @@
 ====== Implémentation de l'API en Python ======
-L'implémentation de l'API se présente sous la forme d'un fichier unique qui comprend les différentes classes de l'API ainsi que des classes utilitaires. Ce fichier est disponible à cette adresse : http://python.scrutari.net/scrutaridataexport.py
+L'implémentation de l'API se présente sous la forme d'un fichier unique qui comprend les différentes classes de l'API ainsi que des classes utilitaires. La dernière version stable de ce fichier est disponible à cette adresse : http://dataexport.scrutari.net/impl/python/scrutaridataexport.txt (remplacez .txt par .py pour l'exécution)
+Cette implémentation est notamment utilisée dans des scripts qui génèrent un fichier au format ScrutariData à partir des pages Web elles-mêmes. Cette solution est adoptée lorsque les responsables du site n'ont pas les capacités financières ou techniques de « scrutariser » leurs données directement à partir de leurs données brutes. D'une certaine manière, ces scripts fonctionnent comme les robots des moteurs de recherche avec un travail fin de filtre pour ne conserver que les données utiles. C'est l'exemple du RECMA (http://dataexport.scrutari.net/impl/python/recma.txt). Ces scripts doivent beaucoup au module BeautifulSoup (http://www.crummy.com/software/BeautifulSoup/) qui permet de circuler facilement dans le code HTML d'une page.
+Ces scripts sont accessibles avec Git via https://framagit.org/Scrutari/export-python
-Cette implémentation est notamment utilisée dans des scripts qui génèrent un fichier au format ScrutariData à partir des pages Web elles-mêmes. Cette solution est adoptée lorsque les responsables du site n'ont pas les capacités financières ou techniques de « scrutariser » leurs données directement à partir de leurs données brutes. D'une certaine manière, ces scripts fonctionnent comme les robots des moteurs de recherche avec un travail fin de filtre pour ne conserver que les données utiles.
-Deux scripts sont disponibles sur http://python.scrutari.net/ : le script de récupération du site http://www.recma.org et celui du site http://www.ijccr.net/. Outre les modules de base de python, ces scripts doivent beaucoup au module BeautifulSoup (http://www.crummy.com/software/BeautifulSoup/) qui permet de circuler facilement dans le code HTML d'une page.