Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
scrutaridata:exportapi:python [2015/03/17 22:07]
vincent créée
scrutaridata:exportapi:python [2023/10/03 12:55] (Version actuelle)
vincent
Ligne 1: Ligne 1:
 ====== Implémentation de l'API en Python ====== ====== Implémentation de l'API en Python ======
  
-L'​implémentation de l'API se présente sous la forme d'un fichier unique qui comprend les différentes classes de l'API ainsi que des classes utilitaires. ​Ce fichier est disponible à cette adresse : http://python.scrutari.net/​scrutaridataexport.py+L'​implémentation de l'API se présente sous la forme d'un fichier unique qui comprend les différentes classes de l'API ainsi que des classes utilitaires. ​La dernière version stable de ce fichier est disponible à cette adresse : http://dataexport.scrutari.net/​impl/​python/​scrutaridataexport.txt (remplacez .txt par .py pour l'​exécution) 
 + 
 +Cette implémentation est notamment utilisée dans des scripts qui génèrent un fichier au format ScrutariData à partir des pages Web elles-mêmes. Cette solution est adoptée lorsque les responsables du site n'ont pas les capacités financières ou techniques de « scrutariser » leurs données directement à partir de leurs données brutes. D'une certaine manière, ces scripts fonctionnent comme les robots des moteurs de recherche avec un travail fin de filtre pour ne conserver que les données utiles. C'est l'​exemple du RECMA (http://​dataexport.scrutari.net/​impl/​python/​recma.txt). Ces scripts doivent beaucoup au module BeautifulSoup (http://​www.crummy.com/​software/​BeautifulSoup/​) qui permet de circuler facilement dans le code HTML d'une page. 
 + 
 +Ces scripts sont accessibles avec Git via https://​framagit.org/​Scrutari/​export-python
  
-Cette implémentation est notamment utilisée dans des scripts qui génèrent un fichier au format ScrutariData à partir des pages Web elles-mêmes. Cette solution est adoptée lorsque les responsables du site n'ont pas les capacités financières ou techniques de « scrutariser » leurs données directement à partir de leurs données brutes. D'une certaine manière, ces scripts fonctionnent comme les robots des moteurs de recherche avec un travail fin de filtre pour ne conserver que les données utiles. 
  
-Deux scripts sont disponibles sur http://​python.scrutari.net/​ : le script de récupération du site http://​www.recma.org et celui du site http://​www.ijccr.net/​. Outre les modules de base de python, ces scripts doivent beaucoup au module BeautifulSoup (http://​www.crummy.com/​software/​BeautifulSoup/​) qui permet de circuler facilement dans le code HTML d'une page. 
scrutaridata/exportapi/python.1426626430.txt.gz · Dernière modification: 2015/03/17 22:07 par vincent
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0