dimanche, 26 décembre 2021 09:48

Fabriquer et autoriser l'exploitation un jeu de données avec Google Sheets

Écrit par
Évaluer cet élément
(0 Votes)

Dans cet article, je vous relate un test que j'ai fait ce 25 décembre sur la possibilité de mettre en place par des outils très simples fournis par le géant Google, de jeux de données diffusables.
Je ne vais pas jusqu'à qualifier ces jeux de données OpenSource, car je n'ai pas été jusqu'à lire les licences complètes de Google. Il est en effet fort possible qu'une fois les données saisies sur Google Sheets, ces dernières deviennent la propriété de Google. Je ferme cette parenthèse mais il faut avoir ceci en tête pour la suite de cet article

Quel est le but ?

Au travers de cet article, je souhaite simplement montrer comment il peut être super simple pour un néophyte en informatique, de mettre en place un jeu de données accessibles et réexploitables par d'autres sites web. Nous allons prendre comme fil rouge un jeu de données tout fait, pour ne pas avoir à resaisir les données, un jeu de données existante : la liste des "Morts pour la France" durant la deuxième guerre mondiale. Ce jeu de données étant en opendata, j'ai réintégré les données dans une feuille Google Sheet pour gagner du temps, mais j'aurais tres bien pu faire ma propre feuille Google Spreadsheet de l'ensemble des timbres de ma collection personnelle, l'ensemble des plats goutés à l'étranger,...

Petite parenthèse : l'import des données

Comme je viens de l'expliquer, j'utilise un extrait d'un jeu de données existant que vous pouvez retrouver sur l'OpenDataSoft https://public.opendatasoft.com/explore/dataset/morts-pour-la-france/export/?flg=fr
L'import ne sert juste, dans mon exemple, à ne pas avoir à resaisir des données, mais si vous utilisez cet article à des fins de construction de votre propre jeu de données, il vous faut créer un fichier Google Sheet vide et vous devez le remplir.
Mais nous sommes bien d'accord que la réutilisation de données dans cet exemple n'a pour but que de ne pas resaisir des données. J'obtiens, après import dans mon cas, ou  aprés création de votre jeu de données, un tableau de la sorte, avec vos colonnes à vous :

firefox VZ3htRuHws

 Voila, nous avons notre point de départ de ce tutoriel, un jeu de données. Je publierai ultérieurement un autre tutoriel pour fabriquer, toujours avec les outils de Google, un tutoriel expliquant comment fabriquer un formulaire de saisie permettant de saisir votre jeu de données, mais surtout de faire saisir par d'autres des données. 

Rendre accessible le jeu de données

Pour des raisons évidentes de sécurité, vos fichiers stockés dans Google Sheet/Google Drive ne sont accessibles qu'à vous seul. Or, notre but est bel est bien de rendre accessible le jeu de données à tous (attention, je parle bien du jeu de données, pas du fichier !). Pour ceci, il faut spécifier à Google que nous sommes d'accord pour le partage

 En retour, Google Spreadsheet vous retourne une URL d'accès au fichier.

URL acces

Notez que vous trouverez aussi ici, outre la possibilité de partager votre fichier avec les différents sharers proposés (GMail, Facebook et Twitter), un champs primordial pour ce tuto, celui placé juste au dessus des sharers. C'est ce lien que nous allons utiliser. Sélectionnez-le et copiez le dans votre presse papier ou dans un fichier texte de travail.

Sur cette copie d'écran, j'utilise le format de données CSV maisd'autres formats sont disponibles.comme le TSV, Les autres formats proposés ne permettent pas (facilement) une réexploitation des données comme nous voulons faire. Remarquez que le format choisi n'est en fait qu'un pramètre dans l'URL !

Maintenant, votre jeu de données est déjà prêt. Publiez le pour bien le rendre accessible ! Et partagez votre URL à celles et ceux qui le désirent. Un bémol dans cette méthode est que l'URL n'est pas personnalisable pour rendre partageable ou non le fichier.

Et si vous voulez vous assurer que ca marche, téléchargez mon fichier CSV  !

Désormais, vous pouvez utiliser Google form pour générer un formulaire de saisie

Lu 165 fois Dernière modification le vendredi, 31 décembre 2021 11:08