Le mot d'introduction
Citius, bellus, fortius â Communiter.
- Plus vite : DuckDB vous permet de travailler avec de grosses bases de donnĂ©es Ă une vitesse qui dĂ©passe lâentendement. AlliĂ© Ă Observable Framework, gĂ©nĂ©rez des visualisations sur le web sans les lenteurs du cloud, dans le confort dâun environnement de dĂ©veloppement local.
- Plus beau : un de nos membres, parti au Pays du Levant, nous raconte avec émotion sa visite sur le site de décontamination de Fukushima : comment une représentation physique peut rendre une visualisation plus marquante.
- Plus fort : Notre guide de la dataviz a gagnĂ© six nouvelles rubriques, parcourez-le, il pourrait peut-ĂȘtre vous donner de prĂ©cieux conseils pour lâĂ©dition 2024 de lâHackaviz. Toute lâĂ©quipe Toulouse DataViz travaille dâarrache-pied Ă sa prĂ©paration.
LâHackaviz 2024 commence dans quelques jours, nâhĂ©sitez pas Ă vous inscrire.
Lâimportant, câest de participer.
Â
HACKAVIZ 2024
Racontez une histoire avec des graphiques, Ă partir dâun jeu de donnĂ©es inĂ©dit, seul ou en Ă©quipe. Ă partir du moment oĂč les donnĂ©es sont mises Ă disposition, les candidats ont 10 jours pour rendre leur crĂ©ation.
- Date de mise à disposition des données : vendredi 8 mars 2024
- Date limite de remise des contributions : lundi 18 mars 2024
- Hackaviz Party - Présentation des réalisations et remise des prix : jeudi 4 avril 2024
Informations ici
Â
Guide de la dataviz
AprĂšs une premiĂšre Ă©dition en juin 2023, notre guide interactif de la datavisualisation sâest enrichi de six nouvelles rubriques.
Notre guide couvre désormais :
- Tables
- Diagrammes sectoriels
- Diagrammes Ă barres
- Diagrammes Ă lignes
- Diagrammes de réseaux
- Diagrammes de dispersion
- Cartes de carrés
- Carte de chaleur
- Boites Ă moustaches
- Cartes
- Couleurs
Nous continuerons Ă lâenrichir dans les prochains mois.
NâhĂ©sitez pas Ă nous faire des retours soit via Discord ou via contact@toulouse-dataviz.fr
A la découverte de DuckDB
Lors de notre dernier meetup, nous avons eu le plaisir de plonger dans l'univers de DuckDB grĂące Ă la prĂ©sentation Ă©clairante d'Eric MauviĂšre (le lien du replay). DuckDB permet dâexploiter facilement des donnĂ©es ouvertes de maniĂšre performante.
Â
Â
L'intervention d'Eric nous a poussĂ© Ă expĂ©rimenter rapidement les capacitĂ©s de DuckDB Ă partir de ses dĂ©monstrations. Je voulais identifier la liste des restaurants autour de chez moi. Jâai utilisĂ© le fichier SIREN des entreprises avec leur gĂ©olocalisation. Ce fichier de 1 Go et 15 millions de lignes, disponible sur le site data.gouv.fr, peut ĂȘtre interrogĂ© rapidement grĂące Ă DuckDB : seules les donnĂ©es filtrĂ©es par ma requĂȘte ont Ă©tĂ© rĂ©cupĂ©rĂ©es sur mon ordinateur. Ceci nâest toutefois possible quâavec des donnĂ©es stockĂ©es au format â.parquetâ, vous ne vous Ă©tonnerez donc pas de voir de plus en plus de fichiers open data proposĂ©s dans ce format.
DuckDB se distingue par des avantages notables :
- FlexibilitĂ© et performance : DuckDB est capable de traiter une requĂȘte sur un fichier distant de 1Go en quelques secondes seulement. De plus, il est possible dâexplorer les donnĂ©es sans les tĂ©lĂ©charger intĂ©gralement, ce qui permet dâaccĂ©lĂ©rer le processus dâanalyse en limitant lâutilisation dâoutils gourmands en espace et en ressources.
- CompatibilitĂ© Ă©tendue : Que ce soit en termes de format de donnĂ©es (JSON, Parquet, CSV, Polars, Arrow, etc.) ou de langage de programmation (Python, R, JavaScriptâŠ) ou dâoutils (Quarto).
- FacilitĂ© dâutilisation : Facile Ă installer : Ă lâinstar de SQLite, DuckDB est un simple exĂ©cutable, il nâest pas nĂ©cessaire dâinstaller un couple client/serveur. Facile Ă utiliser : les requĂȘtes s'appuient sur le bon vieux langage SQL.
Une technologie Ă explorer sans attendre !
Observable 2.0
Â
Â
Cette annonce sâest accompagnĂ©e dâun changement dans la tarification. Pour faire court :
- ObservableHQ devient gratuit jusquâĂ un maximum 5 utilisateurs qui collaborent et pour 1 projet hĂ©bergĂ© (hĂ©bergement supplĂ©mentaire Ă faire soi mĂȘme)
- 300 $ pour 10 utilisateurs, hébergement illimité
Cela est trÚs éloigné du précédent modÚle de prix, qui était beaucoup plus onéreux pour les petites équipes : bonne ou inquiétante nouvelle ?
Â
Observable Framework ou Observable 2.0 vient de sortir sur GitHub. Gratuit et Open Source, câest un environnement confortable pour crĂ©er des tableaux de bord ou des rapports en Markdown, SQL, Python, R ou JavaScript.
Pour rappel, les bloc-notes ObservableHQ permettent de concevoir rapidement, de maniĂšre collaborative, une visualisation directement sur le site web ObservableHQ. Observable Framework se place en aval, lĂ oĂč la visualisation sous forme de bloc-note laisserait sa place Ă une application plus complĂšte utilisant cette visualisation.
Le dĂ©veloppement ne se fait plus alors sur le cloud dâObservableHQ, mais dans votre propre environnement de dĂ©veloppement web local. Tout lâĂ©cosystĂšme ObservableHQ est lĂ (Plot) ainsi que des librairies tierces : DuckDB, Arrow, Arquero, Vega Lite, Graphviz, Leaflet et Mermaid. Cerise sur le gĂąteau, le site web gĂ©nĂ©rĂ© est statique, ce qui permet de lâhĂ©berger simplement et Ă moindre coĂ»t, par exemple sur Github Pages.
Observable Framework sâadresse donc avant tout aux dĂ©veloppeurs : il faut utiliser le terminal et la ligne de commandes, mais rien de vraiment compliquĂ©. Le guide de dĂ©marrage explique pas Ă pas les Ă©tapes Ă suivre. Ă recommander pour ceux qui voudraient proposer une visualisation sur le web sans se tracasser avec des librairies comme Nextjs, Gatsby ou React.
Â
Le billet du Japon: @Fukushima et ses données
Le nom de Fukushima restera, pour toujours, associé à cette terrible catastrophe survenue dans les jours qui ont suivi le terrible tremblement de terre de magnitude 9.0, le 11 mars 2011. La ville de Fukushima, qui donne le nom à la province environnante, est assez éloignée (80 km) de la centrale atomique de Daiichi, située, elle, au bord de la mer, à 200 km au nord de Tokyo.
Depuis, un incroyable travail de dĂ©contamination - les Japonais parlent de âreconstructionâ - est en cours. Jâai pu participer Ă une visite et me suis rendu compte sur place de lâimportance de la reprĂ©sentation physique de donnĂ©es (data physicalization).
Â
Comment mieux comprendre des données en les rendant tangibles ?
En voici un exemple avec la reprĂ©sentation des niveaux de radioactivitĂ© avant, pendant et aprĂšs lâaccident nuclĂ©aire. Si lâunitĂ© de mesure de la radioactivitĂ© est le becquerel (Bq), le micro sievert par heure (”Sv/h) mesure lâimpact du rayonnement sur le vivant. Rien de plus abstrait Ă reprĂ©senter. Lâexercice de physicalisation sous forme de billes, que lâon assimile facilement Ă des atomes, est ici parfaitement rĂ©alisĂ©. On visualise bien la diffĂ©rence entre 2.74 ”Sv/h (2011) et 0.12 ”Sv/h (2021). Â
Â
La data physicalisation ne marche pas Ă tous les coups !
Moins prĂ©cise, une carte tente de reprĂ©senter le nombre de personnes Ă©vacuĂ©es (en vert) et leur destination (en bleu). Le nombre de personnes est reprĂ©sentĂ© sous forme de figurine en trois dimensions. On se rend compte de lâexode massif quâa connu Fukushima et de lâaccueil assez bien rĂ©parti sur le territoire. Toutefois, la 3D ici ne permet pas de visualiser facilement la diffĂ©rence entre 102 827 Ă©vacuĂ©s de Fukushima et 26 081 accueils dans la rĂ©gion de Tokyo.
Â
Marquer les esprits avec la représentation physique de données
Â
Ce qui mâa le plus frappĂ©, ce sont ces sacs de gravats. Ils sont remplis inlassablement dâun mĂštre cube de terre faiblement contaminĂ©e (0.04”Sv/h) et sont entreposĂ©s provisoirement dans une zone immense - appelĂ©e pudiquement «difficult-to-return zone». Zone que plus personne ne peut habiter â et que nous avons visitĂ©e.  Si la question de lâĂ©limination de cette terre par dilution dans tout le pays reste un sujet politique sensible au Japon (voir ici), la vision de ces champs recouverts de tous ces sacs mâa particuliĂšrement frappĂ©e.
Â
Moi qui ai manipulĂ© des donnĂ©es toute ma vie, je venais de comprendre la signification de âmillions de mÂłâ. La reprĂ©sentation des grandeurs avec un nombre a ses limites : il faut parfois voir les objets, tels ces sacs dĂ©versĂ©s jour aprĂšs jour, pour se rendre compte de la taille et de lâimpact du fardeau laissĂ© pour les gĂ©nĂ©rations Ă venir.
Â
Fin 2023, il y avait environ 9 millions de sacs et les camions ne cessent dâen acheminer.
ăŸăă !!
Â
Â
ââââââââââââââââââ
Cette newsletter de Toulouse-dataviz a Ă©tĂ© rĂ©digĂ©e avec l'outil Notion que nous aimons bien. Si vous lisez cette newsletter et que vous n'ĂȘtes pas encore inscrit au club, il vous suffit de cliquer ici. Pour se dĂ©sinscrire, demandez ici. Toutes les anciennes newsletters sont consultables ici. Vous pouvez aussi rejoindre nos communautĂ©s : Club ou Discord.
Merci à nos sponsors Clever Age, Vector, Pierre Fabre, Etincelle et perceptible qui soutiennent nos activités.
Â