Newsletter - Toulouse DataViz  #27
Newsletter - Toulouse DataViz  #27

Newsletter - Toulouse DataViz #27

Contenu
ChatGPT, cartes rétro, Knime, Ukraine, les dataviz qui ont changé le monde
Date
May 19, 2023

Le mot d'introduction

Que dit chatGPT sur Toulouse DataViz ?
À la demande “Toulouse dataviz ?”, la réponse est :
Toulouse DataViz est une organisation qui promeut l'analyse et la visualisation de données à travers divers événements et activités tels que des meetups, Hackaviz et des interventions dans les écoles et les entreprises. Ils ont également récemment construit un nouveau site Web qui sert de centre pour leurs activités. Si vous êtes intéressé à aider Toulouse DataViz, ils sont toujours à la recherche de bénévoles pour rejoindre leur équipe de personnes passionnées. Vous n'avez pas besoin d'être un expert en dataviz ou d'avoir beaucoup de temps libre pour contribuer. Toute aide est appréciée, que ce soit l'organisation d'événements, la recherche, la rédaction d'articles ou la création de visualisations. Toulouse DataViz est une petite organisation dynamique qui accueille tous les projets et initiatives de visualisation de données. Si vous êtes intéressé à rejoindre leur équipe, vous pouvez les contacter via leur site web ou leur adresse e-mail.
Une réponse pertinente, bien rédigée et sans fautes d’orthographe en quelques secondes ! On est partagé entre fascination et effroi ! Plus surprenant encore est la suggestion de l’IA à nous rejoindre alors que nous sommes sur le point de vous faire une nouvelle proposition de nous rejoindre à une journée “portes ouvertes” lors d’une prochaine réunion hebdomadaire de l’équipe. Des exemples glanés ici et là sur l’Internet montrent que l’IA est aussi en mesure d’écrire des programmes informatiques capables de réaliser des dataviz.
Un sujet sur lequel nous reviendrons…

Sylvia Romanelli : Beau ou clair, faut-il choisir ?

Mercredi 24 mai à 19h à l'étincelle Carmes

Beau ou clair, faut-il choisir ?

En visualisation de données, l’esthétique est parfois vue comme quelque chose de superflu. Réduite à un rôle secondaire de décoration, elle pourrait même – certains le craignent - mettre à mal la lisibilité et la justesse de l’information communiquée. Mais si la recherche de la beauté n’était qu’un objectif parmi tant d’autres dans l’inévitable suite de choix et de compromis nécessaires à la conception d’une dataviz ? Comment conjuguer beauté et efficacité, esthétique et clarté ? Des conseils inspirés du UX/UI design et du design graphique peuvent fournir quelques clés. À bien y regarder, esthétique et clarté sont liées : elles doivent être pensées ensemble, dans l’équilibre plus général des objectifs de chaque projet de dataviz.
Silvia Romanelli est consultante en visualisation de données auprès de la société The Information Lab, pour laquelle elle conçoit et développe des dashboards sous Tableau software, et forme et accompagne les clients dans leurs projets dataviz. Elle réalise également des projets créatifs de visualisation, et elle écrit et intervient comme speaker sur les interactions entre dataviz et UX design.
S'inscrire ici
 
 
 
notion image

Donnez un look rétro à vos dataviz !

Les variables visuelles : taille, valeur, grain, couleur, orientation, forme.
Jacques Bertin, Sémiologie graphique, 1967.
Les variables visuelles : taille, valeur, grain, couleur, orientation, forme. Jacques Bertin, Sémiologie graphique, 1967.
Dans la newsletter numéro 22, nous vous avions présenté la librairie bertin.js, qui permet de facilement construire des cartes selon les variables bertinesques bertiniennes ? Si, si, les six variables, vous vous en souvenez ?
Il manquait juste un petit grain à cette librairie. Que cela ne tienne, l’atelier de cartographie de Sciences Po a combiné la librairie motif.js, qui permet de créer des grains différents, sous forme de hachures dans vos SVG, avec la librairie susnommée.
 
Utile si cette variable manquait à vos dataviz, si vos cartouches d’encre couleur sont vides ou simplement donner un petit côté rétro.
 
Un graphe à résille.
Un graphe à résille.
Une carte de France tout en hachures
Une carte de France tout en hachures
Retrouvez des exemples dans ce cahier ObservableHQ.
 
 

KNIME : plateforme d’analyse de données et Dataviz

KNIME est un logiciel gratuit et open source multi-OS (Windows/Linux/macOS) qui permet de réaliser des analyses et des visualisations selon plusieurs niveaux de complexité. À travers un diagramme de flux de données, vous pouvez facilement lire, transformer, combiner, analyser et visualiser des données sans avoir besoin de compétences en programmation (no-code ou low-code).
Un des avantages significatifs de KNIME est son intégration transparente avec d'autres outils et technologies d'analyse des données, grâce à son architecture ouverte. KNIME permet d'incorporer une large gamme de sources de données, structurées et non structurées, des bases de données, des API et des services cloud.
KNIME propose une large gamme d'options de visualisation, garantissant aux utilisateurs la possibilité d'explorer et de comprendre leurs données sous différents angles : graphiques à barres, diagrammes de dispersion, cartes thermiques, diagrammes de réseau relationnels et visualisations géospatiales. De plus, ces capacités de visualisation peuvent être étendues par l'intégration de scripts en Java, JavaScript, R ou Python.
 
 
 
 
notion image
 
Évolutivité et performances : KNIME gère efficacement de grands ensembles de données en accélérèrent l'analyse de données et la visualisation avec du calcul distribué et des traitements parallèles.
Documentation et assistance : le site web de KNIME propose des guides, des aide-mémoires (cheatsheets), des tutoriels vidéo, des ouvrages de référence et un forum dynamique. Les solutions implémentées peuvent être déposées dans un HUB communautaire ou toutes les solutions sont partagées en libre accès.
 

PLC 31 Retour sur les interventions

 
notion image
 
 
Depuis maintenant trois ans, l’association TDV intervient dans les collèges dans le cadre du Parcours Laïque et Citoyen du conseil départementale (PLC31). Cette année, nous avons réalisé 5 interventions dans 3 collèges (Toulouse et l’Union) et rencontré environ 130 collégiens. Nos interventions consistent à présenter la datavisualisation, à montrer comment sa mise en œuvre peut être trompeuse et à développer l’esprit critique des collégiens.
C’est une prestation de trois heures où alternent explications théoriques, échanges et réalisation pratiques.
Parfois déconcertés par les bâtons et les camemberts, les élèves comprennent vite les enjeux de la datavisualisation dans la communication des informations contenues dans les données. Nous intervenons toujours avec beaucoup de plaisir, les retours des élèves et des enseignants sont très positifs et riches en remarques qui nous sont très utiles pour améliorer nos messages. Le Conseil Départemental 31 nous a renouvelé sa confiance pour l’année 2023-2024. Vous pouvez aussi comme les collégiens vous prêter à l’exercice de la réalisation d’une carte en quelques clics…

ChatGPT pour la Dataviz

Le premier usage de ChatGPT pour la dataviz est l’accès aux données ouvertes et leur formatage. Le texte en gras est le prompt soumis à ChatGPT.
Donne-moi les chiffres du chômage en France entre 2010 et 2020
  • 2010 : 9,2%
  • 2011 : 9,0%
  • 2012 : 9,3%
  • 2013 : 10,3%
  • 2014 : 10,4%
  • 2015 : 10,4%
  • 2016 : 9,7%
  • 2017 : 9,4%
  • 2018 : 9,1%
  • 2019 : 8,5%
  • 2020 : 8,0%
Formate les en CSV avec séparateur ;
Année;Taux de chômage (%) 2010;9,2 2011;9,0 2012;9,3 2013;10,3 2014;10,4 2015;10,4 2016;9,7 2017;9,4 2018;9,1 2019;8,5 2020;8,0
Notez que dans ce format, les chiffres sont séparés par des points-virgules (;) et que le séparateur décimal est une virgule (,).
 
Montre les moi sous forme de diagramme en ligne
notion image
Ce n’est pas terrible ! Mais, ChatGPT peut également produire des programmes permettant de créer des visualisations de ces données.
 
 
Écris le code JavaScript qui utilise la bibliothèque Plot d'Observable
Après quelques corrections faites à la main, voici le programme obtenu et son exécution.
// Données const data = [ {annee: 2010, taux_chomage: 9.5}, {annee: 2011, taux_chomage: 9.2}, {annee: 2012, taux_chomage: 9.7}, {annee: 2013, taux_chomage: 10.3}, {annee: 2014, taux_chomage: 10.5}, {annee: 2015, taux_chomage: 10.4}, {annee: 2016, taux_chomage: 9.7}, {annee: 2017, taux_chomage: 9.2}, {annee: 2018, taux_chomage: 8.5}, {annee: 2019, taux_chomage: 8.1}, {annee: 2020, taux_chomage: 8.0} ];
notion image
 
 
 
// Graphique Plot.plot({ width: 600, height: 400, x: { grid: true, label: "Année", tickFormat: ".0f" }, y: { grid: true, label: "Taux de chômage (%)", tickFormat: ".1f" }, marks: [ Plot.line(data, { x: "annee", y: "taux_chomage", stroke: "black", strokeWidth: 2 }), Plot.point(data, { x: "annee", y: "taux_chomage", fill: "black", size: 64 }) ] });
ChatGPT peut être étendu à l’aide de greffons (plugins), voici deux exemples en dataviz.

Une dataviz de la guerre en Ukraine

Après un an de conflit entre l’Ukraine et la Russie, plusieurs médias ont partagé des datavisualisations pour nous communiquer l’étendue de cette guerre.
Par exemple, pour représenter l’ampleur de l’aide militaire fournie par les pays occidentaux à l’armée ukrainienne, le “Courrier international” fait un choix différent de celui d“Information is beautiful”. À vous de choisir quelle perspective vous semble être la plus honnête :
“Courrier international” choisit de montrer le rapport entre les aides publiques données à l’Ukraine proportionnellement aux PIB des états donateurs. Par conséquent, l’Estonie occupe la première place. Les USA, en revanche, sont classés 7ᵉ. Source : lien
Courrier international” choisit de montrer le rapport entre les aides publiques données à l’Ukraine proportionnellement aux PIB des états donateurs. Par conséquent, l’Estonie occupe la première place. Les USA, en revanche, sont classés 7ᵉ. Source : lien
“Information is beautiful”  représente le montant de l’aide militaire fournie en valeur absolue. On voit que les USA est largement le premier pays donateur avec 46 milliards de dollars. L’Estonie n’apparait pas dans ce classement.  Source : lien
“Information is beautiful” représente le montant de l’aide militaire fournie en valeur absolue. On voit que les USA est largement le premier pays donateur avec 46 milliards de dollars. L’Estonie n’apparait pas dans ce classement. Source : lien
Une autre dataviz du “Courrier international” laisse perplexe : elle a le mérite de représenter parfaitement les couleurs du drapeau ukrainien, mais elle propose un diagramme en Sunburst critiquable, car difficilement lisible.
Diagramme sunburst publié par le courrier international. Peu compréhensible. Source : lien
Diagramme sunburst publié par le courrier international. Peu compréhensible. Source : lien
 

Quelles sont les dataviz qui ont changé le monde ?

Voici une question très ambitieuse posée par les journalistes du BBC. Convaincus que la datavisualisation nous aide à comprendre le monde et à le changer, ils essaient de répondre à la question dans cette excellente vidéo.
Dans la vidéo, on cite les 5 data visualisations suivantes :
1. Une carte démontrant une corrélation entre les malades du choléra et la présence d’eau polluée à Londres en 1854. - Un diagnostic pertinent de la situation.
 
notion image
2. Le diagramme de Nightingale, publié en 1858, expliquant précisément les différentes causes de mortalités des soldats anglais. - Cela a fortement à augmenter les fonds dédiés aux soins hospitaliers des militaires.
notion image
3. Une série de dataviz publiée en 1900 sur l’intégration économique et sociale de la population noire américaine dans la société américaine, 35 ans après l’abolition de l’esclavage. - Une prise de conscience de l’écart encore existant.
Les métiers des Afro-Américains en haut et des Caucasiens en Géorgie. En jaune, les postes de domestiques et de services à la personne.
Les métiers des Afro-Américains en haut et des Caucasiens en Géorgie. En jaune, les postes de domestiques et de services à la personne.
4. Un graphique simple représentant un arbre familial. - Un effet dévastateur qui a nourri les théories eugénistes.
L’arbre généalogique de la famille Kallikak, publié en 1912, qui prétend expliquer que l’état de Déborah Kalillkak est lié à une union “immorale” il y a quatre générations.
L’arbre généalogique de la famille Kallikak, publié en 1912, qui prétend expliquer que l’état de Déborah Kalillkak est lié à une union “immorale” il y a quatre générations.
5. La fameuse et moderne dataviz appelée Warming stripes. Elle nous explique le réchauffement global de la planète et nous incite à agir en conséquence.
 
La fameuse dataviz warning stripes sur des objects populaires ou de la vie du quotidien.
La fameuse dataviz warning stripes sur des objects populaires ou de la vie du quotidien.
 

Livres, E-learning et MOOCs

 

Comment dessiner un diagramme Minard-Sankey en 1939 ?

Avec une paire de ciseaux et du papier ! En déplaçant ensuite soigneusement les bandes de papier pour former le flux. C’est une des techniques illustrées dans l’excellent livre, Graphic presentation, publiée en 1939. L’auteur, William C. Brinton, ingénieur américain et pionnier de la visualisation de l’information, a aussi publié en 1914, un manuel sur les méthodes graphiques intitulé “Graphic methods for presenting facts”.
Ce livre regorge de pépites, comme ce diagramme Minard-Sankey fait à la main, ou bien ce diagramme en ligne double qui illustre l’évolution du mode de transport de marchandises.
Retrouvez les magnifiques illustrations de ce livre gratuitement sur cette adresse.
Ébauche d’un diagramme de flux réalisé à la main et son résultat imprimé, montrant la distribution entre les ventes et les revenus. Source : lien
Ébauche d’un diagramme de flux réalisé à la main et son résultat imprimé, montrant la distribution entre les ventes et les revenus. Source : lien
Un exemple de dataviz trouvé dans ‘louvrage de William C. Brinton. On y voit l’utilisation d’un dessin représentatif du mode de transport que l'on souhaite illustrer : original et pertinent. Source : lien
Un exemple de dataviz trouvé dans ‘louvrage de William C. Brinton. On y voit l’utilisation d’un dessin représentatif du mode de transport que l'on souhaite illustrer : original et pertinent. Source : lien
━━━━━━━━━━━━━━━━━━ Cette newsletter de Toulouse-dataviz a été rédigée avec l'outil Notion que nous aimons bien. Si vous lisez cette newsletter et que vous n'êtes pas encore inscrit au club, il vous suffit de cliquer ici. Pour se désinscrire, demandez ici. Toutes les anciennes newsletters sont consultables ici. Vous pouvez aussi rejoindre nos communautés : Club ou Discord. Merci à nos sponsors qui soutiennent nos activités.