Data, analyse et visualisation
(page créée le 29 avril 2022) Outils code, logiciel, web pour manipuler, traiter, analyser, visualiser des données
Formats
Texte / Flat files
CSV (Comma Separated Value) :
JSON (JavaScript Object Notation) :
Bases de données
(…)
Notebook
Observable
Observable est un carnet de notes augmenté, qui permet de créer des documents interactifs pour représenter des analyses de données interactives. Sur un même document web, on peut assembler : du code javascript, des images, du texte en markdown, du HTML, etc. Mais aussi de téléversser des fichiers de données de différents formats (CSV, XLSX), de se relier à des fichiers du cloud, des API ou des bases de données.
Plusieurs bibliothèques de code javascript sont accessibles directement : d3, plot, survey, p5.js
C'est aussi une communauté et un document public peut-être forké pour en créer un nouveau que l'on peut modifier, plusieurs templates sont aussi fournis pour démarrer de nouveaux documents.
Les exemples sont nombreux :
Doc : https://observablehq.com/@observablehq/documentation
Plot :
Survey :
p5.js :
- https://observablehq.com/@irenedelatorre/canvas-p5-js-and-circle-packing-collision-and-cluster-force exemple complet avec variables externes
Utiliser SQL (on peut transformer un doc JSON ou CSV en base de données et l'interroger grâce à DuckDB)
Diagrammes de Venn
Upset Plots, représentation d'intersections d'ensemble multiples
Wordcloud
Une sorte de Best of 2021 : https://observablehq.com/@tomlarkworthy/notebooks2021
Autres services en ligne
rawgraphs.io application en ligne avec de nombreux types de visualisation : https://app.rawgraphs.io/
upset.js création d'upset plots, intersections d'ensembles multiples : https://upset.js.org/app/
Ligne de commande
csvkit
Ensemble d'outils en ligne de commande pour manipuler des fichiers CSV
Par type de représentation
Représentations de graphes
- graphviz : https://graphviz.org/docs/layouts/
- viz.js, packages javascript pour graphviz : https://github.com/mdaines/viz-js
- éditeur en ligne https://viz-js.com/
Diagramme de Venn
Utile pour représenter le croisement de 2 ou 3 ensembles
- Voir ci-dessus pour ObservableHQ
Upset Plots \ Utile pour représenter les croisements d'ensembles multiples
- https://github.com/upsetjs/upsetjs, création en ligne interactive : https://upset.js.org/app/
- en ligne : https://upset.app/ (formatage des données : https://upset.app/advanced/#tabular)
Par exemple pour utiliser https://upset.js.org/app/ on formatera les données comme ceci :
id;reponse1;reponse2;reponse3 1;0;0;1 2;1;0;1 3;0;1;0 id reponse1 reponse2 reponse3 1 0 0 1 2 1 0 1 3 0 1 0
Nuage de mots / wordcloud
Utile pour représenter des réponses libres à une question
Code
Python
agate
Bibliothèque python pour l'analyse
Javascript
d3js
vega
vega-lite
Logiciels
(…)