Table des matières

Data, analyse et visualisation

(page créée le 29 avril 2022) Outils code, logiciel, web pour manipuler, traiter, analyser, visualiser des données

Formats

Texte / Flat files

CSV (Comma Separated Value) :

JSON (JavaScript Object Notation) :

Bases de données

(…)

Notebook

Observable

Observable est un carnet de notes augmenté, qui permet de créer des documents interactifs pour représenter des analyses de données interactives. Sur un même document web, on peut assembler : du code javascript, des images, du texte en markdown, du HTML, etc. Mais aussi de téléversser des fichiers de données de différents formats (CSV, XLSX), de se relier à des fichiers du cloud, des API ou des bases de données.

Plusieurs bibliothèques de code javascript sont accessibles directement : d3, plot, survey, p5.js

C'est aussi une communauté et un document public peut-être forké pour en créer un nouveau que l'on peut modifier, plusieurs templates sont aussi fournis pour démarrer de nouveaux documents.

Les exemples sont nombreux :

Doc : https://observablehq.com/@observablehq/documentation

Plot :

Survey :

p5.js :

Utiliser SQL (on peut transformer un doc JSON ou CSV en base de données et l'interroger grâce à DuckDB)

Diagrammes de Venn

Upset Plots, représentation d'intersections d'ensemble multiples

Wordcloud

Une sorte de Best of 2021 : https://observablehq.com/@tomlarkworthy/notebooks2021

Autres services en ligne

rawgraphs.io application en ligne avec de nombreux types de visualisation : https://app.rawgraphs.io/

upset.js création d'upset plots, intersections d'ensembles multiples : https://upset.js.org/app/

Ligne de commande

csvkit
Ensemble d'outils en ligne de commande pour manipuler des fichiers CSV

qsv : https://github.com/jqnatividad/qsv

xsv : https://github.com/BurntSushi/xsv

Par type de représentation

Représentations de graphes

Diagramme de Venn
Utile pour représenter le croisement de 2 ou 3 ensembles

Upset Plots \ Utile pour représenter les croisements d'ensembles multiples

Par exemple pour utiliser https://upset.js.org/app/ on formatera les données comme ceci :

id;reponse1;reponse2;reponse3
1;0;0;1
2;1;0;1
3;0;1;0

id      reponse1      reponse2       reponse3
1          0             0              1
2          1             0              1
3          0             1              0

Nuage de mots / wordcloud
Utile pour représenter des réponses libres à une question

Code

Python

agate
Bibliothèque python pour l'analyse

Javascript

d3js

vega

vega-lite

Logiciels

(…)