Approches quantitatives et modélisation mathématique en SHS
Cours dans le cadre du master Humanités Numériques et Computationnelles de PSL, piloté par l'ENC.
Menu, Agenda et Supports de cours (présentations / slides, articles, etc, et bibliographie) sont/seront diponibles sur cette page.
Dernière mise à jour de cette page le 31 janvier 2024 (slides de cours mises en ligne, date de la validation : 1er février).
Année universitaire
2023-2024
20h (10 séances de 2h + validation) à l'Ecole Nationale des Chartes
(ENC), 65 rue de Richelieu (Paris 2ème), salle informatique (3ème étage).
Les cours ont lieu le jeudi de
10 à 12h du 12 octobre 2023 au 18 janvier 2024.
Pour suivre le cours et recevoir les informations spécifiques sur le cours,
se déclarer ici
https://participations.ehess.fr/demandes/__nouvelle__
A la demande "choisissez votre séminaire" saisir UE704 (attention, sans espace entre UE et 704), et sélectionner le cours qui s'affiche.
Présentation
Le cours, pluri- et trans- disciplinaire, porte sur une palette d'approches quantitatives pour l'analyse et la modélisation mathématique de données. Chaque séance consistera en la présentation de travaux d'intérêt en sciences humaines et sociales, en cours ou ayant donné lieu à des publications scientifiques, et qui seront l'occasion d'introduire des notions et techniques d'analyse et de modélisation. Pour ce qui concerne les méthodes, il pourra s'agir d'analyse multi-variée, de méthodes économétriques, de modélisation multi-agent, de modélisation mathématique de dynamiques (dynamiques de populations...), de formalisations issues de la théorie des jeux...
Le programme est le suivant (liens vers les slides ajoutés dès que possible) :
12 octobre : Julien Randon-Furling (ENS Paris-Saclay, Centre Borelli) - Une analyse multi-échelle dans un travail en histoire contemporaine.
Voir le support visuel (slides) ici.
19 octobre : Jean-Pierre Nadal (CNRS & EHESS, CAMS & LPENS) - Modélisations épidémiologiques : modes des prénoms, diffusion d'innovations, épidémies, épidémies comportementales.
Supports visuels (slides) : partie 1, partie 2 (vague d'émeutes urbaines de 2005 en France)
26 octobre - Pas de cours
9 novembre : Floriana Gargiulo (CNRS, GEMASS) - Etudier les dynamiques de l’écosystème scientifique à travers les données des publications : le cas de l’IA.
Voir le support visuel (slides) ici.
16 novembre : Victor Chomel (Storyzy, et chercheur associé à l'ISC-PIF) - "Fake news" et manipulation de l’information : modéliser la propagation de fausses informations sur les réseaux sociaux.
23 novembre : Julie Gravier (EHESS, CAMS & CRH) - Évolution de la répartition spatiale de l'activité économique à Paris
Voir le support visuel (slides) ici.
30 novembre : pas de cours
7 décembre : pas de cours.
14 décembre : Sabine Ploux (CNRS, CAMS) - Analyse sémantique computationnelle des débats publics : objectifs et modèles (travaux sur l'analyse sémantique de cahiers citoyens tels ceux issus du Grand Débat National ayant fait suite au mouvement des gilets jaunes)
Voir le support visuel (slides) ici.
21 décembre : Robin Ryder (Université Paris-Dauphine, CEREMADE) - Statistique bayésienne pour la reconstruction de l’histoire des langues.
Voir le support visuel (slides) ici.
11 janvier :
Laetitia Gauvin (IRD, PRODIG) - Aborder la mobilité humaine à travers les traces numériques.
Voir le support visuel (slides) ici.
18 janvier - double séance :
Annick Vignes (INRAE & ENPC, CAMS) - Analyse de données youtube
Voir le support visuel (slides) ici.
Jean-Baptiste Camps (ENC) - Manuscrits perdus et extinction des œuvres écrites: Modéliser la
transmission des textes comme un processus de vie et de mort.
Voir le support visuel (slides) ici
1er février - Oraux de validation, 9h30-12h30.
Public visé
Ce cours est organisé
pour les étudiants de M2 du master Humanités numériques de PSL.
Il est également ouvert à tous, étudiants en master - notamment ceux de l'EHESS -, doctorants, post-doctorants, jeunes et moins jeunes chercheurs, de tous domaines des SHS.
Nous faisons confiance aux interactions entre participants et enseignants pour permettre l'adaptation du niveau du cours à celui des étudiants (priorité donnée aux étudiants validant le cours dans le cadre du master Humanités numériques de PSL ou d'un master de l'EHESS).
Prérequis
Il est préférable que les étudiants possèdent :
- des connaissances de base en statistiques (cf UE "Méthodes quantitatives et
modélisation mathématique" du M1)
- une
pratique minimale de la programmation, sous R ou Python, qui pourra être développée en cours de semestre (cf UE
"Algorithmie et programmation pour les humanités")
Des notions de base en analyse, algèbre linéaire et probabilités aideront, mais toutes les notions utiles seront introduites/expliquées lorsque nécessaire.
Validation
La
validation de l'UE demande une présence régulière au cours (avec justification des absences), et une présentation orale selon les modalités suivantes. Les étudiants
devront présenter un projet s'appuyant sur des données, de préférence le projet principal sur lequel ils
s'investissent dans le cadre de leur master. L'idée est de voir comment ce qui a été discuté en cours est utilisable (ou pas) pour leur projet personnel, et d'avoir plus globalement un échange sur leur projet pour ce qui concerne l'analyse quantitative qu'ils entendent mener. Les étudiants devront faire une présentation répondant aux points suivants.
1) Dire pourquoi ils ont suivi ce cours, ce qu'ils en attendaient.
2) Expliciter leur question de recherche (avec un minimum de contexte problématisé).
3) Présenter la nature de leurs données : données structurées, déstructurées ; numériques, textuelles ; taille de l'échantillon ; sources, techniques de récupération mobilisées (scrapping, archives océrisées, enquêtes,.. etc. ).
4) Dire ce qu'ils veulent montrer à partir d'une analyse quantitative de ces données, quels sont les résultats attendus.
5) Dire quelles techniques, et éventuellement quels logiciels, pourraient selon eux être mobilisées dans le cadre de leur projet (expliciter : pourquoi, comment).
6) Autant que possible, présenter une première application sur leurs données d'au moins une approche quantitative.
7) Dire quelles techniques évoquées dans le cours, ou quelles démarches de modélisation, leur paraissent potentiellement pertinentes pour traiter des questions qu'ils se posent (et justifier).
Les étudiants devront fournir des 'slides' (fichier au format pdf), exposant tous les points ci-dessus. La présentation orale durera 10mn et sera suivie d'une séance de questions de 10mn également.
Organisation
Jean-Pierre Nadal, CNRS & EHESS, CAMS &
LPENS
Julien Randon-Furling, Ecole normale supérieure Paris-Saclay, Centre Borelli
Annick Vignes, INRAE & ENPC, CAMS
Pour toute question : jpnadal "AT" ehess.fr
Remarques :
Le suivi de seulement
quelques séances isolées est fortement déconseillé.
Une fois notre accord obtenu pour le suivi du cours,
il faut s'inscrire auprès du secrétariat du master.
Attention, des droits d'inscriptions sont
susceptibles d'être demandés pour l'inscription
d'étudiants ou chercheurs ne dépendant pas d'un
établissement de PSL (voir avec le secrétariat du
master).
La validation du cours (3 ECTS)
comme UE isolée (étudiants non inscrits au master
Humanités numériques) est possible pour les étudiants
inscrits dans tout établissement s'ils ont l'accord de leur formation pour suivre et valider ce cours.
Par
ailleurs, nous encourageons les étudiants externes au master à
explorer l'ensemble de l'offre du master Humanités numériques
(ici,
onglets Scolarité et Calendrier), afin de sélectionner
le(s) cours le(s) plus approprié(s) à leurs besoins.