Information détaillée concernant le cours

[ Retour ]
Titre

Python pour les SHS - Application (NLP & LLM)

Dates

13 mars (9h30-12h30) et 20 mars (9h30-12h30)

Organisateur(s)/trice(s)

Dr Emilien Schultz, CREST Dr Léo Mignot, Sciences Po Bordeaux

Intervenant-e-s

Dr Emilien Schultz, CREST Dr Léo Mignot, Sciences Po Bordeaux

Description

Cette formation couvre plusieurs usages de traitement de données en Python courants en sciences humaines et sociales avec une coloration spécifique sur les données textuelles. Pensée comme une formation un peu spécialisée, elle s'adresse à un public ayant déjà quelques notions de programmation.

Plus précisément, cette formation abordera la mise en place d'analyses statistiques classiques (descriptives et inférentielles, mais aussi mobilisant l'apprentissage automatique), les stratégies pour réaliser et améliorer des visualisations, et une présentation des différentes stratégies existantes de traitement de données textuelles.

Les notions seront abordées de manière pratique à travers l'analyse d'un corpus de données. Les participants sont par ailleurs encouragés à amener leur propre jeu de données, et un espace sera consacré à échanger sur les besoins futurs.

 

​​Objectifs de la formation

- Avoir une vue d'ensemble des approches de traitement de données textuelles

- Se familiariser avec des bibliothèques centrales de l'écosystème Python pour le traitement de données (Pandas, Scikit-learn, Statsmodels …)

- Mettre en œuvre différents traitement de données textuelles & familiarisation avec les approches « IA » à partir de modèles

 

Prérequis

La formation est pensée pour un public qui a déjà des notions de programmation en langage Python, notamment sa syntaxe et ses principales notions. Il est préférable d'avoir déjà une pratique de traitement de données, et des bases sur les approches statistiques en sciences humaines et sociales. 

Programme

Partie 1

- Rappel (rapide) des bases du langage Python

- Manipulation de données tabulaires et statistiques de base avec Pandas

- Construire et améliorer des visualisations avec Matplotlib, Seaborn, Plotly & co.

- Aller vers des statistiques avancées avec Statsmodels, Scikit-learn et Prince

 

Partie 2

- Les outils du Traitement Automatique du Langage en Python (TAL/NLP)

- De l'expression régulière à l'apprentissage automatique

- Usages des modèles de langage, du local à l'API

Lieu

En ligne

Information

Conditions générales d'inscription: 
1) Vous vous engagez à participer à l'intégralité du module et à réserver les dates dans votre agenda. 
2) En cas de désistement tardif sans motif valable, les organisateur·rice·s se réservent le droit de vous facturer les frais engendrés par votre absence.
3) Un désistement tardif pour juste motif se justifie par la présentation d'un certificat médical. 
4) Toute annulation d'inscription ou désistement doit être annoncé aux organisateur·rice·s, ainsi qu'à la coordination du programme ([email protected]
5) En vous inscrivant, vous attestez avoir pris connaissance des conditions générales d'inscription et vous vous engagez à les respecter.
6) En cas de désistements répétés, nous nous réservons le droit de refuser vos futures inscriptions aux activités du programme.

Places

15

Délai d'inscription 20.03.2026
Contact

Emilien Schultz : [email protected]

short-url short URL

short-url URL onepage