Information détaillée concernant le cours
Titre | Approches computationnelles du style |
Dates | 23 et 24 mars 2023 |
Organisateur(s)/trice(s) | Simon Gabay, UNIGE, M. Miguel Betti, UNIGE M. Juan Barrios Rudloff, UNIGE |
Intervenant-e-s | Florian Cafiero, Sciences Po Paris (FR) Jean-Baptiste Camps, Ecole nationale des chartes - PSL (FR) Dr Simon Gabay, UNIGE |
Description | Cet atelier propose de revenir sur les principales notions théoriques et pratiques liées aux études numériques du style en sciences humaines et sociales. Trois axes principaux y seront développés. Chacun d'entre eux sera illustré par une application à un champ d'études différents: sciences criminelles; littérature et sciences historiques; sciences sociales. Mais les méthodes apprises dans chaque partie sont utilisables dans tous les domaines cités. L'identification de l'auteur d'un texte, à travers l'étude des caractéristiques idiosyncrasiques de son usage de la language (idiolecte). Cette question, classique pour les historiens et philologues qui cherchent à établir le nom d'un auteur perdu ou douteux, trouve également son usage dans la sphère judiciaire et l'univers des sciences criminelles. C'est à ces derniers domaines que nous emprunterons notre premier cas pratique. Les méthodes de profilage: comment peut-on déduire de la seule étude du texte l'époque de son écriture? L'origine géographique de son auteur(e), son âge, sa classe sociale etc.? Ces questions de dialectologie peuvent bien sûr faire l'objet d'études traditionnelles, mais peuvent souvent être complétées avec profit par des études computationnelles, l'intelligence artificielle se révélant souvent très performantes pour ce genre de tâche. En s'appuyant sur ces méthodes, nous étudierons cette fois-ci un cas d'application à la littérature. Les variations stylistiques selon le contexte d'énonciation: comment une même personne s'exprime-t-elle en fonction du sujet dont elle parle? Du type de texte ou de prise de parole qu'elle emploie? Ces variations représentent complexifient les tâches précédentes: par exemple comment savoir si telle personne a écrit ce poème, quand je ne dispose que de sa prose comme exemple de son style? Mais elles sont également un sujet d'intérêt en soi, pour les études littéraires comme pour les sciences sociales. Comment un même acteur investit-il différentes arènes? Comment adapte-t-il son discours selon les destinataires potentiels, ou selon la plateforme employée (Twitter, site web, discours public etc.)? Autant de questions auxquelles nous tenterons de répondre dans notre dernier exemple. Les méthodes employées s'étendent de méthodes statistiques traditionnelles, héritées de la linguistique de corpus, à l'intelligence artificielle, en passant par la modélisation de sujet et les plongements lexicaux (topic modeling, word2vec, top2vec). Si elles ne sont pas l'objet premier de cet atelier, les réflexions quant à l'usage éthique de ces pratiques de recherche émailleront chacune de ses parties. Pour chaque thématique évoquée, deux heures seront consacrées à une présentation théorique. Une introduction pratique s'ensuivra de manière aussi systématique que possible. Nous prendrons également garde à veiller à ce que les enjeux de constitution des bases de données et les considérations pratiques d'accès aux outils soient également évoquées. |
Programme | Demi-journée 1 - identification d'un auteur
9h-10h30: cours
10h30-11h Pause
11h-12h30: TP
Dîner12h30-14h
Demi-journée 2 - méthodes de profilage
14h00-15h30: cours
15h30-16h Pause
16h-17h30 TP
18h-19h: Keynote Le Retour de l'auteur : ce que le style nous apprend sur qui parle
Souper 19h-20h
Demi-journée 3 - variations stylistiques selon le contexte d'énonciation
9h-10h30: cours
10h30-11h Pause
11h-12h30: TP
Dîner 12h30-14h
Demi-journée 4 - Discussion des cas des doctorants 14h15-15h45 : présentations et discussion des cas
|
Lieu |
UNIGE / Bâtiment Uni-Carl-Vogt, Bd Carl-Vogt 66, 1205 Genève / salle 4 (rez-de-chaussée, à gauche en entrant) |
Information | |
Places | 20 |
Délai d'inscription | 18.03.2023 |