Auteurs Centres de recherche Disciplines et Collections Projets
Français English
 
 

Ce que le big data fait à l’analyse sociologique des textes

 

Notice

Type:   Article
 
Titre:   Ce que le big data fait à l’analyse sociologique des textes : Un panorama critique des recherches contemporaines
 
Auteur(s):   Cointet, Jean-Philippe - Médialab (Auteur)
Parasie, Sylvain - Laboratoire Interdisciplinaire Sciences, Innovations, Société (LISIS) (Auteur)
 
In:   Revue française de sociologie
 
Date de publication:   2018-10
 
Éditeur:   FRANCE  :  Presses de Sciences Po
 
Volume:   59
 
Numéro:   3
 
Pages:   533-557  p.
 
ISSN:   00352969
 
DOI:   10.3917/rfs.593.0533
 
Mots-clés:   [fr] Big data, Traces numériques, Corpus textuels, Lexicométrie, Réseaux sémantiques, Épistémologie, Intelligence artificielle, Traitement automatique de la langue [en] Digital traces, Textual corpora, Lexicometry, Semantic networks, Epistemology, Artificial intelligence, Automatic language processing
 
Résumé:   [fr] Depuis les années 2000, de nouvelles techniques d’analyse textuelle font leur apparition au croisement des mondes informatiques, de l’intelligence artificielle et du traitement automatique de la langue. Bien qu’élaborées en dehors de toute préoccupation sociologique, ces techniques sont aujourd’hui mobilisées par des chercheurs – sociologues comme non-sociologues – dans le but de renouveler la connaissance du social en tirant parti du volume considérable de matériaux textuels aujourd’hui disponibles. En dressant un panorama des enquêtes sociologiques qui reposent sur la mise en données et le traitement quantitatif de corpus textuels, cet article identifie à quelles conditions ces approches peuvent constituer une ressource pour l’enquête sociologique. Les trois conditions qui émergent de notre analyse concernent : 1) la connaissance du contexte de production des inscriptions textuelles ; 2) l’intégration à l’enquête de données extérieures au texte lui-même ; 3) l’ajustement des algorithmes au raisonnement sociologique.

[en] Since the 2000s, new techniques of text analysis have emerged at the crossroads of computer science, artificial intelligence and natural language processing. Although they were developed independently of any sociological theory, these methods are now being used by researchers—sociologists and non-sociologists alike—to produce new knowledge of the social domain exploiting the massive volume of textual materials now available. By providing an overview of recent sociological investigations that are based on quantitative analyses of textual corpora, this article identifies three conditions under which these approaches can be a resource for sociological inquiry. The three conditions that emerge from our analysis concern: 1) knowledge of the context of production of textual inscriptions; 2) integration of external data into the study itself; 3) the adaptation of algorithms for sociological reasoning.
 
 

Résolveur de liens