Co-auteur
  • COINTET Jean-Philippe (4)
  • CRÉPEL Maxime (1)
  • DEDIEU François (1)
Type de Document
  • Article (4)
  • Communication non publiée (1)
Pour de nombreux activistes à travers le monde, le déploiement de capteurs numériques, à l’échelle du quartier ou de l’habitation, apparaît comme un moyen de combler les failles de la surveillance officielle de la qualité de l’air. Mais à quelles conditions les « données citoyennes » ainsi produites sontelles crédibles aux yeux des autorités officielles ? Cet article étudie trois associations californiennes, dont les membres co-construisent des protocoles de mesures avec l’autorité de régulation environnementale (EPA) et des universitaires. Nous soutenons que la crédibilité des mesures produites par les capteurs citoyens du point de vue des autorités dépend a minima des deux conditions suivantes : (1) que les instances scientifiques et réglementaires en viennent à considérer les capteurs citoyens comme des dispositifs de connaissance et de gouvernement ; (2) que militants, scientifiques et régulateurs s’engagent dans la mise en place d’une infrastructure partagée qui soit susceptible de réduire les tensions entre les différents acteurs engagés.

Le codage de texte est au coeur de la pratique des sociologues et renvoie à toute une variété de pratiques, de types de matériaux textuels et de corpus et plus largement de modalités de production de connaissance. Différentes options se présentent à l’analyste lorsqu’il souhaite coder avec une machine. Entre les méthodes inductives entièrement non-supervisées venant de l’informatique et la reconnaissance de motifs lexicaux assistés par ordinateur, nous proposons une troisième voie qui s’appuie sur les capacités d’inférence de l’apprentissage machine tout en garantissant un contrôle des catégories analytiques utilisées pour le codage. Une méthode de codage supervisé actif est ainsi appliquée à deux corpus textuels: un ensemble de commentaires collectés sur un corpus de commentaires publiés sur le web, et un corpus d’articles de presse.

Dans cet article, nous nous demandons dans quelle mesure un public au sens fort du terme peut se former autour des occurrences diffusées par les plateformes journalistiques en ligne – c’est-à-dire pas seulement un ensemble d’individus qui consomment des informations, mais un être collectif qui partage des interprétations communes. Pour répondre à cette question, nous avons analysé un corpus de 28 828 commentaires postés sur « The Homicide Report », une plateforme apparue en 2010 qui fournit une information standardisée sur tous les homicides commis à Los Angeles. Nous avons eu recours à une méthode d’analyse textuelle très peu utilisée en sciences sociales, qui repose sur des algorithmes d’apprentissage supervisé. Cette enquête conduit à deux résultats. D’une part, nous montrons que les internautes parviennent à élaborer des interprétations communes à partir des occurrences qui leur sont adressées, en combinant trois façons de « faire public » qui empruntent aux médias traditionnels. D’autre part, nous montrons que l’exploitation sociologique des inscriptions textuelles permet de réduire le fossé entre les enquêtes quantitatives sur les audiences – qui se situent à grande échelle, mais échouent à saisir des interprétations – et les études plus qualitatives – qui saisissent des interprétations à une échelle très locale.

L’essor du web et des réseaux sociaux offre aux chercheurs en sciences sociales un volume considérable de textes : des livres et des articles numérisés ou « nativement numériques », mais aussi des discussions sur des forums, des échanges sur les réseaux sociaux ou des propos tenus sur diverses plateformes en ligne. D’une grande hétérogénéité, ces matériaux textuels sont le support d’un registre étendu d’activités sociales : des citoyens débattent sur une plateforme délibérative des réformes souhaitables en matière de fiscalité et de services publics ; un travailleur présente son parcours, ses compétences et ses contacts professionnels sur LinkedIn ; des mères de famille échangent des conseils de puériculture sur un forum, etc. Combinés au développement d’outils informatiques, ces matériaux sont à l’origine d’une promesse qui a été formulée à l’intérieur comme à l’extérieur des sciences sociales : notre compréhension du monde social serait plus profonde et plus précise si nous exploitions quantitativement les « traces » textuelles de tant d’activités sociales (Lazer et al., 2009). [Premières lignes]

Depuis les années 2000, de nouvelles techniques d’analyse textuelle font leur apparition au croisement des mondes informatiques, de l’intelligence artificielle et du traitement automatique de la langue. Bien qu’élaborées en dehors de toute préoccupation sociologique, ces techniques sont aujourd’hui mobilisées par des chercheurs – sociologues comme non-sociologues – dans le but de renouveler la connaissance du social en tirant parti du volume considérable de matériaux textuels aujourd’hui disponibles. En dressant un panorama des enquêtes sociologiques qui reposent sur la mise en données et le traitement quantitatif de corpus textuels, cet article identifie à quelles conditions ces approches peuvent constituer une ressource pour l’enquête sociologique. Les trois conditions qui émergent de notre analyse concernent : 1) la connaissance du contexte de production des inscriptions textuelles ; 2) l’intégration à l’enquête de données extérieures au texte lui-même ; 3) l’ajustement des algorithmes au raisonnement sociologique.