Coauthor
  • GIRARD Paul (12)
  • JACOMY Mathieu (12)
  • VENTURINI Tommaso (5)
  • BANEYX Audrey (5)
  • Show more
Document Type
  • Conference contribution (17)
  • Web site (7)
  • Poster (2)
  • Conference proceedings (2)
  • Show more
The web is a field of investigation for social sciences, and platform-based studies have long proven their relevance. However the generic web is rarely studied in itself though it contains crucial aspects of the embodiment of social actors: personal blogs, institutional websites, hobby-specific media… We realized that some sociologists see existing web crawlers as “black boxes” unsuitable for research though they are willing to study the broad web. In this paper we present Hyphe, a crawler developed with and for social scientists, with an innovative “curation-oriented” approach. We expose the problems of using web-mining techniques in social science research and how to overcome those by specific features such as step-by-step corpus building and a memory structure allowing researchers to redefine dynamically the granularity of their “web entities”.

in Le Monde Publication date 2012-02-03
OOGHE Benjamin
LAROUSSERIE David
4
views

0
downloads

Notion centrale de la recherche en SHS, le corpus voit ses contours redéfinis alors que les éléments qui le constituent sont aujourd’hui le plus souvent des contenus ou données issus du web. Quelles sont les possibilités offertes par le contexte numérique, pour constituer et traiter des corpus, les méthodes de recueil de données et d’observation en sont-elles modifiées ? La taille et la dimension de représentativité d’un corpus sont-elle revisitées quand les données accessibles s’inscrivent dans des flux et se mesurent en Giga ou Tera octets, quelles unités retenir quand les données sont hétérogènes et instables ? Quels sont les instruments à disposition du chercheur pour constituer, traiter et analyser ces corpus ?

34
views

0
downloads
Dans un contexte de division autour de la réforme constitutionnelle qui pose la question de son rôle, le Parlement a ouvert une commission d’enquête suite à l’affaire Benalla. Si Emmanuel Macron a souvent réaffirmé leur importance, qu'en est-il du pouvoir d'agir des parlementaires ?

Initié en 2012-2014, au croisement de l'informatique parlementaire et des sciences sociales numériques, La Fabrique de la Loi est un projet mené en partenariat entre deux laboratoires de recherche à Sciences Po, le médialab et le CEE, et l'association citoyenne et bénévole Regards Citoyens. Mis en ligne pour la première fois en 2014 avec un échantillon réduit de lois, le site www.LaFabriqueDeLaLoi.fr permet désormais de suivre chaque étape de la procédure législative pour plus de 800 lois promulguées depuis 2008. L'outil permet d'analyser dans le temps et quantitativement toutes ces lois, d'observer le degré de modification du texte de leurs articles via un code couleur ou encore d'explorer les discours et amendements relatifs à tel article ou à tel élu. Sont ainsi offertes différentes formes d'aperçus des transformations des textes de loi par le parlement ignorées par l'approche statistique classique.

Next