Co-auteur
  • GIRARD Paul (12)
  • JACOMY Mathieu (12)
  • PLIQUE Guillaume (5)
  • MARIÉ Damien (4)
  • Voir plus
Type de Document
  • Communication non publiée (17)
  • Site Web (6)
  • Poster (2)
  • Actes de colloque (2)
  • Voir plus
Unfolding the Multi-layered Structure of the French Mediascape

Publié en 2018-10 Nom de la conférence WS.2 2018 International conference on Web Studies, Paris, France — October 03 - 05, 2018
37
vues

0
téléchargements
The emergence and success of web platforms raised a gimmick into social studies: “Hyperlink is dead!“. Capturing web users into mobile applications and private web platforms to propose them a specific user experience (and a business model) created indeed new silos in the open World Wide Web space. The simplified availability of user behavioural data through these platforms APIs reinforced this idea in academic communities by providing scholars with a rich and easy way to collect user centric data for their research. After discussing the methodological and ethical aspects of the web divide between platforms and classical websites, we will argue in this communication that hyperlinks, although more complex to collect, manipulate and apprehend, remain an invaluable matter to use the web as a research field. We will illustrate it using Hyphe, a dedicated web corpus creation tool we developed to mine hypertexts.

43
vues

0
téléchargements
Dans un contexte de division autour de la réforme constitutionnelle qui pose la question de son rôle, le Parlement a ouvert une commission d’enquête suite à l’affaire Benalla. Si Emmanuel Macron a souvent réaffirmé leur importance, qu'en est-il du pouvoir d'agir des parlementaires ?

Initié en 2012-2014, au croisement de l'informatique parlementaire et des sciences sociales numériques, La Fabrique de la Loi est un projet mené en partenariat entre deux laboratoires de recherche à Sciences Po, le médialab et le CEE, et l'association citoyenne et bénévole Regards Citoyens. Mis en ligne pour la première fois en 2014 avec un échantillon réduit de lois, le site www.LaFabriqueDeLaLoi.fr permet désormais de suivre chaque étape de la procédure législative pour plus de 800 lois promulguées depuis 2008. L'outil permet d'analyser dans le temps et quantitativement toutes ces lois, d'observer le degré de modification du texte de leurs articles via un code couleur ou encore d'explorer les discours et amendements relatifs à tel article ou à tel élu. Sont ainsi offertes différentes formes d'aperçus des transformations des textes de loi par le parlement ignorées par l'approche statistique classique.

La moyenne des textes promulgués par le Parlement après une seule lecture des chambres au lieu de deux s’établissait à un tiers environ sous les présidences de Valéry Giscard d’Etaing et de François Mitterrand avant de passer la barre des 40% pendant la présidence de Nicolas Sarkozy et même de dépasser celle des 60% à la fin du mandat de François Hollande.

Hyphe, a web crawler for social scientists developed by the SciencesPo médialab, introduced the novel concept of web entities to provide a flexible and evolutive way of grouping web pages in situations where the notion of website is not relevant enough (either too large, for instance with Twitter accounts, newspaper articles or Wikipedia pages, or too constrained to group together multiple domains or TLDs...). This comes with technical challenges since indexing a graph of linked web entities as a dynamic layer based on a large number of URLs is not as straightforward as it may seem. We aim at providing the graph community with some feedback about the design of an on-file index - part Graph, part Trie - named the "Traph", to solve this peculiar use-case. Additionally we propose to retrace the path we followed, from an old Lucene index, to our experiments with Neo4j, and lastly to our conclusion that we needed to develop our own data structure in order to be able to scale up.

Suivant