Full Text
  • No (23)
  • Yes (12)
Document Type
  • Conference contribution (17)
  • Article (7)
  • Part or chapter of a book (3)
  • Web site (3)
  • Show more
Research Center
  • Médialab (33)
  • Centre de recherches politiques de Sciences Po (3)
  • Ecole Polytechnique Fédérale de Lausanne (1)
  • Sciences Po (1)
  • Show more
Discipline
  • Library and information sciences (27)
  • Web (22)
  • Sociology (22)
  • Social and Information Networks (20)
  • Show more
Language
  • French (22)
  • English (14)
24
views

24
downloads
Le développement des technologies numériques engendre une longue et profonde mutation de notre rapport à la connaissance. Quelle que soit l’étiquette utilisée pour désigner ce phénomène, de nombreuses personnes s’interrogent sur les évolutions de nos pratiques académiques (Lazer et al 2009, Ollion & Bollaert 2016). Explorer les parties pour construire les touts Latour et al avancent en 2012 que de nouvelles façons de représenter et surtout de naviguer dans les données permettraient de revenir sur le rapport entre tout et partie, débat aussi vieux que la sociologie elle-même (Latour 2012). D’après ces auteurs, chaque tout n’est qu’une façon particulière de voir les parties, un trait commun qui rassemble. Un trait parmi d’autres. Le tout est une prise tellement utile, tellement signifiante qu’on en oublie qu’il cache une réduction d’une foule de particularités. Or ce tout peut aujourd’hui être décomposé ou plutôt recomposé dynamiquement dans de nouveaux moyens d’exploration des données appelés Datascapes - autrement dit paysages de données. Reprenant ces intentions, nous avons depuis 2012 conçu des outils d’analyse exploratoire de données (Tukey 1977) qui permettent de multiplier les perspectives sur un même objet.

in Netcom – Réseaux, communication et territoires Publication date 2015-07
DOUAY Nicolas
REYS Nicolas
ROBIN Sabrina, Géographie-Cités
6
views

0
downloads
Cet article propose de visualiser des données numériques produites par l’usage du réseau social Twitter par les maires de la région Ile-de-France. En effet Twitter est maintenant un outil de communication en pleine expansion et les personnalités publiques l’utilisent abondamment comme un moyen de rejoindre les internautes intéressés par leurs engagements et responsabilités. L’analyse et la visualisation de ces « big data » visent donc à réaliser une étude de l’usage d’un réseau social par des élus locaux. Il s’agit, d’abord, de dresser le profil type des maires présents sur le réseau social en fonction du genre, de l’âge, de l’appartenance partisane, du niveau de responsabilité et du type d’espace. Puis de caractériser les usages quant à l’audience et au rayonnement de l’activité par l’analyse du nombre de tweets et des followers en reprenant les mêmes critères. Et enfin, il s’agit d’observer le contenu des messages échangés et de les analyser comme des illustrations du débat public local.

in Le Monde Publication date 2012-02-03
OOGHE Benjamin
LAROUSSERIE David
4
views

0
downloads

Notion centrale de la recherche en SHS, le corpus voit ses contours redéfinis alors que les éléments qui le constituent sont aujourd’hui le plus souvent des contenus ou données issus du web. Quelles sont les possibilités offertes par le contexte numérique, pour constituer et traiter des corpus, les méthodes de recueil de données et d’observation en sont-elles modifiées ? La taille et la dimension de représentativité d’un corpus sont-elle revisitées quand les données accessibles s’inscrivent dans des flux et se mesurent en Giga ou Tera octets, quelles unités retenir quand les données sont hétérogènes et instables ? Quels sont les instruments à disposition du chercheur pour constituer, traiter et analyser ces corpus ?

A partir du cas du web du livre en France, cet article interroge la notion de zoom dans l’exploration visuelle de réseaux. En soumettant un graphe à des questionnements et traitements successifs, il devient possible de comprendre ce qui apparaît comme une anomalie pour le chercheur, un entrelacement sur le plan visuel de deux communautés pourtant distinctes du point de vue des catégories et de l’algorithme de modularité. En appliquant ces différentes épreuves au graphe apparaît la variété des algorithmes de spatialisation et de clusterisation, les limites des notions de zoom, de découpage et d’exploration des réseaux, toutes métaphores spatiales peu pertinentes. Cette démarche plaide pour des conventions d’exploration qui assurent la robustesse de l’exploitation de ce type de données.

In the last few years, a spirit has been haunting our academic and popular culture — the spirit of networks. Throughout social as well as natural sciences, more and more phenomena have come to be conceived as networks. Telecommunication networks, neural networks, social networks, epigenetic networks, ecological and economic networks , the very fabric of our existence seems to be made of lines and dots. More recently, the interest for graphs overflowed from science to popular culture and images of networks started to appear everywhere. They decorate buildings and objects; they are printed on t-shirts and furniture; they colonize the desktop of our computers and the walls of our airports. Networks have become the emblem of modernity, a way to show and tell our world’s complexity. Our growing fascination for networks is not unjustified. Networks are powerful conceptual tools, encapsulating in a single object multiple affordances for computation (networks as graphs), visualization (networks as maps) and manipulation of data (networks as interfaces).

Cet article reprend une recherche de Luc Boltanski sur les enseignants de l’IEP de Paris. Dans cette recherche, Boltanski s’appuie sur une représentation tabulaire des champs sociaux pour montrer que la classe dominante se caractérise avant tout par sa multipositionnalité, c’est-à-dire par la tendance de ses membres à occuper plusieurs positions dans plusieurs champs. En remplaçant le tableau de Boltanski par un graphe d’individus et d’institutions, nous discuterons les caractéristiques et les avantages d’une sociologie de réseaux hétérogènes.

in Datafied Society: Social Research in the Age of Big Data. Publication date 2017-02-25
BOUNEGRU Liliana
GRAY Jonathan
15
views

0
downloads
No doubt, networks have become indispensable mathematical tools in many aspects of life in the twenty first century. They allow us to calculate all kinds of relational metrics and to quantify the properties of their nodes, clusters and global structures. These modes of calculation are becoming increasingly prevalent in an age of digital data. But networks are more than formal analytical tools. They are also powerful metaphors of our collective life, with all of its complexity and its many dependencies. This is why, among the various strategies of data visualization, networks seem to have assumed a paradigmatic position, spreading to the most different disciplines and colonizing sometimes as mere decoration a growing number of digital and non-digital objects. Contemplating the visual representation of a network, we don’t (always) need to compute its mathematical properties to appreciate its heuristic value – as anyone who has ever used a transportation plan knows well. Networks are extraordinary calculating devices, but they are also maps, instruments of navigation and representation. Not only do they guide our steps through the territories that they represent, but they also invite our imagination to see and explore the world in different ways. [First paragraph]

in Digital Journalism Publication date 2016-06-20
BOUNEGRU Liliana
GRAY Jonathan
1
views

0
downloads
Networks have become the de facto diagram of the Big Data age (try searching Google Images for [big data AND visualisation] and see). The concept of networks has become central to many fields of human inquiry and is said to revolutionise everything from medicine to markets to military intelligence. While the mathematical and analytical capabilities of networks have been extensively studied over the years, in this article we argue that the storytelling affordances of networks have been comparatively neglected. In order to address this we use multimodal analysis to examine the stories that networks evoke in a series of journalism articles. We develop a protocol by means of which narrative meanings can be construed from network imagery and the context in which it is embedded, and discuss five different kinds of narrative readings of networks, illustrated with analyses of examples from journalism. Finally, to support further research in this area, we discuss methodological issues that we encountered and suggest directions for future study to advance and broaden research around this defining aspect of visual culture after the digital turn.

The web is a field of investigation for social sciences, and platform-based studies have long proven their relevance. However the generic web is rarely studied in itself though it contains crucial aspects of the embodiment of social actors: personal blogs, institutional websites, hobby-specific media… We realized that some sociologists see existing web crawlers as “black boxes” unsuitable for research though they are willing to study the broad web. In this paper we present Hyphe, a crawler developed with and for social scientists, with an innovative “curation-oriented” approach. We expose the problems of using web-mining techniques in social science research and how to overcome those by specific features such as step-by-step corpus building and a memory structure allowing researchers to redefine dynamically the granularity of their “web entities”.

in Reset Publication date 2017-11
PADDEU Flaminia
DOUAY Nicolas, Géographie-Cités
BLANC Nathalie
3
views

0
downloads
Cet article porte sur l’activisme environnemental et les usages du numérique. Le cas de la controverse autour du projet EuropaCity en périphérie parisienne s’appuie une analyse de l’usage du réseau social Twitter. Le corpus de données collecté et analysé correspond au hashtag de la controverse, #EuropaCity, ainsi qu’aux profils des acteurs principaux du débat sur la plateforme. Les résultats permettent d’établir une cartographie d’un débat qui peine à s’instaurer en ligne. Plus spécifiquement il s’agit d’observer l’évolution dans le temps du débat, par la distribution temporelle des tweets et son articulation à l’actualité des mobilisations, de l’évolution du projet et des moments du débat public. Une attention est aussi portée aux principaux acteurs impliqués dans la controverse et à leurs registres d’action au travers de l’importance prise par la controverse EuropaCity dans leurs communications et actions, leurs proximités et éventuelles mise en réseau, leurs interactions, leurs modes d’expression et bien sûr le contenu des tweets.

Hyphe, a web crawler for social scientists developed by the SciencesPo médialab, introduced the novel concept of web entities to provide a flexible and evolutive way of grouping web pages in situations where the notion of website is not relevant enough (either too large, for instance with Twitter accounts, newspaper articles or Wikipedia pages, or too constrained to group together multiple domains or TLDs...). This comes with technical challenges since indexing a graph of linked web entities as a dynamic layer based on a large number of URLs is not as straightforward as it may seem. We aim at providing the graph community with some feedback about the design of an on-file index - part Graph, part Trie - named the "Traph", to solve this peculiar use-case. Additionally we propose to retrace the path we followed, from an old Lucene index, to our experiments with Neo4j, and lastly to our conclusion that we needed to develop our own data structure in order to be able to scale up.

0
views

0
downloads
Le web c’est grand, surtout vers le fond. Et ce n’est pas très organisé, même si ce n’est pas non plus le chaos. Quelle est la structure du web, et comment s’y orienter ? Question plus difficile encore, comment trouver et identifier l’information pertinente sans amasser de téraoctets inutiles ? Le web nous oppose des défis à la fois méthodologiques et technologiques. Le médialab de Sciences Po a développé HYPHE, un robot amasseur de données web aussi appelé «crawler», ajusté aux besoins de la recherche en sciences sociales. Il s’adresse aux sociologues qui veulent investiguer le web comme terrain d’enquête qualitative et en tirer des indicateurs quantitatifs. S’appuyant sur le modèle du web «en couches», il guide son utilisateur pour construire, itération après itération, un corpus de ressources et/ou d’acteurs. Le travail manuel de sélection et de qualification de l’information est récompensé par un réseau de ressources que l’on peut exploiter de différentes manières: en analysant sa topologie avec GEPHI, en exportant ses textes vers un logiciel de traitement du langage, ou encore en construisant un moteur de recherche dédié. Le médialab vous propose une présentation de ce logiciel libre et open source, et une initiation à ses principaux concepts. Des exemples tirés des travaux des chercheurs l’ayant utilisé illustreront ses possibilités. Une démo de HYPHE est également disponible en ligne - hyphe.medialab.sciences-po.fr

We defined this website as a datascape (Latour and al., 2012). A datascape is a tool that allows exploring a dataset from different levels of aggregation and different points of view related to the attributes of each element of the corpus. The philosophy of this datascape is to always be able to qualify actors (web entities) and the terms of potential controversies (topics and text content of pages). To do this we have designed a tool that allows following the links between web entities, their pages and associated topics. We have also included two visualization tools, a graph to locate web entities, and a matrix to explore links between topics.

Publication date 2015-10
PEDROJA Cynthia
ANSART Thomas
MITRANO Patrice
MUNK Anders Kristian
3
views

0
downloads
Les images du médialab et de l'atelier de cartographie se rencontrent et dialoguent dans les vitrines de la bibliothèque. Retrouvez les textes et téléchargez les images qui vous ont marqué.

in The Routledge Handbook to Developments in Digital Journalism Studies Sous la direction de ELDRIDGE II Scott Publication date 2018-08
BOUNEGRU Liliana
GRAY Jonathan
9
views

0
downloads
Networks are classic but under-acknowledged figures of journalistic storytelling. Who is connected to whom and by which means? Which organizations receive support from which others? What resources or information circulate through which channels and which intermediaries enable and regulate their flows? These are all customary stories and lines of inquiry in journalism and they all have to do with networks. Additionally, the recent spread of digital media has increasingly confronted journalists with information coming not only in the traditional form of statistic tables, but also of relational databases. Yet, journalists have so far made little use of the analytical resources offered by networks. To address this problem in this chapter we examine how “visual network exploration” may be brought to bear in the context of data journalism in order to explore, narrate and make sense of large and complex relational datasets. We borrow the more familiar vocabulary of geographical maps to show how key graphical variables such as position, size and hue can be used to interpret and characterise graph structures and properties. We illustrate this technique by taking as a starting point a recent example from journalism, namely a catalogue of French information sources compiled by Le Monde’s The Decodex. We establish that good visual exploration of networks is an iterative process where practices to demarcate categories and territories are entangled and mutually constitutive. To enrich investigation we suggest ways in which the insights of the visual exploration of networks can be supplemented with simple calculations and statistics of distributions of nodes and links across the network. We conclude with reflection on the knowledge-making capacities of this technique and how these compare to the insights and instruments that journalists have used in the Decodex project – suggesting that visual network exploration is a fertile area for further exploration and collaborations between data journalists and digital researchers.

in DigitalSTS: A Handbook and Fieldguide Publication date 2016-01
37
views

0
downloads
This paper discusses the differences and affinities among three types of networks (namely Actor-?Network, Network Analysis and Digital Networks) that are playing an increasingly important role in digital STS. In the last few decades, the idea of ‘network’ has slowly but steadily colonized broad strands of STS research. This colonization started with the advent of actor-?network theory, which provided a convenient set of notions to describe the construction of socio-?technical phenomena. Then came network analysis, and scholars who imported in the STS the techniques of investigation and visualization developed in the tradition of social network analysis and scientometrics. Finally, with the increasing ‘computerization’ of STS, scholars turned their attention to digital networks a way of tracing collective life. Many researchers have more or less explicitly tried to link these three movements in one coherent set of digital methods for STS, betting on the idea that actor-?network theory can be operationalized through network analysis thanks to the data provided by digital networks. Yet, to be honest, little proves the continuity among these three objects besides the homonymy of the word ‘network’. Are we sure that we are talking about the same networks? "Odi

Publication date 2017
COLOMBO Gabriele
MEUNIER Axel
BRILLI Agata
10
views

10
downloads
The reconciliation of nature and the urban space is worldwide considered among the smart solutions to a growing range of issues created by urban growth. But there is no agreement on the imaginaries and technical practices that should be included into the new urban nature. To address the specific case of the city Paris and its big re-naturation project, to observe, monitor and, eventually, produce elements of reflections for future urban policies, in the NATURPRADI project has been conducted a Digital Methods campaign. It is aimed at mapping the symbolic and material elements of the urban nature debate by asking specific research questions: Which images, discourses and practices narrate urban nature? by whom and what are they sustained?

L’objectif de cette note est de proposer un nouvel outil méthodologique en complément de celui des sondages afin de renforcer la fiabilité de la connaissance de l’opinion publique. Il s’agit d’un logiciel de cartographie web appelé Hyphe à partir duquel il est possible de collecter des opinions exprimées sur internet autour d’un objet d’étude défini par le chercheur ou par le sondeur. Le corpus obtenu peut être visualisé sous la forme d’un réseau web faisant apparaître les liens entre différentes entités numériques (qui peuvent être des pages, des sous-domaines ou des combinaisons de sites etc.) du réseau ainsi reconstitué.

De plus en plus structurées, formatées et interopérables, les données de la recherche contribuent elles-mêmes au développement du web des données. Mais qu’en est-il de leur préservation sur le long terme? Comment conserver les archives scientifiques quand elles intègrent des corpus multimédias ou issus du Web? Comment garantir les conditions d’un retour à la source dans le cadre de corpus issus du web constitués spécifiquement pour des projets de recherche? Quel sont les outils, les plateformes, les projets qui concourent à partager et diffuser les fonds d’archives scientifiques et, inversement, à archiver les contenus en ligne quand ils sont constitués en objets d’étude? Dans quelle mesure les techniques et les politiques d’archivage du web peuvent-elles compléter ou interférer avec celles de l’archivage scientifique? Y a-t-il une concurrence entre les acteurs, ou les plateformes sont-elles au contraire appelées à s’articuler en exploitant les nouvelles possibilités de partage et les nouvelles manières de construire des corpus?

22
views

0
downloads
The emergence and success of web platforms raised a gimmick into social studies: “Hyperlink is dead!“. Capturing web users into mobile applications and private web platforms to propose them a specific user experience (and a business model) created indeed new silos in the open World Wide Web space. The simplified availability of user behavioural data through these platforms APIs reinforced this idea in academic communities by providing scholars with a rich and easy way to collect user centric data for their research. After discussing the methodological and ethical aspects of the web divide between platforms and classical websites, we will argue in this communication that hyperlinks, although more complex to collect, manipulate and apprehend, remain an invaluable matter to use the web as a research field. We will illustrate it using Hyphe, a dedicated web corpus creation tool we developed to mine hypertexts.

Next