Texte intégral
  • Non (22)
  • Oui (13)
Type de Document
  • Communication non publiée (17)
  • Article (7)
  • Partie ou chapitre de livre (3)
  • Site Web (3)
  • Voir plus
Centre de Recherche
  • Médialab (33)
  • Centre de recherches politiques de Sciences Po (3)
  • médialab (MEDIALAB) (1)
  • Sciences Po (1)
  • Voir plus
Discipline
  • Sciences de l'information et de la communication (27)
  • Web (22)
  • Sociologie (22)
  • Réseaux sociaux et d'information (20)
  • Voir plus
Langue
  • Français (22)
  • Anglais (14)
in Netcom – Réseaux, communication et territoires Publié en 2015-07
DOUAY Nicolas
REYS Nicolas
ROBIN Sabrina, Géographie-Cités
7
vues

0
téléchargements
Cet article propose de visualiser des données numériques produites par l’usage du réseau social Twitter par les maires de la région Ile-de-France. En effet Twitter est maintenant un outil de communication en pleine expansion et les personnalités publiques l’utilisent abondamment comme un moyen de rejoindre les internautes intéressés par leurs engagements et responsabilités. L’analyse et la visualisation de ces « big data » visent donc à réaliser une étude de l’usage d’un réseau social par des élus locaux. Il s’agit, d’abord, de dresser le profil type des maires présents sur le réseau social en fonction du genre, de l’âge, de l’appartenance partisane, du niveau de responsabilité et du type d’espace. Puis de caractériser les usages quant à l’audience et au rayonnement de l’activité par l’analyse du nombre de tweets et des followers en reprenant les mêmes critères. Et enfin, il s’agit d’observer le contenu des messages échangés et de les analyser comme des illustrations du débat public local.

in Le Monde Publié en 2012-02-03
OOGHE Benjamin
LAROUSSERIE David
4
vues

0
téléchargements

Notion centrale de la recherche en SHS, le corpus voit ses contours redéfinis alors que les éléments qui le constituent sont aujourd’hui le plus souvent des contenus ou données issus du web. Quelles sont les possibilités offertes par le contexte numérique, pour constituer et traiter des corpus, les méthodes de recueil de données et d’observation en sont-elles modifiées ? La taille et la dimension de représentativité d’un corpus sont-elle revisitées quand les données accessibles s’inscrivent dans des flux et se mesurent en Giga ou Tera octets, quelles unités retenir quand les données sont hétérogènes et instables ? Quels sont les instruments à disposition du chercheur pour constituer, traiter et analyser ces corpus ?

11
vues

11
téléchargements
A partir du cas du web du livre en France, cet article interroge la notion de zoom dans l’exploration visuelle de réseaux. En soumettant un graphe à des questionnements et traitements successifs, il devient possible de comprendre ce qui apparaît comme une anomalie pour le chercheur, un entrelacement sur le plan visuel de deux communautés pourtant distinctes du point de vue des catégories et de l’algorithme de modularité. En appliquant ces différentes épreuves au graphe apparaît la variété des algorithmes de spatialisation et de clusterisation, les limites des notions de zoom, de découpage et d’exploration des réseaux, toutes métaphores spatiales peu pertinentes. Cette démarche plaide pour des conventions d’exploration qui assurent la robustesse de l’exploitation de ce type de données.

In the last few years, a spirit has been haunting our academic and popular culture — the spirit of networks. Throughout social as well as natural sciences, more and more phenomena have come to be conceived as networks. Telecommunication networks, neural networks, social networks, epigenetic networks, ecological and economic networks , the very fabric of our existence seems to be made of lines and dots. More recently, the interest for graphs overflowed from science to popular culture and images of networks started to appear everywhere. They decorate buildings and objects; they are printed on t-shirts and furniture; they colonize the desktop of our computers and the walls of our airports. Networks have become the emblem of modernity, a way to show and tell our world’s complexity. Our growing fascination for networks is not unjustified. Networks are powerful conceptual tools, encapsulating in a single object multiple affordances for computation (networks as graphs), visualization (networks as maps) and manipulation of data (networks as interfaces).

Cet article reprend une recherche de Luc Boltanski sur les enseignants de l’IEP de Paris. Dans cette recherche, Boltanski s’appuie sur une représentation tabulaire des champs sociaux pour montrer que la classe dominante se caractérise avant tout par sa multipositionnalité, c’est-à-dire par la tendance de ses membres à occuper plusieurs positions dans plusieurs champs. En remplaçant le tableau de Boltanski par un graphe d’individus et d’institutions, nous discuterons les caractéristiques et les avantages d’une sociologie de réseaux hétérogènes.

in Datafied Society: Social Research in the Age of Big Data. Publié en 2017-02-25
BOUNEGRU Liliana
GRAY Jonathan
15
vues

0
téléchargements
No doubt, networks have become indispensable mathematical tools in many aspects of life in the twenty first century. They allow us to calculate all kinds of relational metrics and to quantify the properties of their nodes, clusters and global structures. These modes of calculation are becoming increasingly prevalent in an age of digital data. But networks are more than formal analytical tools. They are also powerful metaphors of our collective life, with all of its complexity and its many dependencies. This is why, among the various strategies of data visualization, networks seem to have assumed a paradigmatic position, spreading to the most different disciplines and colonizing sometimes as mere decoration a growing number of digital and non-digital objects. Contemplating the visual representation of a network, we don’t (always) need to compute its mathematical properties to appreciate its heuristic value – as anyone who has ever used a transportation plan knows well. Networks are extraordinary calculating devices, but they are also maps, instruments of navigation and representation. Not only do they guide our steps through the territories that they represent, but they also invite our imagination to see and explore the world in different ways. [First paragraph]

in Digital Journalism Publié en 2016-06-20
BOUNEGRU Liliana
GRAY Jonathan
1
vues

0
téléchargements
Networks have become the de facto diagram of the Big Data age (try searching Google Images for [big data AND visualisation] and see). The concept of networks has become central to many fields of human inquiry and is said to revolutionise everything from medicine to markets to military intelligence. While the mathematical and analytical capabilities of networks have been extensively studied over the years, in this article we argue that the storytelling affordances of networks have been comparatively neglected. In order to address this we use multimodal analysis to examine the stories that networks evoke in a series of journalism articles. We develop a protocol by means of which narrative meanings can be construed from network imagery and the context in which it is embedded, and discuss five different kinds of narrative readings of networks, illustrated with analyses of examples from journalism. Finally, to support further research in this area, we discuss methodological issues that we encountered and suggest directions for future study to advance and broaden research around this defining aspect of visual culture after the digital turn.

The web is a field of investigation for social sciences, and platform-based studies have long proven their relevance. However the generic web is rarely studied in itself though it contains crucial aspects of the embodiment of social actors: personal blogs, institutional websites, hobby-specific media… We realized that some sociologists see existing web crawlers as “black boxes” unsuitable for research though they are willing to study the broad web. In this paper we present Hyphe, a crawler developed with and for social scientists, with an innovative “curation-oriented” approach. We expose the problems of using web-mining techniques in social science research and how to overcome those by specific features such as step-by-step corpus building and a memory structure allowing researchers to redefine dynamically the granularity of their “web entities”.

in Reset Publié en 2017-11
PADDEU Flaminia
DOUAY Nicolas, Géographie-Cités
BLANC Nathalie
6
vues

0
téléchargements
Cet article porte sur l’activisme environnemental et les usages du numérique. Le cas de la controverse autour du projet EuropaCity en périphérie parisienne s’appuie une analyse de l’usage du réseau social Twitter. Le corpus de données collecté et analysé correspond au hashtag de la controverse, #EuropaCity, ainsi qu’aux profils des acteurs principaux du débat sur la plateforme. Les résultats permettent d’établir une cartographie d’un débat qui peine à s’instaurer en ligne. Plus spécifiquement il s’agit d’observer l’évolution dans le temps du débat, par la distribution temporelle des tweets et son articulation à l’actualité des mobilisations, de l’évolution du projet et des moments du débat public. Une attention est aussi portée aux principaux acteurs impliqués dans la controverse et à leurs registres d’action au travers de l’importance prise par la controverse EuropaCity dans leurs communications et actions, leurs proximités et éventuelles mise en réseau, leurs interactions, leurs modes d’expression et bien sûr le contenu des tweets.

25
vues

25
téléchargements
Le développement des technologies numériques engendre une longue et profonde mutation de notre rapport à la connaissance. Quelle que soit l’étiquette utilisée pour désigner ce phénomène, de nombreuses personnes s’interrogent sur les évolutions de nos pratiques académiques (Lazer et al 2009, Ollion & Bollaert 2016). Explorer les parties pour construire les touts Latour et al avancent en 2012 que de nouvelles façons de représenter et surtout de naviguer dans les données permettraient de revenir sur le rapport entre tout et partie, débat aussi vieux que la sociologie elle-même (Latour 2012). D’après ces auteurs, chaque tout n’est qu’une façon particulière de voir les parties, un trait commun qui rassemble. Un trait parmi d’autres. Le tout est une prise tellement utile, tellement signifiante qu’on en oublie qu’il cache une réduction d’une foule de particularités. Or ce tout peut aujourd’hui être décomposé ou plutôt recomposé dynamiquement dans de nouveaux moyens d’exploration des données appelés Datascapes - autrement dit paysages de données. Reprenant ces intentions, nous avons depuis 2012 conçu des outils d’analyse exploratoire de données (Tukey 1977) qui permettent de multiplier les perspectives sur un même objet.

4
vues

0
téléchargements
Hyphe, a web crawler for social scientists developed by the SciencesPo médialab, introduced the novel concept of web entities to provide a flexible and evolutive way of grouping web pages in situations where the notion of website is not relevant enough (either too large, for instance with Twitter accounts, newspaper articles or Wikipedia pages, or too constrained to group together multiple domains or TLDs...). This comes with technical challenges since indexing a graph of linked web entities as a dynamic layer based on a large number of URLs is not as straightforward as it may seem. We aim at providing the graph community with some feedback about the design of an on-file index - part Graph, part Trie - named the "Traph", to solve this peculiar use-case. Additionally we propose to retrace the path we followed, from an old Lucene index, to our experiments with Neo4j, and lastly to our conclusion that we needed to develop our own data structure in order to be able to scale up.

1
vues

0
téléchargements
Le web c’est grand, surtout vers le fond. Et ce n’est pas très organisé, même si ce n’est pas non plus le chaos. Quelle est la structure du web, et comment s’y orienter ? Question plus difficile encore, comment trouver et identifier l’information pertinente sans amasser de téraoctets inutiles ? Le web nous oppose des défis à la fois méthodologiques et technologiques. Le médialab de Sciences Po a développé HYPHE, un robot amasseur de données web aussi appelé «crawler», ajusté aux besoins de la recherche en sciences sociales. Il s’adresse aux sociologues qui veulent investiguer le web comme terrain d’enquête qualitative et en tirer des indicateurs quantitatifs. S’appuyant sur le modèle du web «en couches», il guide son utilisateur pour construire, itération après itération, un corpus de ressources et/ou d’acteurs. Le travail manuel de sélection et de qualification de l’information est récompensé par un réseau de ressources que l’on peut exploiter de différentes manières: en analysant sa topologie avec GEPHI, en exportant ses textes vers un logiciel de traitement du langage, ou encore en construisant un moteur de recherche dédié. Le médialab vous propose une présentation de ce logiciel libre et open source, et une initiation à ses principaux concepts. Des exemples tirés des travaux des chercheurs l’ayant utilisé illustreront ses possibilités. Une démo de HYPHE est également disponible en ligne - hyphe.medialab.sciences-po.fr

We defined this website as a datascape (Latour and al., 2012). A datascape is a tool that allows exploring a dataset from different levels of aggregation and different points of view related to the attributes of each element of the corpus. The philosophy of this datascape is to always be able to qualify actors (web entities) and the terms of potential controversies (topics and text content of pages). To do this we have designed a tool that allows following the links between web entities, their pages and associated topics. We have also included two visualization tools, a graph to locate web entities, and a matrix to explore links between topics.

Publié en 2017
COLOMBO Gabriele
MEUNIER Axel
BRILLI Agata
15
vues

15
téléchargements
The reconciliation of nature and the urban space is worldwide considered among the smart solutions to a growing range of issues created by urban growth. But there is no agreement on the imaginaries and technical practices that should be included into the new urban nature. To address the specific case of the city Paris and its big re-naturation project, to observe, monitor and, eventually, produce elements of reflections for future urban policies, in the NATURPRADI project has been conducted a Digital Methods campaign. It is aimed at mapping the symbolic and material elements of the urban nature debate by asking specific research questions: Which images, discourses and practices narrate urban nature? by whom and what are they sustained?

Publié en 2015-10
PEDROJA Cynthia
ANSART Thomas
MITRANO Patrice
MUNK Anders Kristian
4
vues

0
téléchargements
Les images du médialab et de l'atelier de cartographie se rencontrent et dialoguent dans les vitrines de la bibliothèque. Retrouvez les textes et téléchargez les images qui vous ont marqué.

in The Routledge Handbook to Developments in Digital Journalism Studies Sous la direction de ELDRIDGE II Scott Publié en 2018-08
BOUNEGRU Liliana
GRAY Jonathan
11
vues

0
téléchargements
Networks are classic but under-acknowledged figures of journalistic storytelling. Who is connected to whom and by which means? Which organizations receive support from which others? What resources or information circulate through which channels and which intermediaries enable and regulate their flows? These are all customary stories and lines of inquiry in journalism and they all have to do with networks. Additionally, the recent spread of digital media has increasingly confronted journalists with information coming not only in the traditional form of statistic tables, but also of relational databases. Yet, journalists have so far made little use of the analytical resources offered by networks. To address this problem in this chapter we examine how “visual network exploration” may be brought to bear in the context of data journalism in order to explore, narrate and make sense of large and complex relational datasets. We borrow the more familiar vocabulary of geographical maps to show how key graphical variables such as position, size and hue can be used to interpret and characterise graph structures and properties. We illustrate this technique by taking as a starting point a recent example from journalism, namely a catalogue of French information sources compiled by Le Monde’s The Decodex. We establish that good visual exploration of networks is an iterative process where practices to demarcate categories and territories are entangled and mutually constitutive. To enrich investigation we suggest ways in which the insights of the visual exploration of networks can be supplemented with simple calculations and statistics of distributions of nodes and links across the network. We conclude with reflection on the knowledge-making capacities of this technique and how these compare to the insights and instruments that journalists have used in the Decodex project – suggesting that visual network exploration is a fertile area for further exploration and collaborations between data journalists and digital researchers.

38
vues

0
téléchargements
This paper discusses the differences and affinities among three types of networks (namely Actor-?Network, Network Analysis and Digital Networks) that are playing an increasingly important role in digital STS. In the last few decades, the idea of ‘network’ has slowly but steadily colonized broad strands of STS research. This colonization started with the advent of actor-?network theory, which provided a convenient set of notions to describe the construction of socio-?technical phenomena. Then came network analysis, and scholars who imported in the STS the techniques of investigation and visualization developed in the tradition of social network analysis and scientometrics. Finally, with the increasing ‘computerization’ of STS, scholars turned their attention to digital networks a way of tracing collective life. Many researchers have more or less explicitly tried to link these three movements in one coherent set of digital methods for STS, betting on the idea that actor-?network theory can be operationalized through network analysis thanks to the data provided by digital networks. Yet, to be honest, little proves the continuity among these three objects besides the homonymy of the word ‘network’. Are we sure that we are talking about the same networks? "Odi

L’objectif de cette note est de proposer un nouvel outil méthodologique en complément de celui des sondages afin de renforcer la fiabilité de la connaissance de l’opinion publique. Il s’agit d’un logiciel de cartographie web appelé Hyphe à partir duquel il est possible de collecter des opinions exprimées sur internet autour d’un objet d’étude défini par le chercheur ou par le sondeur. Le corpus obtenu peut être visualisé sous la forme d’un réseau web faisant apparaître les liens entre différentes entités numériques (qui peuvent être des pages, des sous-domaines ou des combinaisons de sites etc.) du réseau ainsi reconstitué.

Nous proposons dans cette communication de présenter les principes et étapes de développement de production du datascape (corpus et interface d'exploration visuelle), ainsi que les contraintes et limites rencontrées dans l'application de cette méthode d'exploration de données pour la recherche. L'outil développé permet d'explorer le corpus de données à partir de trois entrées distinctes (acteurs web, texte des pages web, thèmes identifiés par les topics) et de basculer entre ces entrées. Il est fondé sur deux principes de navigation. Un premier principe que l'on pourrait qualifier de vertical, qui vise à passer du « tout » vers « les parties », c'est à dire du réseau complet aux web entités, puis aux pages web, mais également des topics, aux termes qui les constituent. De plus, il permet de dépasser cette fonction de zoom dans les données (Boullier et al, 2016) en offrant un second principe de navigation horizontale. Le datascape est conçue pour circuler, à chaque étape de la navigation, entre les différents attributs des données du corpus, des acteurs aux documents, et des documents aux topics.

Publié sous la forme d’un logiciel libre, Hyphe a été conçu pour offrir aux chercheurs et étudiants un outil de création et nettoyage de corpus web reposant sur un crawler orienté pour la recherche. Les utilisateurs sont accompagnés par une méthodologie pour construire leur corpus web de manière à la fois granulaire et flexible avec des principes de curation simples. La séance proposera tout d'abord une présentation générale de la méthode et de l'outil, ainsi qu'un cas d'usage de Hyphe. Le cas présenté sera la création d'un "datascape" dans le cadre d'un projet réalisé au médialab entre 2015 et 2017 ayant consisté en la réalisation d'une interface d'exploration d'un corpus Hyphe pour l'analyse quali-quanti de controverses autour des enjeux de data privacy. Dans un second temps il sera proposé aux participants d'essayer Hyphe concrètement lors d'un atelier pratique. Les participants sont invités à venir équipés d'un ordinateur portable pour pouvoir prendre en main le logiciel durant cet atelier.

Suivant