Full Text
  • No (141)
  • Yes (61)
Document Type
  • Conference contribution (53)
  • Article (47)
  • Part or chapter of a book (25)
  • Web site (15)
  • Show more
Research Center
  • Médialab (194)
  • médialab (MEDIALAB) (9)
  • Ecole polytechnique fédérale de Lausanne (EPFL) (7)
  • Centre d'histoire de Sciences Po (7)
  • Show more
Discipline
  • Sociology (91)
  • Library and information sciences (59)
  • Methods and statistics (57)
  • Web (39)
  • Show more
Language
  • English (114)
  • French (91)
  • Spanish (2)
  • Portuguese (2)
  • Show more
Cette communication reprend un texte d’orientation, publié par Dominique Boullier, pour des sciences humaines et sociales de troisième génération qui assumeraient le caractère spécifique du monde de données créé par le numérique en réseaux, sans le rabattre sur les sciences de la société ou les sciences de l’opinion (ni de l’économie, ni de l’individu). Toutes ces entités ont émergé dans des situations politiques, institutionnelles et techniques spécifiques, le Big Data fait émerger un autre monde, qui, pour l’instant, n’est pris en compte que par des agences spécialisées dans le traitement de masse de ces données pour produire des corrélations à potentiel prédictif. Le risque existe que les SHS soient disqualifiées durablement pour exploiter ces données et pour produire la réflexivité qui a constitué jusqu’ici leur raison d’être.

in Scientometrics Publication date 2017-11
RAINHO BRÁS Oriana
DAVID Leonor
ARRISCADO NUNES João
CARDOSO Fátima
JERÓNIMO Carmen
0
views

0
downloads
This paper analyses the developmental dynamics of oncology research in Portugal during the second half of the twentieth century and early twenty first century. Grounding its conclusions in a scientometric analysis of a database of publications covering the period 1976–2015, the paper shows how the expansion of oncology research from the end of the 1990s through the 2000s is closely related to science and technology policy decisions in the country. The main actors of the institutional evolution of the field are public organizations, both hospital and academia/research-based, frequently working together. Portuguese oncology research focused especially on organ-based cancers, underlining the strong link between the laboratory and the clinic. Accordingly, translational research is a major trend in oncology research, as evidenced by the analysis of publications in major journals and inter-citation maps. Net...

10
views

0
downloads
France started to compile statistics about its trade in 1716. The "Bureau de la Balance du Commerce" (Balance of Trade's Office) centralized local reports of imports/exports by commodities produced by french tax regions. Many statistical manuscript volumes produced by this process have been preserved in French archives. This communication will relate how and why we used network technologies to create a research instrument based on the transcriptions of those archives in the TOFLIT18 research project. Our corpus composed of more than 500k yearly trade transactions of one commodity between a French local tax region or a foreign country between 1718 and 1838. We used a graph database to modelize it as a trade network where trade flows are edges between trade partners. We will explain why we had to design a classification system to reduce the heterogeneity of the commodity names and how such a system introduce the need for hyperedges. Our research instruments aiming at providing exploratory data analysis means to researchers, we will present the web application we've built on top of the neo4j database using JavaScript technologies (Decypher, Express, React, Baobab, SigmaJS). We will finally show how graph model was not only a convenient way to store and query our data but also a poweful visual object to explore trade geographical structures and trade products' specialization patterns. Project funded by the French Agence Nationale de la Recherche (TOFLIT18)

3
views

0
downloads
Les livres qui s’entassent dans votre bibliothèque sont-ils encore vivants ? Pourquoi les garder s’ils ne le sont plus ? Pourquoi l’attachement au livre imprimé ne se dément-il pas à l’heure du livre numérique ? Nous avons observé pendant plusieurs années tous les échanges auxquels les livres donnaient lieu, en ligne et hors ligne et la vitalité de ces livres imprimés (technique vieille de plus de 500 ans !) à travers 150 entretiens de lecteurs, libraires, éditeurs, blogueurs, bibliothécaires, 25 observations participantes, 750 réponses à un questionnaire en ligne et 5 000 sites francophones cartographiés – nous a impressionnés. Oui, votre livre continue de vivre tout en restant dans votre bibliothèque car vous en parlez, vous vous en souvenez, vous y faites référence. Mieux même, vous l’avez prêté à une amie pour qu’elle le lise, vous êtes allés voir ceux qui en parlaient avant de l’acheter ou après l’avoir lu, les critiques professionnels, certes, mais aussi les blogueurs. La conversation continue quand bien même le livre ne circule plus.

in Poetics Publication date 2018-02
BEARMAN Peter
BRANDT Philipp
HOFFMAN Mark Anthony
NEWTON Key, Department Of History
2
views

0
downloads
Using co-occurrence methods for identifying semantic structure in texts, we first describe the structure of the Protestant Bible, focusing on the ways in which contents of the Bible are organized in both the New and Old Testaments. We introduce a strategy for capturing the co-occurrence of nouns and verbs in windows defined by verses that progressively move across the text, from start to finish in a manner similar to reading. We then consider how Dissenters and Conformists used the Bible by locating Biblical verse in sermons printed in England during the period from 1660 to 1780. We describe how chapters are linked by themes over time, by dissenting and conformist religious communities, and map Dissenter and Conformist uses of the Bible onto its semantic structure. We show that it is possible to induce a semantic network image of the Bible, that this structure serves as a skeletal frame for interpretation, thereby highlighting different contents as central to denominations’ religious inspirations and concerns.

Since its foundation in May 2009, the médialab Sciences Po works to foster the use of digital methods and tools in social sciences. With the help of existing tools and methods, we experienced the use of web mining techniques to extract data on collective phenomena. We also attended the symposiums organised by the two institutions responsible of web archiving in France: BnF and INA where we learnt about the difficulties posed to social scientists by the use of web archives. Actually our own experience in mining the live web wasn’t easier. Such difficulties, we believe, can be explained by the lack of tools allowing scholars to build themselves the highly specialized corpora they need from the wide heterogeneity of the web. The web isn’t a well-known document space for scholars or librarians. Its hyperlinked and heterogeneous nature requires to envision new ways of conceiving and building web corpora. And this notion of web corpus is a necessity for both live and archived web. If methods are not appropriate enough for analysing the live web, the problem will not be easier on an archive where the time dimension adds complexity.

Publication date 2011-07
DIMINESCU Dana
BOURGEOIS Mehdi
RENAULT Matthieu
3
views

0
downloads

Publication date 2015-01
PLIQUE Guillaume
GUIDO Daniele
11
views

0
downloads
Bruno Latour wrote a book about philosophy (an inquiry into modes of existence). He decided that the paper book was no place for the numerous footnotes, documentation or glossary, instead giving access to all this information surrounding the book through a web application which would present itself as a reading companion. He also offered to the community of readers to submit their contributions to his inquiry by writing new documents to be added to the platform. The first version of our web application was built on PHP Yiii and MySQL on the server side. This soon proved to be a nightmare to maintain because of the ultra-relational nature of our data. We refactored it completely to use node.js and Neo4J. We went from a tree system with internal links modelized inside a relational database to a graph of paragraphs included into documents, subchapters etc. all sharing links between them. On the way, we've learned Neo4J thoroughly, from graph data modeling to cypher tricks and developped our custom cypher query graphical monitor using sigma.js in order to check our data trans-modeling consistency. During this journey, we've stumbled upon data model questions : ordered links, sub items grouping necessity, data output constraints from Neo4J, and finally the limitations of Neo4J community edition. Finally we feel much more confortable as developers in our new system. Reasoning about our data has become much easier and, moreover, our users are also happier since the platform's performance has never been better. Our intention is, therefore, to share our experience with the community: - our application's data needs - our shift from a MySQL data model to a Neo4J graph model - our feedbacks in using a graph database and more precisely Neo4J including our custom admin tool [Agent Smith](https://github.com/Yomguithereal/agent-smith) - a very quick description of the admin tools we built to let the researchers write or modify contents (a markdown web editor) The research has received funding from the European Research Council under the European Union’s Seventh Framework Programme (FP7/2007-2013) / erc Grant ‘IDEAS’ 2010 n° 269567” Authors : Guillaume Plique A graduate student from Sciences-Po Lille and Waseda University, Guillaume Plique now offers the médialab his backend development skills as well as his profile in social sciences. He has been working since June 2013 on several projects such as IPCC mapping, AIME and develops scrapers aimed at social sciences researchers. https://github.com/Yomguithereal Paul Girard Paul Girard is an Information Technology engineer specialized in driving collaborations between technology and non-technical domains. He graduated from the cultural industry engineering specialisation in Université de Technologie de Compiègne in 2004 where he studied the relationships between digital technologies and society and the mechanisms of collaborations. He worked in the research laboratories federation CITU (Paris 1 and Paris 8 universities) from 2005 to 2009 where he participated in research and creation projects, collaborations between artists and engineers working with interactivity, digital pictures, virtual and augmented reality. He joined the médialab laboratory at Sciences Po at its foundation during the spring of 2009, as the digital manager of this digital research laboratory dedicated to fostering the use of digital methods and tools in Social Sciences. Since then he oversees the technical direction of the many research projects as collaborations between social sciences, knowledge engineering and information design. His present research fields are digital methods for social sciences, exploratory data analysis and enhanced publication though digital story telling. https://github.com/paulgirard Daniele Guido Daniele Guido is a visual interaction designer interested in data mining applications, text analysis and network tools. He collaborates with researchers in History and Social Science, designers and engineer to conceive and develop digital tools for the humanities. He recently joined the DIgital Humanities lab at CVCE team in Luxembourg after several years working at the Sciences-Po Medialab team in Paris, where he was engaged in the FORCCAST project (forccast.hypotheses.org) and in the AIME project (modesofexistence.org) https://github.com/danieleguido

Publication date 2010
1
views

0
downloads
A python library to exchange webcorpus format

68
views

68
downloads
Un rattachement ou une formation disciplinaire, pas plus que la relation à des espaces de travail et des instruments spécialisés, ne suffisent seuls à définir une culture scientifique. Ce sur quoi des chercheurs issus d’horizons divers travaillent, construit un mode singulier de conception de leurs activités, pratiques et rapport au monde. Leur réussite est irrémédiablement liée à un sujet, à la fortune que rencontre celui-ci comme innovation dans un contexte social qui le borne et qu’il crée simultanément. Comment s’organise cette (re)conversion vers une nouvelle thématique, alors que l’évolution des modes de financement privilégie aujourd’hui précisément ce cadrage ? Cette thèse propose une enquête sur la notion de « domaine de recherche », que nous définissons a priori comme le cadre des interactions entre l’activité professionnelle de chercheurs et la société autour d’un thème partagé ; elle défend sa dimension épistémique. Ce manuscrit décrit en parallèle le développement des bioénergies, une des principales formes d’énergie dites renouvelables ou encore durables, issue de la biomasse, ses acteurs et leurs jeux d’actions, dans un contexte de forte incitation à conduire une transition énergétique globale, mais aussi de controverses sociales vives. Les deux objectifs de cette thèse convergent : décrire le style de pensée inhérent à un domaine de recherche particulier est nécessaire à l’appréhension, au-delà des seuls discours et promesses, des modes effectifs de développement d’une innovation (ici la mobilisation à grande échelle de végétaux, microorganismes ou déchets pour produire des biocarburants) et donc in fine, à l’évaluation par tout un chacun, de sa pertinence.

in COGITO, research newletter Publication date 2018-11
3
views

0
downloads
In a study of sermons made by English preachers in the 17th and 18th centuries, medialab researcher Jean-Philippe Cointet and four sociologists and historians from American and German universities mapped biblical references used by priests from Anglican and dissident churches*. This work, presented in a Poetics journal article entitled “The (Protestant) Bible, the (printed) sermon, and the word(s): The semantic structure of the Conformist and Dissenting Bible, 1660–1780”, sheds lights on a whole swath of the history of faiths, and is notable for deploying new methods of textual analysis based on the quantitative and qualitative processing of empirical data. Awarded a prize from the American Sociological Association, this study is representative of a recent research trend in the humanities and social sciences: computational hermeneutics, which analyze and interpret cultural phenomena by drawing on quantitative methods and empirical data. (First paragraph)

Les deux tiers de l’humanité sont désormais connectés à un téléphone portable. Il fait converger dans un dispositif technique unique, un ensemble d'objets qui équipaient les personnes dans la gestion quotidienne de leurs identités, de leurs mondes sociaux et de leurs activités (téléphone, cartes de crédits, cartes d’acces diverses, clés, agenda, etc.). Le concept d’ « habitele »1 permet de décrire cette nouvelle enveloppe de données personnelles qui permet aux utilisateurs de maintenir les connexions avec leurs univers sociaux. Pour valider ces hypotheses sur les composants de l'habitele, et en particulier sur cette possibilité inédite de basculer instantanément entre univers sociaux, nous avons réalisé une enquête internationale quali-quantitative composée de deux entretiens successifs aupres de 522 personnes dans 8 pays à travers le monde, en exploitant les données directement extraites de leur téléphone mobile. Notre communication analysera deux étapes centrales de notre protocole, riches en enseignements pour le travail d'enquête sociologique sur ce type de données. D'une part, l'extraction semi- automatisée de données sur différents types de mobiles via un logiciel propriétaire destiné aux enquêtes judiciaires, d'autre part, le design d'une interface de visualisation pour confronter les utilisateurs à leurs réseaux et traces d'activité mobile (autoconfrontation). En effet, si des méthodes d'extraction de données mobile sont utilisées par certains instituts de sondages, elles quantifient uniquement l'usage des applications sur smartphone dans des logiques marketing. Afin de capter la diversité des mondes sociaux, il nous fallait adopter un systeme capable d’extraire l'ensemble des données, y compris celles du répertoire, sur tout type de mobile. Ce choix s'est révélé être un défi sur le plan technique, étant donné la variété des modeles et des systemes d'exploitation (5200 modeles existants), sur le plan éthique, quant au respect de la vie privée et à la sécurisation des données, et également sur le plan méthodologique, du fait du travail d'uniformisation des données issues d'une variété de formats, de pays et de types de mobiles (base de 522 utilisateurs pour 1653 variables). La production d'une interface de visualisation de ces données a permis de confronter les enquêtés à leurs propres traces d'activité (timeline des communications, réseaux sociaux dans le journal des appels et des sms, usage du calendrier et d'autres applications, etc.) et d'articuler des méthodes d'enquête qualitative avec des traitements de données quantitatives. Cette interface s'est révélée être un outil performant pour faire parler les enquêtés sur leur activité quotidienne de communication, leur gestion des identités numériques, mais également pour faire exprimer les catégorisations ordinaires mobilisées pour définir leurs réseaux d'appartenance. Cela nous a permis de valider, en la limitant cependant, notre hypothese de l'habitele comme abri pour le basculement entre mondes sociaux.

Publication date 2018-03
8
views

0
downloads
Les livres, comme les chats, auraient neuf vies. Leur passage en librairie dure quelques semaines, mais une autre vie commence dans les mains des lecteurs et des lectrices. Aimer un livre, c'est le prêter, l'offrir, le recommander, en parler, le commenter sur son blog, le présenter sur YouTube ou dans un cercle de lecture, et puis le poser sur un rayonnage ou le laisser quelque part, en quête d'une autre vie. Au travers des témoignages de lecteurs-échangeurs, se dessine tout un panorama des usages du livre, et des changements provoqués par internet et le livre numérique. Le livre-échange met en lumière une écologie de la lecture, dans toute la diversité des pratiques. (résumé éditeur)

in Revue française de science politique Publication date 2015-10
16
views

16
downloads
Une troisième génération de sciences sociales doit voir le jour pour assumer la spécificité du monde de don-nées et de traces créées par les réseaux numériques, sans se contenter de prolonger les acquis des sciences de la « société » et de l'« opinion ». Ces entités ont été construites dans une époque précise dont la généa-logie est restituée pour être comparée avec le travail des agences qui exploitent les traces numériques et qui peuvent produire toute la réflexivité nécessaire en devenant prédictives. Il est proposé de penser les traces numériques en tant que « répliques » que les sciences sociales doivent suivre avec des méthodes adaptées car elles constituent désormais un nouveau continent du social.

Publication date 2017-09
PLIQUE Guillaume
CHARLES Loïc
JACOMY Alexis
TIBLE Grégory
1
views

0
downloads
TOFLIT18 is a project dedicated to French trade statistics from 1716 to 1821. It combines a historical trade database that covers French external trade comprising more than 500,000 flows at the level of partners and individual products with a range of tools that allow the exploration of the material world of the Early Modern period. TOFLIT18 is the result of the collaboration of data scientists, economists and historians. It started as a project funded by the Agence Nationale de la Recherche in 2014. http://toflit18.hypotheses.org

in Actes des 23èmes Journées francophones d'Ingénierie des Connaissances (IC 2012) Publication date 2012-06-25
DECLERCK Gunnar
AIMÉ Xavier
CHARLET Jean
2
views

0
downloads
Ce texte se propose de discuter l'idée que les ontologies fondationnelles sont utiles, voire nécessaires, au bon fonctionnement des systèmes de traitement de contenus, en particulier à leur interopérabilité sémantique. Après un rappel des principales caractéristiques des ontologies, nous proposerons une liste des grandes fonctions aujourd'hui attribuées ou au moins attendues des OF, pour en discuter ensuite le bien-fondé. Nous montrerons que la possibilité de réaliser une ontologie intégrant des primitives et définitions formelles suffisamment générales et génériques (universelles) pour décrire la sémantique des concepts de domaines spécialisés du savoir est loin d'être acquise ; et que (ii) même si une telle ontologie s'avérait réalisable, il n'est pas certain qu'elle permettrait d'assurer l'IS entre systèmes, c'est-à-dire un échange de données en préservant le sens.

in Le Monde Publication date 2012-02-03
OOGHE Benjamin
LAROUSSERIE David
3
views

0
downloads

Publication date 2012
LECLERCQ Christophe
GUIDO Daniele
5
views

0
downloads
Experiments in Art and Technology (E.A.T.) is a renowned example of interdisciplinarity at the intersection of Art, Science and Technology, conceived by Rauschenberg, a co-founder of E.A.T., as a « map of engineers, money and equipment », facilitating collaborations between artist, engineer and industry. Despite the amount of information available, E.A.T.’s production and legacy remains unclear. The project, in collaboration with E.A.T. (represented by Julie Martin), is based on the organization’s numerous activities, developed in art and non-art contexts, including realized and unrealized works and projects from the 1960s to the present day. through a ‘datascape’. In the first place, the aim is to describe as extensively as possible the stories of works of art or projects, from their design and development stages to their different exhibitions and receptions. One of the main challenges is to produce a digital archive displaying the process of collaboration, not merely catalogue E.A.T.’s productions. Secondly, the archive will map these works and projects as networks of people, organizations, places and technologies, so as to better understand E.A.T.’s identity using the theories of Science and Technology Studies. The aim is to develop an online archive built as a research tool for humanities scholars in art and social art history. Their work, mapping the material in the archive, will provide the project’s added value; historical documents combined into information networks, revealed by various visualizations, will make of the archive a veritable exploratory tool.

Publication date 2012-05
LECLERCQ Christophe
GUIDO Daniele
2
views

0
downloads

20
views

20
downloads
Le développement des technologies numériques engendre une longue et profonde mutation de notre rapport à la connaissance. Quelle que soit l’étiquette utilisée pour désigner ce phénomène, de nombreuses personnes s’interrogent sur les évolutions de nos pratiques académiques (Lazer et al 2009, Ollion & Bollaert 2016). Explorer les parties pour construire les touts Latour et al avancent en 2012 que de nouvelles façons de représenter et surtout de naviguer dans les données permettraient de revenir sur le rapport entre tout et partie, débat aussi vieux que la sociologie elle-même (Latour 2012). D’après ces auteurs, chaque tout n’est qu’une façon particulière de voir les parties, un trait commun qui rassemble. Un trait parmi d’autres. Le tout est une prise tellement utile, tellement signifiante qu’on en oublie qu’il cache une réduction d’une foule de particularités. Or ce tout peut aujourd’hui être décomposé ou plutôt recomposé dynamiquement dans de nouveaux moyens d’exploration des données appelés Datascapes - autrement dit paysages de données. Reprenant ces intentions, nous avons depuis 2012 conçu des outils d’analyse exploratoire de données (Tukey 1977) qui permettent de multiplier les perspectives sur un même objet.

The RICardo website (http://ricardo.medialab.sciences-po.fr) provides interactive data visualizations to explore 19th century World International Trade. This exploratory data analysis tool aims at letting scholars discover the richness but complexity of this dataset by providing : 1- a documentation under the form of an interactive data visualization tool which reveals the heterogeneity of the dataset that compiles archives from different sources through a century; 2- a progressive exploration path from the more aggregated to the most precise view: world total trade, specific country bilateral trade, pair of trade partners mirror flows discrepancies; 3- a custom graphic semiology which emphasizes the data uncertainty of the dataset. RICardo is meant for studying and discovering the history of trade and trade globalization at three level of details and with the possibility to focus on some specific country or areas by only using a web browser.

Publication date 2016-07
TIBLE Grégory
DU Mengying
0
views

0
downloads
RICardo (Research on International Commerce) est un projet dédié au commerce entre nations sur une période allant des débuts de la Révolution industrielle à la veille de la Seconde Guerre mondiale. Il allie une base historique de données commerciales couvrant tous les pays du monde à un site web qui propose une exploration de l’histoire du commerce international à partir de visualisations.

Notion centrale de la recherche en SHS, le corpus voit ses contours redéfinis alors que les éléments qui le constituent sont aujourd’hui le plus souvent des contenus ou données issus du web. Quelles sont les possibilités offertes par le contexte numérique, pour constituer et traiter des corpus, les méthodes de recueil de données et d’observation en sont-elles modifiées ? La taille et la dimension de représentativité d’un corpus sont-elle revisitées quand les données accessibles s’inscrivent dans des flux et se mesurent en Giga ou Tera octets, quelles unités retenir quand les données sont hétérogènes et instables ? Quels sont les instruments à disposition du chercheur pour constituer, traiter et analyser ces corpus ?

14
views

0
downloads
Dans un contexte de division autour de la réforme constitutionnelle qui pose la question de son rôle, le Parlement a ouvert une commission d’enquête suite à l’affaire Benalla. Si Emmanuel Macron a souvent réaffirmé leur importance, qu'en est-il du pouvoir d'agir des parlementaires ?

A partir du cas du web du livre en France, cet article interroge la notion de zoom dans l’exploration visuelle de réseaux. En soumettant un graphe à des questionnements et traitements successifs, il devient possible de comprendre ce qui apparaît comme une anomalie pour le chercheur, un entrelacement sur le plan visuel de deux communautés pourtant distinctes du point de vue des catégories et de l’algorithme de modularité. En appliquant ces différentes épreuves au graphe apparaît la variété des algorithmes de spatialisation et de clusterisation, les limites des notions de zoom, de découpage et d’exploration des réseaux, toutes métaphores spatiales peu pertinentes. Cette démarche plaide pour des conventions d’exploration qui assurent la robustesse de l’exploitation de ce type de données.

Next