Auteurs Centres de recherche Disciplines et Collections Projets
Français English
 
 

A Brief History of Human Time Exploring a database of “notable people”

 

Notice

Type:   Working paper
 
Titre:   A Brief History of Human Time Exploring a database of “notable people”
 
Auteur(s):   Laouénan, Morgane - Sciences Po (Auteur)
Wasmer, Etienne (1970-...) - Département d'économie (Auteur)
Gergaud, Olivier - KEDGE Business School [Talence] (Auteur)
 
Date de publication:   2016-02
 
Éditeur:   Paris  :  Laboratory for Interdisciplinary Evaluation of Public Policies
 
Collection:   LIEPP Working Paper  :  46
 
Résumé:   [fr] L’article de Morgane Laouenan, Etienne Wasmer et Olivier Gergaud est le fruit d’un travail de près de deux ans réalisé au LIEPP (Laboratoire Interdisciplinaire d’Evaluation des Politiques Publiques) à Sciences Po. Les auteurs ont collecté et analysé des données de 1 243 776 personnages notables (notable people) et 7 184 575 lieux mentionnés dans leur notice Wikipedia. La base de données couvre au total un peu plus de 5000 ans d'histoire de l'Humanité de 3000 avant JC jusqu’en 2015. L’article décrit en détail la méthodologie et les procédures d’extraction de l’information pertinente à partir de la base communautaire Freebase recensant des individus et en appariant de façon automatique ces informations à des pages Wikipedia et ensuite analyse la base. Dix faits principaux émergent. (1). Il y a une croissance exponentielle de la base, avec plus de 60% de personnalités encore en vie en 2015, à l’exception d’un déclin relatif des cohortes nées au XVIIe siècle avec un minimum entre 1645 et 1655. (2). La durée de vie de ces personnages a augmenté de 20 ans environ, de 60 ans jusqu’à un peu moins de 80 ans, entre les cohortes nées en 1400 après JC et celles nées en 1900. (3). La part des femmes dans la base présente une forme en U, avec un minimum aux alentours du XVIIe siècle et atteint 25% pour les cohortes les plus récentes. (4). La part des personnages dans la catégorie Gouvernance (politique, religieux, militaire, noblesse) a diminué au cours du temps et la part dans les activités artistiques, littéraires, media et sport a augmenté au cours des siècles; le sport a rattrapé la catégorie arts/littérature/media pour les cohortes nées en 1870 et est ensuite resté au même niveau jusqu’aux cohortes nées en 1950; puis la catégorie « sport » domine la base de données après 1950. (5). Les 10 personnalités les plus visibles nées avant 1890 sont toutes non-américaines; toutes sont de nationalités différentes. En revanche, six des 10 personnalités nées après 1890 sont des citoyens américains. Depuis 1800, la part des personnages nés en Europe et aux Etats-Unis diminue et le nombre de personnes d’Asie et de l’hémisphère Sud augmente pour atteindre 20% de la base en 2000. Le barycentre (centre de gravité) de la base se situait entre la Grèce et la Turquie entre 2000 avant JC et 500 après JC, puis se déplace vers l’Ouest. Ce même centre se retrouve dans le Nord-Est de la France entre 1500 et 1700. Par une coïncidence amusante, en 1637 (l’année du “Discours de la Raison de René Descartes, le centre géographique exact de la base se situe sur l'actuelle départementale 233 à proximité de Colombey-les-Deux-Eglises en Champagne, le village où Charles de Gaulle vécut et décéda. Avec le peuplement de l’Amérique du Nord, le centre se déplace ensuite vers l’Atlantique au 18e siècle et revient enfin vers l’Afrique du Nord, avec l’émergence de l’Asie et du Sud. (6). La distance moyenne entre le lieu de naissance et celui de décès suit une courbe en U également: la distance moyenne était de 316km avant l’année 500 après JC, de 100km entre 500 and 1500, et a augmenté continuellement depuis. La plus grande part de cette distance est franchie entre l’âge de 15 ans et de 25 ans. (7). Les individus les plus visibles sont les plus distants de leur lieu de naissance, avec une distance médiane de 785km pour le 1% des individus de l’histoire les plus visibles, à comparer avec 389km pour les 10% les plus visibles et 176km pour l’ensemble de ces personnages. (8). Dans toutes les activités, on observe une augmentation de la mobilité internationale depuis 1960. La part des lieux visités situés dans un pays différent du pays de naissance est passée de 15% en 1955 à 35% après 2000. (9). Il n’y a pas de corrélation positive entre la taille des villes et la visibilité des individus mesurée en 2015. Cette corrélation serait plutôt négative. (10). Enfin, sur la période 1800-1939 analysée dans cette version 1.0 du texte, il existe une corrélation positive et stable entre le nombre d’entrepreneurs à une date donnée et la croissance urbaine de la ville où ils sont localisés au cours de la décennie suivante ; de façon peut-être moins attendue, c’est également vrai du nombre d’artistes à une date donnée qui affecte la croissance les années suivantes; en revanche, on trouve une corrélation nulle ou négative entre le nombre de « gouvernants » (politiques, militaires, religieux et noblesse) et la croissance des décennies suivantes. -- Plus sur les auteurs et leur travail ici : http://brief-history.eu/

[en] This paper describes a database of 1,243,776 notable people and 7,184,575 locations (Geolinks) associated with them throughout human history (3000BCE-2015AD). We first describe in details the various approaches and procedures adopted to extract the relevant information from their Wikipedia biographies and then analyze the database. Ten main facts emerge. (1) There has been an exponential growth over time of the database, with more than 60% of notable people still living in 2015, with the exception of a relative decline of the cohort born in the XVIIth century and a local minimum between 1645 and 1655. (2) The average lifespan has increased by 20 years, from 60 to 80 years, between the cohort born in 1400AD and the one born in 1900AD. (3) The share of women in the database follows a U-shape pattern, with a minimum in the XVIIth century and a maximum at 25% for the most recent cohorts. (4) The fraction of notable people in governance occupations has decreased while the fraction in occupations such as arts, literature/media and sports has increased over the centuries; sports caught up to arts and literature for cohorts born in 1870 but remained at the same level until the 1950s cohorts; and eventually sports came to dominate the database after 1950. (5) The top 10 visible people born before 1890 are all non-American and have 10 different nationalities. Six out of the top 10 born after 1890 are instead U.S. born citizens. Since 1800, the share of people from Europe and the U.S. in the database declines, the number of people from Asia and the Southern Hemisphere grows to reach 40% of the database in 2000. (6) The average distance between places of birth and death follows a U-shape pattern: the median distance was 316km before 500AD, 100km between 500 and 1500AD, and has risen continuously since then. The greatest mobility occurs between the age of 15 and 25. (7) Individuals with the highest levels of visibility tend to be more distant from their birth place, with a median distance of 785km for the top percentile as compared to 389km for the top decile and 176km overall. (8) In all occupations, there has been a rise in international mobility since 1960. The fraction of locations in a country different from the place of birth went from 15% in 1955 to 35% after 2000. (9) There is no positive association between the size of cities and the visibility of people measured at the end of their life. If anything, the correlation is negative. (10) Last and not least, we find a positive correlation between the contemporaneous number of entrepreneurs and the urban growth of the city in which they are located the following decades; more strikingly, the same is also true with the contemporaneous number or share of artists, positively affecting next decades city growth; instead, we find a zero or negative correlation between the contemporaneous share of “militaries, politicians and religious people” and urban growth in the following decades.
 
 

Fichiers

Version Format Fichier Taille
Version de l'auteur liepp-wp46-gergaud-laouenan-wasmer.pdf 10,24 MB