Bienvenue en Arctique
L'Arctique est aujourd'hui un sujet majeur de politique extérieure. Oasis naturelle encore préservée, terre de compromis entre les nations, son avenir devient de plus en plus incertain alors que la fonte des glaces s'accélère et que son océan s'avère abriter d'immenses nappes de pétrole.
Mais si l'Arctique est un territoire géographique que de célèbres explorateurs ont arpenté, il en existe un alter ego numérique. Sur la toile, de nombreux sites se consacrent au sujet : qu'il s'agisse de scientifiques, d'universités, de citoyens passionnés ou d'écologistes avertis cette thématique alerte tout un pan du web. Au sein de cet espace les sites traitent donc de sujets liés à l'Arctique et se citent entre-eux formant ainsi un véritable réseau, un enchevêtrement de relations : un territoire.
Le corpus de sites consacré à l'Arctique utilisé par Konodeo et constitué à l'origine par l'association WebAtlas suite à une commande de l'inist a été manuellement divisé en trois catégories :
- Sciences et Ressources (Chercheurs, universités, ...)
- Société Civile (Associations, citoyens engagés, ...)
- Divers
Konodeo a utilisé ses technologies pour visiter ce corpus et en indexer les informations. Les données obtenues ont permis de mettre en place notre portail de démo, accessible au grand public. Mais si les informations recueillies permettent de mettre en place efficacement des portails d'information, elles donnent également l'opportunité de mener de nombreuses études.
Nous allons donc nous attacher ici à observer les personnes qui sont citées sur les pages web du corpus, et quelques unes de leurs propriétés. Cette première étude sera l'occasion d'avoir un aperçu de l'utilisation que nous pouvons faire des informations issues d'un corpus thématique du web.
Études des personnalités du territoire
Vue générale
Étude statistique
Rappelons en premier lieu les caractéristiques de ce corpus de petite taille :
- 522 sites web, dont 475 dans la catégorie Sciences et Ressources et 70 dans la catégorie Société Civile
- 200 000 pages indexées
- 16 000 noms de personnes retenus
Un indicateur de Pénétration de la communauté (Pc) a pu être calculé pour chaque personne retenue, à partir du nombre de sites web sur lesquels elles ont été citées. Cet indicateur permet de déterminer à quel point une personne est reconnue largement au sein de la thématique web, et avec quelle ferveur. Son affichage pour chaque personne au sein d'un graphique donne la figure suivante.

Cette courbe exprime sans conteste une loi de puissance, et démontre que quelques personnes s'accaparent à elles seules la grande majorité de l'attention de la communauté.
Si l'on observe uniquement le nombre de sites web sur lesquels les personnes sont citées, la répartition est en effet la suivante :
- 75% des personnes sont citées sur trois sites ou moins
- 50% des personnes sont citées sur deux sites ou moins
- 25% des personnes sont citées un site ou moins
Ce qui ne laisse donc que 25% des personnes citées sur 3 sites ou plus, avec un maximum de 66 sites pour le grand gagnant du classement général.
Trace sémantique

Chaque personne est associée à une trace sémantique. Cette trace est générée à partir des mots que l'on a pu trouver sur toutes les pages où la personne a été citée, et caractérise le contexte auquel cette personne est associée dans le corpus. Le nuage de mots ci-dessus a été fabriqué à partir des traces sémantiques des dix personnes les plus influentes du corpus[1], et donne donc un aperçu des thèmes les plus récurrents autour des ces personnalités.
Classement
Le top 10 général des personnes les plus influentes de la thématique Arctique, classées par indicateur de pénétration de la communauté, est le suivant :
- Nicolas Hulot
- Alfred Wegener
- Marie Curie
- Barack Obama
- Albert Einstein
- Jean-Louis Borloo
- George Bush
- Jean-Claude Gascard
- Mark Serreze
- James Cook
La trace sémantique numéro un, Nicolas Hulot, se constitue des mots suivants :
environnement bio planète durable éco développement énergie ogm terre nature espèces cialis viagra eliz environnemental solaire électricité habitat eau effet europe déchets eco énergies animales électrique monde biocarburant forêts politique renouvelables animaux france équitable technologie serre biodiversité climatique commerce conception écologie consommer innovation produits design fondation livres recyclage
La liste est brouillée par des noms de personnalités très connues, et qui ne sont pas forcément spécifiques à l'Arctique. L'aperçu général ne présente donc qu'un intérêt limité du fait de son caractère transversal. C'est pourquoi nous allons maintenant nous intéresser plus spécifiquement aux sous-corpus Sciences et Ressources d'un côté et Société Civile de l'autre[2].
Sciences et ressources
Trace sémantique

Le nuage de mots formé des traces sémantiques des 10 personnes les plus en vue dans la catégorie Sciences et Ressources montre un intérêt fort envers le changement climatique et le monde universitaire. En est absent toute la dimension politique qui apparaissait dans le nuage de mots général : signe d'une divergence entre les préoccupations politiques et les sujets de recherche des scientifiques ?
Classement
- Alfred Wegener
- Mary Simon
- Darrell Kaufman
- Janet Warburton
- Philip Burgess
- Kristen Ulstein
- Stacy Kim
- Eric Brossier
- Elena Bautista
- Heidi Roop
Les personnes de référence ne sont dans cette catégorie que des scientifiques reconnus (pas toujours vivant, comme dans le cas d'Alfred Weneger) ou de grandes personnalités intimement liées à l'Arctique, comme Mary Simon qui s'est battue pour les droits des Inuits. La trace sémantique de cette dernière corrobore d'ailleurs ses activités :
inuit canada national arctic senators government simon leader itk mary senate canadian honourable president committee minister media bill content aboriginal peoples people health employment change hendrie skip climate development act nunavut time education report release day rights house canadians nations statements languages indigenous tapiriit years kanatami northern council ottawa communities
Nous sommes dans un milieu qui reconnaît essentiellement ses pairs, mais semble également s'ouvrir sur des personnalités liées à ses sujets de recherche, comme l'illustre la présence de Mary Simon.
Société Civile
Trace sémantique

Ce nuage de mots illustre la fusion des traces sémantiques des dix personnes les plus en vue dans la partie Société Civile du corpus. On observe un champ sémantique bien différent : les préoccupations semblent plutôt liées à la protection de la planète et de l'environnement, et bien sûr au développement durable. Cette sous-partie du corpus est une sphère écologique, qui alimente son argumentaire grâce aux observations issues de la sphère scientifique.
Classement
- Nicolas Hulot
- Hubert Reeves
- Pierre Rabhi
- Nicolas Sarkozy
- Corinne Lepage
- Vincent Munier
- Isabelle Delannoy
- Mireille Ferri
- Alfred Wegener
- Eric Brossier
Contrairement à ce que nous avons pu observer dans les Sciences et Ressources, il apparaît que la Société Civile est perméable au monde politique, mais pas seulement ; si le fer de lance de la communauté reste Nicolas Hulot, des personnalités issues de différents milieux se retrouvent dans le top 10 : personnalités médiatiques (Nicolas Hulot), politiques (Nicolas Sarkozy), artistes (Vincent Munier), citoyens engagés (Isabelle Delannoy), ou enfin scientifiques (Hubert Reeves) dont voici la trace sémantique :
environnement espèces planète nature terre effet animales bio eau forêts animaux serre biodiversité monde ressources formes sauvages disparition habitats produits vie couche marines france ouragans glaciaire volcans calotte source flore naturendanger ozone eco climatiques énergie homme reeves années gaz hubert commerce chroniques leurs climats durable développement mer animal naturel mesure
La Société Civile apparaît ici comme un carrefour, un lieu d'échange et de brassage de différents milieux.
Conclusions
S'il est évident qu'il existe des personnalités de référence pour tout domaine, cette courte analyse nous montre que chaque milieu a ses propres références au sein d'une même thématique. L'identification de ces personnalités permettra sans doute de mieux saisir quelle influence subit chaque milieu, mais aussi d'en saisir la diversité d'idées et d'opinions, ou au contraire sa grande convergence. Ce corpus de petite taille et n'étant divisé qu'en deux catégories étudiables ne permet pas de tirer des conclusions générales. Nous aurons cependant prochainement l'occasion de réitérer l'expérience sur un plus grand jeu de données.
Si vous souhaitez aller plus loin dans l'exploration des personnalités de l'Arctique, je vous invite à utiliser le Portail de démonstration. En jouant avec la recherche de noms propres, par exemple jean-Claude Gascard, vous pourrez accéder au graphe de relations de la personne concernée (bouton voir graphe en haut à droite du résultat).

Cet outil permet d'explorer le corpus sous forme de micro-graphes, représentant les relations entre les personnes ou les relations entre sites web.
Bonne visite !