Analyse des traces numériques : introduction à la cartographie de l’information scientifique et de la presse

Les activités humaines, la vie en société, génèrent depuis toujours des informations. Ces informations d’abord reportées sous la forme papier dans de grands répertoires ou des livres, sont maintenant enregistrées dans des dispositifs informatiques. Depuis une trentaine d’années le volume d’information généré a considérablement augmenté avec, dans le même temps, une diversification importante des producteurs d’information (entreprises, pouvoirs publics, citoyens, réseaux sociaux, téléphones mobiles…).

Ces traces numériques offrent de nouvelles sources de données exploitables pour comprendre les dynamiques sociales. Elles questionnent et renouvellent les sciences sociales en proposant notamment de nouvelles approches quantitatives. Très tôt la scientométrie (i.e. science de la mesure et l'analyse de la science) s’est saisie des citations appréhendées comme des traces du travail des scientifiques, pour mieux rendre compte les sources cognitives des travaux de recherche. Dans ce contexte, les traces numériques ouvrent également de nouvelles possibilités d’analyse (e.g. détections des communautés où encore des analyses les données textuelles pour comprendre les discours produits). Face aux volumes considérables d’information mobilisée, les résultats sont mis en images en synthétisent le contenu dans le but de dégager les principaux éléments d’analyse. Ces visualisations rendent lisibles les résultats aux publics auxquels elles s’adressent, et peuvent éclairer les décisions stratégiques des entreprises, ou encore par exemple celles des pouvoirs publics…

Ce cours basé sur la réalisation d’un projet conduit en groupe, propose une introduction à l’étude des traces numériques, tout en sensibilisant les étudiants aux principales étapes de l’analyse et de la visualisation de données : définition d’un sujet, choix des sources, collecte de l’information, analyses quantitatives (étude des citations, détection de communautés…) et visualisation des résultats. Les compétences techniques mobilisées, au titre de cette introduction, irriguent différents métiers: la veille, l’analyse des média sociaux, et plus largement celui de data analyst.

Université Paris-Est Marne-la-Vallée : Master 2 UFR Sciences Humaines et Sociales, Etudes Numeriques et Innovation (NUMI). Site web de présentation du Master.

01 Cours 1 : de la scientométrie à la cartographie de l'information

Vous trouverez dans ce cours introductif des clins d’œil illustrant les bases de la scientométrie, puis des traitements quantitatifs plus récents, pour terminer sur une présentation de différents grands types de visualisons ainsi que certains principes et effets sur lesquels s’appuient la cartographie de l’information.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

02 TD 1 : data scientist et data designer

Pour ce TD portant sur les premières analyses de vos données, nous traitons des statistiques descriptives simples. Nous abordons les premiers comptages de volumes de production (ex : compte du nombre de publications et/ou de d'articles de presse par année pour une institution donnée). D’autres statistiques comme la somme et la moyenne peuvent être utilisées.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

03 TD 2 : Analyse de réseaux (relations directes) et visualisations

Dans ce second TD, nous aborderons les indicateurs relationnels directs. Cela sera l’occasion, en utilisant le CorText Manager, de produire vos premières analyses de réseaux, d’introduire la notion de distance entre les nœuds, et de (re)travailler les visualisations au format vectoriel svg.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

04 TD 3 : Analyse de réseaux (relations indirectes) et visualisations

Dans ce troisième TD, nous aborderons les indicateurs relationnels indirects. Cela sera l’occasion, en utilisant le CorText Manager, de produire vos premières extractions terminologiques, en vous concentrant sur les groupes nominaux, puis de retravailler le vocabulaire extrait en première instance. A partir de ces groupes nominaux, vous construirez le paysage sémantique associé en repérant les termes proches à partir de leurs matrices de cooccurrences afin de former les clusters.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

05 TD 4 : Analyse de réseaux et mesures

Dans ce dernier TD, nous aborderons les mesures locales classiques de l’analyse des réseaux sociaux : centrality, degree et betweenness.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

Ressources

Retrouvez ici les diverses ressources rassemblées. Pour la majeure partie d’entre elles, elles vous ont déjà été présentées tout au long des TD. Utilisez ces ressources pour vous aider dans la structuration des données tout autant que pour répondre à votre sujet.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

Exemples inspirants pour le rendu

Retrouvez ici les exemples inspirants illustrant le type d'analyses et de rendus attendus dans le carte de ce cours.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...

Le best of des rapports

Retrouvez ici les meilleurs travaux associés au cours. Tout en rendant compte du travail attendu pour ce cours, ils donnent aussi a voir les analyses et les modalités de présentations qu'il est possible de conduire.

Veuillez vous identifier, ou vous inscrire, pour lire la suite...