Penser les donnees : les architectes du big data (Le travail des informations 2/3)

Penser les donnees : les architectes du big data (Le travail des informations 2/3)

« Data scientists », « Data architects » voire « Data alchemists »

Grandes seront les professions qui participent a la conception et a l’analyse des architectures de precisions. Derriere ces intitules se trouvent des individus dont des choix contribuent a faconner le visage des services connectes. Prendre en compte la dimension sociale une fabrique des donnees permet de se donner la possibilite de questionner a J’ai fois un forme, et les usages qui en seront realises.

Loin d’etre le reflet neutre et objectif une realite, les informations paraissent le resultat de processus complexes de captation, de cadrage et d’enregistrement d’elements plusieurs sous des formes standardisees et quantifiables. Ces operations impliquent toujours des choix (de variables a prendre en compte, d’echelles sur lesquelles nos quantifier, de seuils, de hierarchisation…) qui conditionnent la forme finale des precisions et, de votre fera, celle des calculs qui pourront etre realises a partir d’elles – votre dont nous parlions dans le premier post de une telle collection.

Ainsi, comme l’explique le sociologue Jerome Denis dans le ouvrage Le travail invisible des informations, « les informations ne sont jamais desincarnees et n’existent pas a l’etat ‘pur’. Elles paraissent toujours affaire de melanges, de bricolages, d’accommodements, d’agencements hybrides. Elles paraissent l’objet et le resultat d’un article ». Mes choix impliques par votre boulot sont faits – consciemment ou non – via de multiples acteurs, et en particulier par des professionnels et professionnelles dont le faconnage des donnees constitue le c?ur de metier. Ils et elles concoivent la forme que vont prendre les informations et les bases dans lesquelles elles sont reunies en fonction des objectifs qui leur seront assignes, avant que des petites mains, beaucoup moins visibles (et dont nous parlons dans le billet suivant de une telle collection) se chargent en construction effective des precisions.

Pouvoir des choix de structuration des precisions : l’exemple des genres musicaux sur Spotify

Notre maniere dont les informations sont construites impacte fort largement les utilisations qui peuvent en etre faites par des outils (en particulier algorithmiques) qui les traiteront ensuite. Les objets informationnels que paraissent les donnees sont des representations schematiques, qui grossissent l’importance de certaines variables et en laissent de nombreuses autres de cote ; ils contribuent ainsi a la structuration de systemes de representation bien particuliers.

Le processus de categorisation des musiques sur Spotify permet d’illustrer votre dynamique. Si l’histoire de la classification musicale via genre reste bien sur ancienne, ainsi, en partie reprise par la plateforme qui n’oublie pas totalement le « rock » ou le « jazz », celle-ci se targue egalement de faire emerger nos « genres musicaux de demain ». L’importance du catalogue musical de Spotify (plus de 50 millions de titres) lui permet en effet de conduire des analyses statistiques sur son fond et creer, sur la base de plusieurs partis-pris, des labellisation inedites.

Le choix de variables particulieres Afin de decrire des titres du fond musical de la plateforme oriente ces nouvelles categorisations. Celui-ci inclut de facon notable Plusieurs caracteristiques liees a des etats emotionnels, egalement appelees « attributs psychoacoustiques », comme l’energie, la « dancabilite », la « couleur emotionnelle ». Une telle labellisation conduit Spotify a construire un referentiel musical base davantage i  propos des effets sensoriels supposes des titres que sur leurs caracteristiques structurelles. Notre plateforme suit en cela le parti-pris d’une start-up d’ « intelligence musicale » EchoNest, dont i§a a fait l’acquisition en 2014, qui affirmait a l’epoque vouloir developper une categorisation dynamique des musiques en fonction des mots « couramment utilises pour nos decrire », car « chercher du ‘rock’ [serait] tout juste plus efficace que de reclamer a ecouter des ‘chansons qui sont d’la musique’ ».

Ainsi, Spotify voit aujourd’hui cohabiter deux types de categorisation musicale, intrinsequement lies a toutes les criteres employes pour des qualifier : l’un correspond a toutes les genres « traditionnels » de musique et reste base via leurs caracteristiques structurelles (type de rythme, tempo…), l’autre est oriente par des etats emotionnels ou des activites specifiques supposement lies a leur ecoute. C’est et cela apparait sur la capture d’ecran suivante d’la page « decouverte » de l’interface de Spotify, voyant se melanger d’un cote le hip-hop, le rock et l’electro, et de l’autre la musique « chill », sport ou encore estivale.

Ce glissement vers une typologisation emotionnelle de la musique va etre compris, suivant l’analyse des auteurs et autrices de Spotify Teardown (toute premiere etude de grande ampleur menee concernant le fonctionnement d’une plateforme), comme s’inscrivant au sein d’ « 1 mouvement de grande ampleur par une entree en matii?re utilitariste en musique, dans laquelle la musique est Sans compter que en plus consommee en lien avec votre contexte particulier ou en appui de certaines activites (plutot que au cadre d’une experience esthetique ou d’un travail de construction identitaire, par exemple) ».

Cela reste du reste revelateur de l’importance des choix realises par nos « architectes des donnees » de la plateforme dans la construction d’une realite be2 qui prend forme sur son interface. J’ai decision, contraire aux standards classiques de musicologie, d’inclure des variables emotionnelles dans la categorisation musicale, s’accompagne d’une bascule dans la facon dont l’ecoute musicale est envisagee. Quand on choisissait certainement deja au temps libre des cassettes audio d’ecouter des titres multiples en fonction de l’instant de la journee ainsi que ses occupations, la generalisation par Spotify des playlists orientees vers des contextes et des humeurs particulieres (« a ecouter a domicile », « motivation concernant le sport », « matin »…) normalise ces categories, ainsi, oriente de ce fait a grande echelle les pratiques d’ecoute des utilisateurs et utilisatrices. Notre forme des precisions, pensee avec leurs concepteurs et conceptrices, conditionne leurs usages.