Penser les donnees : nos architectes du big data (la ti?che des donnees 2/3)

Penser les donnees : nos architectes du big data (la ti?che des donnees 2/3)

« Data scientists », « Data architects » voire « Data alchemists »

Grandes paraissent les professions qui participent a la conception et a l’analyse des architectures de informations. Derriere ces intitules se trouvent des individus dont les choix contribuent a faconner la figure des prestations connectes. Prendre en compte la dimension sociale d’une fabrique des donnees permet de se apporter les moyens de questionner a J’ai fois un forme, ainsi, les usages qui en sont faits.

Loin d’etre le reflet neutre et objectif une realite, les informations paraissent le resultat de processus complexes de captation, de cadrage et d’enregistrement d’elements plusieurs sous des formes standardisees et quantifiables. Ces operations impliquent toujours des choix (de variables a prendre en compte, d’echelles sur lesquelles nos quantifier, de seuils, de hierarchisation…) qui conditionnent la forme finale des precisions et, de votre fait, celle des calculs qui pourront etre realises a partir d’elles – ce dont nous parlions dans le premier billet de cette collection.

Ainsi, tel l’explique le sociologue Jerome Denis dans le ouvrage la ti?che invisible des informations, « les informations ne sont jamais desincarnees et n’existent pas a l’etat ‘pur’. Elles sont toujours affaire de melanges, de bricolages, d’accommodements, d’agencements hybrides. Elles seront l’objet et le rendu tout d’un bricolage ». Mes tri impliques par ce travail paraissent faits – consciemment ou non – par quantite de acteurs, et en particulier par des specialistes et professionnelles dont le faconnage des donnees constitue le c?ur de metier. Ils et elles concoivent la forme que prendront les informations et les bases dans lesquelles elles seront reunies en fonction des objectifs qui un https://besthookupwebsites.org/fr/rencontres-chretiennes/ paraissent assignes, avant que des petites mains, nombre moins visibles (et dont nous parlons au billet suivant de une telle serie) se chargent d’une construction effective des donnees.

Pouvoir des choix de structuration des donnees : l’exemple des genres musicaux sur Spotify

J’ai maniere dont les informations paraissent construites impacte fort largement nos utilisations qui peuvent en etre faites par nos outils (en particulier algorithmiques) qui les traiteront ensuite. Mes objets informationnels que seront les donnees paraissent des representations schematiques, qui grossissent l’importance de certaines variables et en laissent de multiples autres de cote ; ils contribuent ainsi a la structuration de systemes de representation bien particuliers.

Le processus de categorisation des musiques sur Spotify permet d’illustrer une telle dynamique. Si l’histoire de la classification musicale via genre reste bien sur ancienne, et en partie reprise par la plateforme qui n’oublie nullement totalement le « rock » ou le « jazz », celle-ci se targue egalement d’effectuer emerger des « genres musicaux de demain ». L’importance du catalogue musical de Spotify (environ 50 millions de titres) lui permet Dans les faits de conduire des analyses statistiques sur son fond et creer, sur la base de Quelques partis-pris, des labellisation inedites.

La selection de variables particulieres pour decrire des titres du fond musical une plateforme oriente ces nouvelles categorisations. Celui-ci inclut de facon notable diverses caracteristiques liees a des etats emotionnels, egalement appelees « attributs psychoacoustiques », comme l’energie, la « dancabilite », la « couleur emotionnelle ». Une telle labellisation conduit Spotify a construire un referentiel musical base davantage i  propos des effets sensoriels supposes des titres que sur leurs caracteristiques structurelles. La plateforme suit en ce qui le parti-pris d’une start-up d’ « intelligence musicale » EchoNest, dont i§a a fera l’acquisition en 2014, qui affirmait a l’epoque vouloir developper une categorisation dynamique des musiques en fonction des mots « couramment utilises pour nos decrire », car « chercher du ‘rock’ [serait] tout juste plus efficace que de demander a ecouter des ‘chansons qui sont en musique’ ».

Ainsi, Spotify voit aujourd’hui cohabiter 2 types de categorisation musicale, intrinsequement lies a toutes les criteres employes Afin de les qualifier : l’un correspond a toutes les genres « traditionnels » de musique et est base sur leurs caracteristiques structurelles (type de rythme, tempo…), l’autre est oriente vers des etats emotionnels ou des activites specifiques supposement lies a un ecoute. C’est cela apparait sur la capture d’ecran suivante d’la page « decouverte » de l’interface de Spotify, voyant se melanger d’un cote le hip-hop, le rock et l’electro, ainsi, de l’autre la musique « chill », sport mais aussi estivale.

Ce glissement par une typologisation emotionnelle en musique pourra etre compris, suivant l’analyse des auteurs et autrices de Spotify Teardown (toute premiere etude de grande ampleur menee sur le fonctionnement en plateforme), comme s’inscrivant dans « 1 mouvement de grande ampleur vers une vision utilitariste une musique, dans laquelle la musique est Sans compter que en plus consommee en lien avec 1 contexte particulier ou en appui des activites (plutot que au cadre d’une experience esthetique ou d’un travail de construction identitaire, entre autres) ».

Il va i?tre du reste revelateur de l’importance des choix realises via les « architectes des donnees » de la plateforme dans la construction de la realite qui prend forme sur son interface. J’ai decision, contraire aux standards classiques de musicologie, d’inclure des variables emotionnelles dans la categorisation musicale, s’accompagne d’une bascule dans la facon dont l’ecoute musicale est envisagee. Si on choisissait si»rement deja au temps des cassettes audio d’ecouter des titres differents en fonction du moment de la journee ainsi que ses occupations, la generalisation via Spotify des playlists orientees vers des contextes et des humeurs particulieres (« a ecouter a la maison », « motivation pour le sport », « matin »…) normalise ces categories, ainsi, oriente de votre fera a grande echelle des pratiques d’ecoute des utilisateurs et utilisatrices. Notre forme des precisions, pensee par leurs concepteurs et conceptrices, conditionne leurs usages.