Musique en streaming, films à la demande, jeux vidéo, achats… Notre consommation sur le Web est désormais guidée par des recommandations personnalisées selon nos goûts. Les algorithmes sur lesquels elles reposent se nourrissent de nos traces et de nos habitudes. Faut-il les craindre ?
SOMMAIRE
1. Les conseils d’un vendeur
2. Vie privée en pâture
3. Vers une uniformisation des goûts
4. Reprendre la main sur ses données
5. Qu’est-ce que le big data ?
Si votre ado rétorque régulièrement que les maths sont inutiles, réjouissez-vous : vous allez pouvoir lui clouer le bec. Internet, son passe-temps favori, en est truffé. Chaque clic, chaque post, chaque like déclenche une pluie de calculs dont il n’a absolument pas conscience. Il est, comme nous tous, au cœur d’une matrice géante qui se nourrit de ses propres données et prédit ses goûts et ses envies. Les algorithmes ont pris le contrôle du Web.
Ils se nichent depuis des années déjà dans les mécanismes d’affichage des publicités ciblées. Les algorithmes de recommandations personnalisées s’insinuent aujourd’hui partout, des moteurs de recherche aux sites d’e-commerce, des réseaux sociaux à la culture en ligne. Vous lorgnez une chemise ? Votre marchand vous propose un gilet et une ceinture pour parfaire votre tenue. Impossible de rater ces suggestions savamment placées sur la page. Vous écoutez Grace Jones et Pink Floyd en streaming sur Deezer ou Spotify ? Vous aimerez sans doute ce titre de Led Zeppelin. Vous avez consulté la galette des rois sur un site de recettes ? Jetez donc un œil sur celle de la tarte conversation, préparée elle aussi à partir d’une onctueuse crème d’amande. L’objectif de ces sites est simple : vous faire consommer plus, vous fidéliser et, bien sûr, booster le chiffre d’affaires via des ventes directes ou de la publicité ciblée.
LES CONSEILS D’UN VENDEUR
Les géants de l’Internet, au premier rang desquels Amazon, Facebook et Google, sont à l’origine de ces algorithmes. Plus tard, Netflix a porté ce genre de technologie à la connaissance du public en insistant sur son système de recommandations prédictives pour lancer son service de SVOD (vidéo à la demande par abonnement) en France, en 2014. Son algorithme, « Cinematch », suggère à l’abonné des films et des séries télé susceptibles de lui plaire. « Il se base sur les habitudes, les goûts et les préférences des abonnés partout dans le monde pour proposer des contenus personnalisés à chacun », explique Joris Evers, porte-parole du site. L’affinage de cet algorithme mobilise des centaines de salariés à temps plein. Et a priori il est efficace, puisque 80 % des visionnages sur Netflix sont guidés par les recommandations, 20 % seulement le sont par le moteur de recherche. « Le travail est le même que celui d’un sommelier qui recommande un bon vin. Sans ses conseils, le consommateur est perdu dans la longue liste des vins proposés à la carte », analyse Joris Evers qui, manifestement, personnalise aussi ses exemples en fonction des pays.
Même satisfaction chez les e-commerçants. Amazon a refusé de répondre à nos questions, mais le chiffre de 30 % est souvent évoqué pour quantifier la part des ventes générées par son algorithme. « Selon les sites, le chiffre d’affaires augmente de 3 à 35 % après intégration d’un moteur de recommandations personnalisées », confirme Matthieu Thiriez, cofondateur de Nuukik. Comme des dizaines d’autres, cette société a développé son propre algorithme pour le revendre clés en main aux petits sites marchands : « Les algorithmes permettent simplement de reproduire les conseils d’un vendeur en boutique. Si vous achetez tous les dimanches un poulet rôti chez le boucher, il va finir par préparer votre commande avant que vous n’entriez dans sa boutique. Et il va probablement vous proposer des patates, parce que c’est délicieux avec, et que, au passage, il réalise ainsi une vente additionnelle. C’est du commerce, rien de plus ! »
Du commerce, certes, à une différence : pour vous vendre ses pommes de terre, le boucher n’a pas besoin de savoir ce que vous avez mangé la veille, ni si vous avez complètement fini votre assiette ou si vous avez des enfants, ni de connaître votre tour de taille, votre adresse e-mail ou l’IP de votre ordinateur. Les algorithmes de recommandations se nourrissent, eux, des milliers de données, à caractère personnel ou pas, que les internautes sèment en naviguant. Il est donc légitime de s’en inquiéter. D’autant qu’il s’agit là d’un arbre qui cache la forêt : nous sommes à l’aube d’une révolution économique autour du « big data » (lire encadré). « Les données que nous collectons sont bien entendu anonymisées, assure Matthieu Thiriez. Nous savons que le client numéro X a acheté le produit Y, mais aucune information personnelle ne permet d’identifier le client. »
VIE PRIVÉE EN PÂTURE
Or, même anonymisées, ces bases de données en savent long sur nous. L’histoire l’a déjà prouvé. En 2006, AOL avait ainsi publié un fichier contenant les données de recherches de 658 000 internautes américains, après avoir remplacé le nom de chaque abonné par un numéro. Chercheurs et blogueurs ont tiré d’intéressantes statistiques sur les usages du Web, mais le fichier est aussi tombé entre les mains de curieux qui ont réussi à identifier des internautes. En remontant le fil de leurs recherches et leur historique de navigation, ils ont pu retrouver des numéros de Sécurité sociale, même des adresses postales, et finalement des noms. Quelques années avant, des chercheurs de l’université Carnegie Mellon (Pittsburg, États-Unis) avaient prouvé qu’il était très simple, à partir d’une photo, de trouver l’identité d’une personne en recoupant les informations des réseaux sociaux et d’images de vidéosurveillance ou de sites de rencontres.
VERS UNE UNIFORMISATION DES GOÛTS
Protéger sa vie privée se complique, protéger son identité culturelle aussi. Si, avec des algorithmes, Amazon, Deezer, Netflix et les autres prodiguent les mêmes suggestions à tous les utilisateurs dont le profil est similaire, ils finiront par acheter la même chemise, par regarder les mêmes films et par écouter la même musique ! Dans une étude pour la Cnil (Commission nationale de l’informatique et des libertés), Médiamétrie révèle que 60 % des utilisateurs de sites de streaming musical et 70 % des fidèles de la VOD suivent les suggestions. Les deux tiers s’en déclarent satisfaits, mais se demandent comment ces recommandations sont construites. Loin, sans doute, de s’imaginer qu’elles sont l’œuvre des « data scientists », que s’arrachent désormais les entreprises. Ce nouveau métier exige de multiples compétences, des maths à la modélisation et de la créativité au marketing. Les formations universitaires, relativement récentes, ne délivrent que 300 diplômés par an quand le marché en réclame entre 5 000 et 10 000 (source : Quantmetry). Les salaires s’envoleraient à 50 000 € par an en début de carrière. De quoi créer des vocations… La prochaine fois qu’il décrète que les maths ne servent à rien, parlez-en donc à votre ado !
REPRENDRE LA MAIN SUR SES DONNÉES
La plupart du temps, l’internaute consent à la collecte de ses données en acceptant les conditions générales du service. Sa marge de manœuvre pour minimiser les traces qu’il dépose sur le Web est faible. Voici tout de même quelques conseils pour protéger votre vie privée.
◆ Refusez les cookies dans les paramètres (« Vie privée » ou « Confidentialité ») de votre navigateur Internet. Activez aussi l’option « Do not track » (« Ne pas me pister »).
◆ N’usez pas du même pseudonyme pour tous les services.
◆ Diversifiez vos mots de passe et choisissez-les complexes.
◆ Paramétrez la confidentialité de vos comptes Facebook, Twitter et autres réseaux sociaux.
◆ Dans les paramètres de votre smartphone, limitez l’accès des applications à votre localisation, vos contacts (répertoire), etc.
QU’EST-CE QUE LE BIG DATA ?
Chaque jour, des quantités astronomiques de données numériques de toute sorte circulent sur le Web. Les volumes sont tels que les outils classiques de gestion de bases de données ne suffisent plus : on parle de big data. Ces milliards de données, une fois analysées avec des outils spécifiques (algorithmes notamment), permettent de prédire les comportements. En analysant l’historique des pannes affectant ses trains, la SNCF peut ainsi envisager des opérations de maintenance prédictive.
« La data, c’est le capital du XXIe siècle », résume Axelle Lemaire. Les opportunités économiques sont en effet gigantesques. Dans sa loi pour une République numérique, la secrétaire d’État chargée du Numérique impose aux administrations de rendre publiques toutes les données dont elles disposent (c’est l’open data). Le site vroomvroom.fr permet par exemple de comparer les taux de réussite de toutes les auto-écoles de France, alors que ces informations étaient auparavant éparpillées dans chaque préfecture.
site quechoisir.org