49
Commentaires

Nos données personnelles, nouveau pétrole ?

Attention, débat à glissades : alors que le gouvernement cherchait à taxer les géants du Net qui se soustraient à l’impôt dans l’espoir de remplir les caisses de l’État, le voilà acculé à ouvrir le débat sur l’exploitation des données. D’où vient l’assaut ? D’un peu partout : du rapport Colin/Collin, d'Arnaud Montebourg, en passant par Pierre Bellanger, le PDG de Skyrock, lui-même cité dans un billet des Echos. Explications.

Derniers commentaires

- pb technique -
Merci Anne-Sophie pour cet article et la mention de celui des Echos.

Je savais comment fonctionnait le marketting et pubs ciblées sur certains sites (YT). Mais je me demandais comment d'autres arrivaient à mettre comme publicité/lien externe, les sites que j'avais consultés pour certains achats (notamment sachant que les sites sont hébergés dans des pays différents et fournissent pas le même service).
Nul ne sait vraiment à l'heure actuelle extraire une valeur réellement exploitable à partir des milliards de discussions sur Facebook, Google +, etc., des millions de billets quotidiens sur les blogs, des messages sur Google Mail. Bien entendu Google, Facebook et autres savent afficher une pub payante mais produire une sorte "d'or noir" issu de l'analyse savante de nos données personnelles relève de la futurologie. L'idée de taxer les données personnelles est une première tentative méritoire d'inventer un nouveau modèle économique qui fait aujourd'hui cruellement défaut à la presse en ligne et à de nombreux secteurs de l'économie numérique. Mais je ne vois pas comment mettre en pratique un système juste, cohérent, équitable et efficace qui respecte la vie privée d'une part, et permettent l'extraction intelligente de données personnelles d'autre part.
Si de tels outils existaient, il faudrait alors s'interroger sur l'utilisation de ces informations hautement qualifiées.
S'agirait-il, une fois de plus, de segmenter très finement les consommateurs pour vendre à chacun d'entre nous, ce qu'il n'aurait pas prévu d'acheter avec les vieilles ficelles du marketing ? Le flux intense et répété de sollicitations commerciales auquel l'internaute est aujourd'hui soumis contre son gré serait démultiplié de manière insupportable.
Ce n'est pas parce qu'une technologie existe qu'il faut l'utiliser.
Après l'écriture, et l'imprimerie, Internet est une 3ème révolution technique, au déploiement infiniment plus rapide que les 2 précédentes. Nous saisissons à peine l'ampleur des bouleversement induits et encore moins à venir dans tous les secteurs de nos sociétés. L'exploitation des données personnelles ne me semble pas plus un eldorado que les méthodes actuelles des régies publicitaires. Tout reste encore à inventer et ne peut qu'être le fruit d'une réflexion collective.
Bonjour à tous


Je n'avais pas contribué au forum d'@si depuis longtemps. Cependant, il me semble qu'une facette de la question n'a pas été clairement posée ici jusqu'à présent (ou alors mes excuses à celui ou celle dont j'aurais manqué la contribution).


D'abord, il me faut citer mes sources. Il commence à être connu par ici, il s'agit de Benjamin Bayart. Vous pouvez vous faire une petite idée du bonhomme ici : Benjamin Bayart et la neutralité du net, version juridique


Je n'ai pas la prétention de relayer les propos de cet intéressant personnage. Plutôt de partager avec vous le fruit de certaines de mes méditations après l'avoir longuement et patiemment écouté.


D'abord, nombreux sont ceux qui ici même se sont plaints de la dépossession de nos données personnelles. Admettons que nos données personnelles nous appartiennent, et qu'il s'agisse là d'une revendication morale parfaitement légitime. Néanmoins, au moins deux problèmes se posent.

Premièrement, sur le plan juridique, nos données personnelles sont de moins en moins protogées (les choses ont particulièrement empiré en 2004 avec la réforme des lois de 1978 sur la protection des données). Ce qui signifie que cette revendication morale ne dispose pas d'un écho clair dans la loi. Ce qui est dû notamment à une absence de définition claire de ce que sont des données personnelles. Mes photos de vacances, ok, ça peut encore avoir un sens, mais qu'en est-il du fait que j'ai bien aimé tel blockbuster au cinéma, ou que je consomme régulièrement de la pâte à tartiner italienne parfumée aux noisettes? En quoi ma consommation d'un produit représente une donnée qui me reviendrait de droit? Comment donner un sens à cela en termes juridiques?

Deuxièmement, les données "personnelles" qui sont récoltées, n'ont pas besoin de l'être. Elles le sont sur la base de l'utilisation d'un service proposé par un organisme privé. Faire une recherche sur Google, poster des photos sur Facebook ou consulter Wikipédia revient simplement à louer un espace de mémoire (que l'on paye au minimum sous forme de publicité, ou par la vente de nos données personnelles ^^) et à y accéder. Et c'est là le fond du problème : le commerce des données personnelles provient en partie du fait qu'elles ne sont pas exactement personnelles. Une bonne partie du problème disparaîtrait si j'hébergeais mes propres données sur mon ordinateur, décidant d'y donner accès directement à l'ordinateur de mes proches pour pouvoir les échanger directement avec eux. Dans une telle situation, il reste possible de prendre possession de mes données sans que je l'accepte (à l'aide de spywares, malwares et compagnie...), néanmoins le procédé devient clairement illégal. donc, plus aucun besoin de revendiquer à corps et à cris que mes données m'appartiennent.


Aussi me semble-t-il que la proposition la plus choquante ici concerne la taxation de la transmission de données. Premièrement parce qu'il n'y a pas à proprement parler échange de données. Il ne s'agit pas du modèle import/export de marchandises. Il s'agit plutôt de celui de la diffusion d'ondes hertziennes. Faudrait-il taxer Europe 1 du fait que leurs ondes hertziennes traversent les frontières? L'idée semble saugrenue. Deuxièmement, il s'agit également de discriminer les données : il y aurait des données européennes, et des données américaines, revenant donc de droit aux Etats souverains d'Europe ou d'Amérique? Il s'avère que pour les mêmes raisons selon lesquelles des données transmises à un service privé cessent d'être à proprement parler "personnelles", ces mêmes données ne peuvent plus appartenir légitimement à un Etat souverain, en tant qu'elles ne sont plus associées à un sujet de cette souveraineté. Or l'idée même d'internet c'est la mise en circulation des données sans discrimination économique ou politique. On peut certes attaquer quelqu'un en justice parce que les données qu'il transmet sont illégales. Mais il semble difficile de discriminer par avance, avant transmission, les données qui ont le droit ou non de traverser le réseau sans qu'un tribunal les déclare après examen illégales. Ce qui nécessite un procès contradictoire. De la même manière, il semble difficile de discriminer des données pour des raisons fiscales. On peut taxer un produit - par exemple un logiciel conçu et commercialisé par telle ou telle entreprise - mais il semble plus difficile de taxer des données. On peut taxer un service - comme par exemple le fait de rassembler ces données et de produire à partir d'elles une étude de marché qu'on vendra ensuite à telle ou telle compagnie étrangère - mais il n'est pas légitime, pas plus que possible, de déterminer comment des données pourraient être taxées, à moins de taxer la transmission elle-même. Autrement dit, vous faire payer votre usage des routeurs internet; demander à l'Etat français le droit de transmettre en échange de quelques deniers. Pourrait-on taxer l'usage d'une langue? Dès que je parle français à un Australien je dois 1,50€ à l'Etat par syllabe? Drôle d'idée que de faire valoir le droit souverain d'un Etat sur des données et leur transmission...


Je ne sais pas si mon propos est très clair, ni s'il est véritablement juste. J'essaie de mettre un peu d'ordre dans ce que je comprends de cette affaire. Je me suis laissé convaincre que l'enjeu d'internet est le maintien de la capacité de tout utilisateur d'être à la fois client et serveur. Or il m'apparaît que la proposition de Montebourg consiste exactement dans le contraire : faire de la distinction entre client et serveur un enjeu pour que l'Etat renfloue ses caisses et que la croissance économique française gagne quelques malheureuses décimales pour quelques temps.


Si j'ai mal compris quelque chose, je vous prie de me le signaler d'urgence, parce que j ai besoin d'y voir plus clair dans cette histoire...
Un monde où on aurait le choix entre la Vérité et l'Erreur dénoncée par Anne-Sophie Jacques... Je balance.
A propos de l'Etude de données non struturées, de l'agrégation des données, du comment et de leurs buts, chercher dans votre moteur de recherche préféré : Hadoop big data analytic ou analytique ou Palanthir Gotham... Les outils sont là utilisés par google et Yahoo depuis longtemps,

exemple
http://www.lemagit.fr/technologie/gestion-des-donnees/2013/01/21/le-site-de-jeux-en-ligne-king-com-passe-a-lanalytique-big-data-avec-hadoop/


Beaucoup de documentations en anglais et de démonstrations pour mettre en avant la détection de comportements...
Le rôle de l'Etat devrait être de protéger le faible du fort, ici l'utilisateur et ses données personnelles du prestataire de services. Pour cela, il faut obliger par la loi à ce que l'utilisateur donne le droit explicitement à chaque utilisation de ses données personnelles, fixer précisément par décret ce que sont les données personnelles, et autoriser les class actions pour que les utilisateurs puissent attaquer les prestataires indélicats en force.

Mais ça ne rapporte pas d'argent et ça ne crée pas de taxe, donc ça n'intéresse pas l'équipe de fiscalistes obsessionnels que notre bon peuple a mis au gouvernement.
Hasard du calendrier, ils en parlent aussi chez reflets.info :

http://reflets.info/oui-il-faut-fiscaliser-le-business-des-donnees-personnelles/
Souveraineté numérique ?
Si je comprend bien, il s'agit de protéger nos industriels tricolores des industriels étrangers. Les google, facebook et autres twitters seront ainsi contraints de sous-traiter à des entreprises bien franchouilles l'exploitation des données. C'est juste une mentalité de colonisé. Le même réflexe que celui du Bédouin qui voit transiter un pipeline sur son territoire et réclame sa part au péage, sans seulement imaginer que ce qui coule dans le tuyau, en réalité, c'est à lui et pas à Elf, Chevron ou BP.

Pourquoi ne pas rendre ces données à leurs légitime propriétaire ?

Les box internet, par exemple, sont équipées maintenant d'une mémoire flash de parfois 250 GO. C'est largement suffisant pour héberger en natif à domicile, un profil de réseau social, logiciel, feuille de style et données personnelles. Nulle besoin de fermes de serveurs. Conséquences, ces données sont che nous. On les met à disposition si on veut, auprès de qui on le souhaite. On fait les mise à jours que l'on souhaite, on installe les applications désirées et aucune autre.

Plutôt que d'essayer de constituer des rentes indues, nos "entrepreneurs" feraient mieux d'utiliser leur créativité à d'autres sujets que la fiscalité. Ils pourraient essayer l'informatique. Libre, de préférence.

"Le seul fromage gratuit, c'est celui des pièges à souris."
mes donnees personnelles ne doivent etre/devenir le petrole de personne - justement, elles m'appartiennent et ne sont pas a vendre.
ces propositions vont a l'encontre de ce qui devrait etre la base de la circulation des informations sur internet : securite et protection de la vie privee de chacun. Il n'est pas acceptable que le concept meme de donnees personnelles soit aussi flou car chaque institution va avoir une idee differente de ce que cela peut representer : analyse d'emails sur gmail pour que google puisse vous envoyer des pubs qui vous plairont, idem pour l'echange d'infos sur facebook, analyse du champ magnetique dans la rue en face de ma maison pour savoir si ma tele est allumee et quel film je suis en train de regarder, services de surveillance du territoire etc...
Bien sur, lorque j'utilise gmail ou facebook je leur donne d'abord et consciemment l'info mais ce n'est pas une raison pour ignorer ce que ces entites feront de l'information a posteriori surtout si elles doivent ensuite etre taxees pour le "service" rendu.
Je refuse que mon navigateur prenne note de tous les sites que je visite sur internet, je refuse d'aller dans un pays ou je dois laisser mes empreintes digitales a l'entree, et je refuse d'etre traitee comme une boite a donnees personnelles - et ce n'est pas parceque je suis paranoiaque qu'ils ne vont pas venir me chercher.
Cette histoire est une déprime à retardement. Une déprime qui n'est pas encore effective. Normalement c'est tabou, mais bon....
La chronique du mal.
Ou comment Anne Sophie nous présente en direct la captation à venir de la richesse, par les plus riches. Y'a des profits éventuels à réaliser? Comment imaginer une mesure protectionniste ou bien un rabais pour l'internaute sur sa facture internet, sur ses impôts... Comment imaginer qui va en être différemment de ce qui arrive dans tous les domaines...
D'ailleurs, la conclusion fait mention d'un changement de mentalité, de comportement des consommateurs... Bon courrage...
Moi je boycotte fessebouq et touitair, je vote même pas sur les forums d'@si.
Skyblog, plateforme qui compte, selon Bellanger, 33 millions de blogs actifs !!!!!!!!

Ça fait très ancienne "nouvelle économie" ce chiffrage. Il est marseillais, Bellanger ?

S'il y en a le centième, c'est déjà pas mal.
c'est pourtant bien le chiffre annoncé dans son interview citée dans mon article !

33 millions de blogs actifs, bah quoi ? Un Français sur deux a un skyblog, c'est aussi simple que ça !
Il doit falloir inclure les animaux domestiques ... Sérieusement, j'ai du mal à comprendre la valeur marchande de certaines données comme : 'Zezette293 aime Michael Jackson" ou bien "bobléponge" a voté "+1" en commentant le dernier match de foot ... ???

Par hasard, n'y aurait-il pas un certain ... optimisme ... dans la valorisation de ces bases de données ... de la part de leurs possesseurs ?

Qui dupe qui ?
Nouvelle bulle en vue ?
Dans un monde ou 90% des transactions boursières relèvent de la spéculation, toute entreprise de prophétisation qui utilise une technique plus sérieuse que la méthode du doigt mouillé peut s'avérer fructueuse...
évidemment qu'il y a du déchet ! Mais si 10% des blogs permet l'élaboration d'un fichier qualifié, c'est déjà énorme. Cela dit, c'est une vraie bonne question.
Je me permets d'insister car je prends ce sujet très au sérieux. Mais l'expérience apprend le plus grande prudence avec ce type de calculs, je pense à la bulle internet de la fin des années 90. La plupart des chiffres publics sont invérifiables, et donc largement bidons. Idem pour les extrapolations ... 10 % de quoi ? Pourquoi 10 % ? Quelle est la source de revenu ? La fameuse publicité ciblée ? cela fonctionne quand on s'appelle Google ... et encore leurs bénéfices sont inférieurs à ceux d'Apple qui fait sa marge sur la vente ... du matériel ! Quant à Facebook, l'introduction en bourse fut agréable pour le compte en banque de Mark Zuckerberg mais l'action est en berne ...
Quels sont les vrais enjeux et les vrais chiffres ? Qui sont les pigeons ?
euh, moi aussi je prends le sujet très au sérieux. J'ai dit 10% mais j'aurais dû dire une infime partie. On est d'accord : beaucoup de choses relèvent du mythe. Mais il n'est pas forcément nécessaire d'avoir des chiffres précis - pour le moment - pour subodorer la manne potentielle. Si on file la métaphore du pétrole, c'est comme si je vous disais que j'avais trouvé un gisement, et que vous me demandiez combien de litres exactement je pourrais en extraire. C'est une bonne question, certes, mais une question parmi d'autres essentielles.
Après j'arrête ... A signaler ce texte formidable - et très drôle - de Rafi Haladjian sur la bulle Internet, vue de l'intérieur:

Devenez beau, riche et intelligent, avec PowerPoint, Excel et Word
Alors, pour la question de l'exploitation des données personnelles et de son corollaire qui n'est pas exclusivement publicitaire, on peut aussi lire cet article très intéressant et bourré de liens non moins passionnants sur le blog d'error404, dont voici un extrait :


"L'exploitation de la donnée personnelle n'est pas réduite à quelques géants américains vivant de la publicité. Elle l'est également par les VPCistes, les vendeurs de cartes de fidélité, les banques, les assurances. Elle ne provient pas exclusivement de la publicité, mais également du marché de l'emploi (linkedIn, viadeo), du couple (meetic), du transport (voyages-sncf), même quand le paiement du service entraine la qualification de l'internaute comme une recette accessoire. Elle est globale, elle est permanente, elle recouvre tous les marchés de biens et services."

Le reste est abordé d'un point de vue essentiellement juridique, mais je trouve que ce texte constitue une excellente porte d'entrée pour mieux cerner les enjeux qui gravitent autour de cette question pour le moins sensible.
Quant à Facebook, l'introduction en bourse fut agréable pour le compte en banque de Mark Zuckerberg mais l'action est en berne ...
Lors de l'introduction de l'action en bourse, il y avait une crise de confiance quant à l'exploitation, l'usage et (non-)protection des données personnelles des utilisateurs de fb. Ces données personnelles* sont la seule valeur marchande de l'entreprise fb.

Une exploitation qui pourrait être également vertueuse (...)
Mais oui, bien sûr...après avoir dépossédé et exproprié (sans consentement éclairé) le citoyen, seul vrai propriétaire , de ses données personnelles afin qu'autrui puisse les exploiter et servir ses intérêts particuliers.

Le PS français, qui surpasse même les plus néolibéraux de l'opposition, en a de ces idées et de ces graines de champion...qui privilégient l'intérêt des citoyens et combattent pour leurs droits et libertés fondamentales.

*ce n'est pas plus différent que le fichier client(-consommateur) de n'importe quelle entreprise, qui, a de la valeur lors de la vente
pour essayer de répondre à la question, voilà à peu près ce que j'en sais professionnellement, mais je ne suis pas un spécialiste à proprement parler :

une des grandes tendances du moment dans la recherche appliquée académique et surtout industrielle concernant l'exploitation des gros volumes de données est la "détection d'évènements" et plus généralement la détection de tendances/modes/opinions à partir des données collectées sur le web (typiquement les réseaux sociaux, blogs, forums, etc.).

Pour la détection d'évènements, comme son nom l'indique l'idée est d'être informé le plus vite possible d'un évènement : selon les cas on s'intéresse à l'info d'actualité ou à des domaines beaucoup plus spécialisés. ça intéresse directement les entreprises dans le business de l'info, mais aussi toute entreprise qui veut pouvoir réagir vite à un type particulier de nouvelles.
Ça peut inclure également la détection rapide d'un "buzz", pour pouvoir se faire de la pub gratuite à bon compte (ça rejoint donc le marketing viral).

Dans la catégorie déjà un peu ancienne de détection d'opinion, les entreprises sont principalement intéressées par les retours informels sur leurs produits et ceux des concurrents : qu'est-ce que les gens en disent, est-ce qu'ils en sont contents, comment les fidéliser davantage, etc.

Jusqu'à maintenant, à ma connaissance, cette exploitation de gros volumes de données porte principalement sur les comportements de masse, pas sur les comportements individuels : par exemple on s'intéresse à ce que pensent les jeunes de 15 à 22 ans de tel produit, pas de savoir si M. Robert Bidochon, âge 52, domicilié à Trifouilly les Oies a aimé ou non la dernière pub de Renault. j'ai bien dit "jusqu'à maintenant, à ma connaissance" ;-) Il y a une raison purement pratique à cela : on travaille sur des donnés essentiellement non structurées avec beaucoup de "bruit" (info non pertinente/erronnée), c-à-d à peu près l'inverse de fichiers individuels propres tel qu'on imagine des "données personnelles".
Je pense que je suis dans une position similaire à la vôtre (concerné professionnellement, mais pas spécialiste), et je constate les mêmes tendances. A une nuance près : dans le secteur où je travaille, les tendances identifiées aujourd'hui sont bien des comportements de masse, mais il y a une forte volonté d'aller vers une identification beaucoup plus précise. L'objectif est de pouvoir cibler très précisément les campagnes marketing et les services proposés à chaque client, avec une réactivité extrême.

Un exemple du genre de choses auxquelles les gens qui travaillent là-dedans rêveraient d'arriver : depuis son compte Facebook, Toto clique sur le bouton "j'aime" de la page de son équipe de foot préférée, le PSGOM. Dans les 24h qui suivent, il reçoit par email, texto ou téléphone une offre pour s'abonner à la formule spéciale "Super fan PSGOM", qui permet de suivre tous les matchs du club en direct pour 5€ par mois.

A ma connaissance, les grandes surfaces sont en pointe dans ce genre de choses, grâce à leurs cartes de fidélité. Voir cet article notamment (long et en anglais, mais très instructif) : http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html?pagewanted=1&_r=2&hp&
Oups,
merci
gamma
J'invite à lire les propositions du rapport de ce garçon, intitulé modestement "pour un new deal numérique", afin d'avoir les idées claires sur le contenu précis de cette étude, qui risque bien de se concrétiser en plan de développement si la ministre y est favorable.
On y voit plein de choses, sauf de l'open source, sauf des outils de contrôle de nos données (bien au contraire, en effet) et de nos outils (tout en saas, tout en loc'). C'est une vision comme une autre, rien ne dit qu'elle ne soit pas fonctionnelle, m'enfin, elle mériterait bien un débat.

DÉCOUVRIR NOS FORMULES D'ABONNEMENT SANS ENGAGEMENT

(Conditions générales d'utilisation et de vente)
Pourquoi s'abonner ?
  • Accès illimité à tous nos articles, chroniques et émissions
  • Téléchargement des émissions en MP3 ou MP4
  • Partage d'un contenu à ses proches gratuitement chaque semaine
  • Vote pour choisir les contenus en accès gratuit chaque jeudi
  • Sans engagement
Devenir
Asinaute

5 € / mois
ou 50 € / an

Je m'abonne
Asinaute
Généreux

10 € / mois
ou 100 € / an

Je m'abonne
Asinaute
en galère

2 € / mois
ou 22 € / an

Je m'abonne
Abonnement
« cadeau »


50 € / an

J'offre ASI

Professionnels et collectivités, retrouvez vos offres dédiées ici

Abonnez-vous

En vous abonnant, vous contribuez à une information sur les médias indépendante et sans pub.