Récupérer mes données,
chez ceux qui collectent mes données

Publié le 30 octobre 2020, par Richard Carlier
Série: Datas from GAFAM
#analyse #collecte #data #gafam #rgpd

Dans ce premier épisode consacré aux données des Géants du Web, (enfin, nos données), je commence par la collecte.

Nombre d’entre eux ont des routines faciles, dès que l’on connait le lien pour les demander.

Donc, je me lance: je demande à tous !

Pour certain, je n’ai pas encore trouvé comment le faire, ou pas fait le tour de tous (cette page peut donc évoluer au fil du temps, et de mes disponibilités…)

Qui sont les géants du Web ?

On les appelle souvent les GAFAM, acronyme de Google Amazon Facebook Apple et Microsoft. Ceux là sont les plus importants, beaucoup d’autres peuvent nous intéresser dans le cadre de mon étude.

Pour l’aspect qui nous préoccupe, les services en question nous proposent des services gratuitement (en grande partie du moins), en échange de l’autorisation d’exploiter nos données, souvent pour nous proposer des publicités ciblées. Services gratuits qui sont à la base d’une partie de leur richesse (voir How Big Tech Makes Their Billions).

Comme la plupart d’entre nous acceptons les Conditions Générales d’Utilisation sans les lire (il faut dire que les lire est fastidieux, voir l’infographie de la longueur des textes en question), cela leur réussi plutôt bien.

Obligation de communication

La RGPD impose aux entreprises qui collectent des données de les mettre à disposition des personnes qui les produisent. Car en tant que producteur de ces données, elles nous appartiennent. Mais ne précise pas sous quelle forme exacte ces données doivent être fournies.

Ce qui, bien sûr, me titille un peu en tant que Data Lover (et en tant que citoyen aussi, d’ailleurs…)

Alors, allons-y.

Je me lance : je leur demande à tous, et j’étudie le résultat.

Parcours du combattant ?

Globalement, trouver l’endroit pour télécharger ses données n’est pas toujours simple, pas réellement mis en avant.

Pour certain services aller sur son compte, puis confidentialité, puis télécharger vos données (ou équivalent) suffit. Pour d’autre, un passage par un moteur de recherche externe permet de les trouver plus facilement. Ironie: on utilise Google pour trouver des infos sur Microsoft ou Facebook…

Pour certains, je n’ai toujours par réussi… peut-être car je n’ai pas cherché assez…

Précisons également que, même si je suis consommateur de ces services, je suis un petit consommateur, les volumes générés sont donc sans doute peu représentatifs…

Je vous simplifie la vie, voici la procédure, service par service (à date du 25/10/2020).

Google

Un site est dédié à cela. TakeOut (soustraire, faire sortir…).

Vous êtes connecté, vous choisissez dans une looongue liste ce que vous voulez récupérer, et pour certains, sous quelle forme (csv, json…). Parfois également la possibilité de prendre quelques options de filtrage.

Bien sûr, cela risque d’être lourd, surtout si l’on coche les options videos Youtube (que vous produisez), photos, drive, messagerie… Pour voir (je suis joueur) j’ai tout pris.

Ils m’annoncent que le processus peut être long, prendre des heures voire des jours, et que je serais prévenu…

Le temps d’écrire le début de l’article, les 15 fichiers zip étaient prêts… pour 27Go (les vidéos de ma chaine Youtube très certainement). Précisons aussi qu’ils n’ont pas pu récupérer certains éléments… Hum ? Détail à suivre…

Apple

Là aussi, un endroit spécifique, Données et confidentialité.

Après s’être identifié, là aussi une liste (plus courte) d’options et de choix. Moins joueur, je n’ai pas pris les photos (j’ai déjà une sauvegarde par ailleurs).

Et ils me disent que cela peut prendre jusqu’à 7 jours… Cela en a pris 5.

A noter que pour l’application Santé, c’est directement depuis l’application qu’il faut les récupérer. A ce jour, allez dans l’avatar (tête en haut à droite), et choisissez Exporter les données

Facebook

Plus simple, c’est depuis votre compte que cela se passe. Dans le menu en haut à droite (une sorte de triangle vers le bas), une option paramètre et confidentialité, puis paramètres, puis vos informations Facebook, puis téléchargez vos informations.

S’ensuit une très loooooongue liste d’options pour sélectionner ce que vous désirez. La encore, je suis joueur, j’ai tout pris.

Sans annoncer de délais, ils me préviendrons que le fichier sera prêt (à noter que, le temps que je commence la rédaction de cet article, et mes 81 Mo de données étaient prêts – je suis un petit consommateur de Facebook).

Amazon

Un peu plus de mal à le trouver, mais cela se passe sur la page demander mes données. Ils insistent sur le fait que la plupart des informations sont accessibles via de multiples menus de votre compte: historique, adresses, commandes, etc.

S’y trouve un déroulant permettant de choisir ce que l’on veut (et en bas, pour les joueur, l’option toutes les données).

Pour eux, cela peut prendre jusqu’à un mois, selon le volume de données… Sans être méchant, mon archive sera plus rapide à générer que celle de ma chère épouse…

Microsoft

Là aussi, beaucoup de mal à le trouver, alors qu’il suffit d’aller dans la gestion de son compte. Il faut dire que je me sers peu des outils Microsoft.

On choisit l’onglet Télécharger vos données, puis Créer une nouvelle archive et enfin on sélectionne dans une petite liste les éléments qui nous intéresse.

Ils m’annoncent que mon archive sera généralement disponible en quelques minutes, et effectivement, là aussi le temps que je commence l’article, elles étaient prêtes. Une archive de 699 octets… J’ai peut être pas pris le compte le plus intéressant à étudier…

Linkedin

Appartient désormais à Microsoft, mais nécessite une demande particulière. Là, c’est dans Préférence et confidentialité, puis obtenir une copie de vos données.

On a alors le choix entre télécharger des archives plus importantes, ou choisissez ce qui vous intéresse. J’ai pris le tout, je suis joueur, souvenez vous.

Le temps d’écrire le début de l’article, j’ai reçu un mail avec la première partie des informations. Ils ont prévenus que l’autre partie serait plus longue… mais est arrivée le lendemain. En tout, 150 Ko.

Twitter

Il faut aller dans plus (dans la barre de navigation) et choisir Paramètres et confidentialité, puis Téléchargez une archive de vos données.

Après confirmation du mot de passe, ils annoncent qu’ils préparent les données. Sans donner de délais, mais nous ne pourrons pas refaire de demande avant 30 jours. A noter qu’avec l’API twitter, récupérer ses données au fur et à mesure est possible.

Deux jours, pour 11,6 Mo.

Adobe

Pour celui ci, je n’ai pas trouvé. Il fallait bien un mauvais élève… mais peut être n’ai-je pas assez cherché…

N’utilisant plus les produits Adobe (voir pourquoi sur Bonjour Catalina, adieu CS5 et ses 32bits… ), j’aurais sans doute peu de données…

Si je trouve (ou si vous connaissez, faites le moi savoir sur Twitter) je rectifierai cet article.

Les autres ?

Je ne suis pas utilisateur de tous les services existants, mais peut être que j’en ajouterais d’autre ponctuellement.

  • Discord : On va des les paramètres utilisateur, onglet Confidentialité & Sécurité. Ne reste plus qu’à cliquer sur le bouton Demander toutes mes données. Que l’on reçoit sous 30 jours à priori.

N’hésitez pas, là encore, à m’en suggérer sur Twitter.

Et après ?

Bien sûr, dans mon cas, récupérer les données n’est qu’une première étape, qui mérite quelques premières conclusions:

  • Récupérer les fichiers est globalement assez simple, dès que la page de départ est connue. Elle n’est pas réellement mise en avant, mais à de rares exception, elle n’est pas cachée
  • La production des archives va assez vite (mais je suis un faible consommateur de certains services). Je suis impatient de voir sous quelle forme cela va se trouver, et si je pourrais en faire quelque chose…
  • Attention à la lourdeur de certains fichiers (présence de photos, vidéos…)
  • Pour certain, il y a une date d’expiration pour les récupérer (mais au pire, la possibilité de refaire une demande).

Les étapes suivantes, qui feront l’objet d’articles spécifiques, seront d’analyser les données récupérées.

Au fil de mon temps disponible, abonnez vous à mon twitter pour être au courant.

A suivre.

Top