>

Big Data et confidentialité : le rôle du RGPD [Partie I]

La confidentialité des données concerne chaque utilisateur de réseau Intranet et Internet au sein de la communauté mondiale du Big Data. Pourtant, nombreux sont les utilisateurs de réseaux sociaux, les clients de magasins en ligne, les employés ou encore les organisations mondiales qui n’ont pas pleinement conscience des risques que leurs activités en ligne leur font encourir. De même, bon nombre de personnes et d’entreprises ne savent pas qu’il existe certaines mesures qu’elles pourraient elles-mêmes mettre en œuvre pour se prémunir contre les risques les plus critiques.

Le Règlement Général sur la Protection des Données (RGPD) invite ainsi les individus et organisations dont la clientèle est basée dans l’Union européenne ainsi que dans d’autres pays à prendre des mesures de protection.

Les principales menaces à la vie privée et leur impact

Les analyses du Big Data peuvent porter atteinte à la confidentialité de différentes façons. Ainsi, les risques inhérents consistent en :

  1. La discrimination : utilisation des analyses prédictives en vue de la détermination des capacités de chacun.

Le gouvernement et les entreprises peuvent utiliser l’analyse prédictive des secteurs public et privé afin de déterminer la capacité de chacun à trouver un emploi, prendre un vol, obtenir une autorisation ou encore une carte de crédit. L’utilisation d’associations dans le cadre de l’analyse prédictive afin de favoriser la prise de décisions peut avoir des répercussions négatives sur les individus et donner lieu à des discriminations.

  1. L’embarras causé par les violations de sécurité : méfiance de l’opinion publique suite à la divulgation d’informations personnelles ou à des vols d’identité.

Nous citerons entre autres exemples les violations de données qui ont touché de gros détaillants, des chaînes de restaurant, marchés en ligne, agences gouvernementales, universités et autres groupes de média en ligne, ou encore le récent piratage qui a non seulement abouti à la mise en ligne de films inédits mais a également entraîné la divulgation des informations personnelles de milliers d’employés. En outre, la méfiance de l’opinion publique face aux fraudes à la carte de crédit et aux vols d’identité bat des records.

  1. La suppression de l’anonymat : la suppression de quelques jeux de données rend possible la réidentification.

Sans règle appliquée aux fichiers de données anonymes, il est possible de combiner des jeux de données. Il convient, en premier lieu, de déterminer s’il faut supprimer certains autres éléments de données avant de combiner ces jeux de données en vue de préserver l’anonymat. Autrement, il se peut que la réidentification des individus soit possible.

  1. Les exceptions gouvernementales : collecte et ajout d’un nombre croissant d’informations personnelles aux bases de données gouvernementales.

Par exemple, les citoyens américains voient leurs informations personnelles référencées dans plus de bases de données gouvernementales que jamais, notamment celle du FBI, qui collecte des informations personnelles identifiables telles que le nom, les noms d’usage, l’origine, le genre, les date et lieu de naissance, le numéro de sécurité sociale, les numéros de passeport et de permis de conduire, l’adresse, les numéros de téléphone, les photos, les empreintes digitales, des informations financières (par exemple, les comptes bancaires), des informations relatives à l’emploi, à l’entreprise, et bien plus encore. Mais qui garantit la qualité AAA de ces données ?

  1. Le courtage des données : vente de profils de données non protégés et erronés.

Bon nombre d’entreprises collectent et vendent des profils de consommateurs qui ne font l’objet d’aucune protection claire en vertu du cadre juridique actuel. Souvent, les fichiers de données utilisés aux fins des analyses du Big Data comportent des données erronées sur les individus et appliquent des modèles de données incorrects fondés sur des informations fournies par les individus ou sur des algorithmes faussés.

  1. L’interprétation erronée des données :un gros volume de données ne garantit pas leur qualité.

Même si une infinité d’opinions politiques sont exprimées sur les réseaux sociaux, elles ne sont pas pour autant représentatives de l’état d’esprit des électeurs. En effet, une part importante des tweets et autres publications Facebook dans ce domaine est générée par des ordinateurs.

Conclusion

La clé de la réussite, pour garantir la protection de la confidentialité des données pour les organisations dont la clientèle est en partie basée dans l’Union Européenne, repose sur une gestion et une gouvernance des informations efficaces. Dans mon prochain billet, j’aborderai en détail les changements nécessaires introduits par le RGPD.

Cet article, GRC Tuesdays: Part One – Big Data Privacy Risks and the Role of the GDPR, qui a fait l’objet d’une première publication en langue anglaise sur le blog SAP BusinessObjects Analytics, a été republié avec l’autorisation de son auteur.

Sources

Voir les replays de nos webinars RGPD