Qu’est-ce que la data éthique ?

novembre 30, 2021
lsandil
Définition de la data éthique
L’éthique des données fait référence à l’ensemble de comportements à adopter pour assurer la protection des données personnelles. La numérisation de la société ainsi que le développement technologique ont généré une quantité croissante de données, et plus particulièrement avec le grand nombre d’applications informatiques.
Les principes de la data éthique sont le respect du droit des personnes, la sécurité et la confidentialité, la durée limitée de conservation des données, et surtout la transparence des entreprises utilisant ces données.
Les progrès technologiques face à l’éthique : quels sont les risques ?
Face à tous les progrès technologiques de ces dernières années, la question de l’éthique des données s’impose comme une problématique majeure. En effet, jusqu’à aujourd’hui, la recherche s’était principalement concentrée sur les innovations technologiques, mais encore peu sur les risques éthiques qu’elles engendrent.
Les dérives associées au « big data » sont nombreuses : profilage, biais algorithmiques, utilisation abusive des données personnelles, etc. Des scandales ont d’ailleurs vu le jour ces dernières années, comme c’était le cas en 2018 avec l’affaire Cambridge Analytica et les données Facebook.
Concernant les biais algorithmiques, ils font référence aux risques d’introduction de discriminations liées à la conception des algorithmes. Par conséquent, les progrès en matière d’intelligence artificielle peuvent représenter de réels enjeux sociaux et moraux. C’est d’autant plus vrai qu’une majorité d’hommes représente le secteur de l’IA, ce qui peut faire apparaître des biais sexistes.
Les chiffres clés de la data éthique en 2021
Aujourd’hui, nous produisons environ 50 000 Go de données chaque seconde. L’utilisation de la data s’est complètement démocratisée, et la méfiance s’est aussi agrandie : d’après une étude Harris Interactive en 2016, 75 % des Français n’accordent pas leur confiance quant à l’utilisation des données sur les sites de vente en ligne.
Depuis longtemps, l’éthique est devenue un principe fondamental de la majorité des entreprises. Mais le développement de l’intelligence artificielle et de l’automatisation a généré de nouvelles problématiques, auxquelles les dirigeants doivent se préparer : 89 % d’entre eux, à l’échelle mondiale, affirment avoir été confrontés à un dilemme éthique concernant l’utilisation accrue de ces nouvelles technologies (Avanade, 2019).
Quels sont les leviers pour rassurer l’utilisateur ?
Dans ce cadre d’insécurité en termes de données personnelles, des comités sont apparus afin d’anticiper les risques possibles et de faciliter les prises de décisions. Le sujet de la data éthique est désormais au cœur des débats et des préoccupations de la société.
Des politiques de confidentialité et des lois pour protéger les consommateurs sont mises en place par les gouvernements, dont le RGPD (Règlement Général sur la Protection des Données). Ce texte réglementaire européen vise à encadrer le traitement des données depuis 2018, afin d’accorder davantage de contrôle aux citoyens sur les données qu’ils partagent.
Les limites des réglementations actuelles en matière de Big Data
Les réglementations actuelles, telles que le RGPD en Europe, ne sont pas suffisantes pour garantir l’éthique des données. En effet, elles ne s’appliquent qu’à un territoire donné sans prendre en compte les données collectées par les entreprises étrangères. Les consommateurs européens protégés par la réglementation RGPD ne le sont donc que sur les sites internet des entreprises européennes.
Malgré la volonté de l’ONU de mettre en place une réglementation à l’échelle internationale, ce n’est encore qu’une utopie. Ce sont donc aux entreprises d’intégrer une nouvelle culture en matière de data, en donnant le pouvoir au consommateur de contrôler le type de données partagées.
Enfin, la connaissance en matière de biais algorithmiques est encore insuffisante, ou en tout cas trop réservée aux GAFA. L’intelligence artificielle peut effectivement être au service de l’humain, mais la vraie question est de savoir ce que l’on fait des données obtenues.
Qu’en est-il de l’éthique des données sur les moteurs de recherche ?
Les préoccupations concernant la data éthique touchent aussi les moteurs de recherche, ces derniers conservant toutes les données des internautes telles que les mots-clés, les dates de visite ou encore les liens sur lesquels ils cliquent. Les plus grands moteurs de recherche sont Google, en première position, suivi de Bing et Yahoo.
Cependant, ces dernières années, quelques moteurs de recherche « plus éthiques » sont arrivés sur le marché.
C’est le cas de Qwant depuis 2013, qui place l’éthique au cœur de son modèle et propose une alternative qui respecte la vie privée de ses utilisateurs. Même chose pour le moteur de recherche DuckDuckGo, ou encore Brave qui bloque les publicités et les traqueurs. Dans le même esprit, Ecosia fait la promesse de « planter des arbres » grâce aux revenus générés par les recherches, tout en garantissant de ne jamais vendre les données collectées.
La question que l’on se pose est la suivante : ces alternatives aux géants Google ou Yahoo respectent-elles vraiment la vie privée des internautes ? En effet, les résultats de recherche sont ceux de Microsoft, ce qui laisse penser que les données lui sont envoyées. Mais d’après ces entreprises, il y aurait des accords d’anonymisation de l’historique de recherche et des adresses IP afin d’empêcher l’identification des internautes.
Des initiatives en faveur de la data éthique
L’éthique des données ne doit pas être un frein à l’innovation, bien au contraire. Le monde de demain devra se construire grâce à des discussions ouvertes et collaboratives avec les consommateurs, et une réflexion approfondie de la manière dont nous utilisons les données.
De nombreux projets et initiatives voient le jour, utilisant le big data éthiquement pour avoir un impact positif sur la société. C’est le cas par exemple du projet Health Data Hub, une plateforme française dont l’objectif est d’utiliser les bases de données de santé à des fins de recherches médicales.
On parle aussi de l’approche « Smart Data » pour remplacer le big data : le but est d’utiliser uniquement les données nécessaires sans stockage inutile, et ainsi de permettre un bon investissement pour l’avenir. C’est une démarche plus responsable, éthique et durable dans la collecte de données.