CONTACT

Editeurs de site internet : est-il opportun de vous opposer à l’utilisation de vos données à des fins d’entrainement des IA ?

19 juillet 2023 | Derriennic Associés|

Le Syndicat national des l’édition (SNE) a publié une clause type, permettant aux éditeurs de s’opposer à la fouille de textes et de données sur internet. L’occasion de revenir sur l’entraînement des IA au moyen de contenus diffusés sur Internet et la manière de s’y opposer. Nos avocats en droit de la propriété intellectuelle vous apportent leur expertise.

Le contexte. La fouilles de textes et de données (ou « text and data mining » – TDM) est une technique visant à analyser de manière automatique, au travers de procédés informatiques, des informations, modèles et connaissances sur la base de grands ensembles de données. Le TDM permet d’explorer les données, de les prétraiter, de les analyser et d’en extraire des informations exploitables.

Le développement des IA, en particulier des IA génératives, et leur besoin d’entrainement à partir d’un nombre considérable de données a accéléré le recours la fouille de données. Nous le rappelions dans notre précédente publication IA et PI : la fouille de données facilitée.

S’interroger : une nécessité ! Il est désormais essentiel pour tout éditeur de site internet, notamment producteur de bases de données ou éditeur de presse, de s’interroger sur :

  • la valeur économique de ces contenus ;
  • le potentiel de monétisation du recours massif voire répété à ces contenus dans le cadre d’une fouille automatisée de données, notamment aux fins d’entrainement des IA ;
  • la pertinence de s’opposer à une réutilisation de ses contenus par tout ou partie des tiers de manière générale ou spécifique.

La règle. La fouille de données est en effet une exception au droit d’auteur, aux droits voisins et aux droits sui generis du producteur de bases de données mises à disposition du public (Code de la propriété intellectuelle, art. L. 122-5-3, L211-3 et L 342-3).

Cette exception permet la reproduction numérique de tout contenu auquel il a été accédé de manière licite. Ces actes de reproduction peuvent être exercés « par toute personne, quelle que soit la finalité de la fouille » – y compris à des fins commerciales -. Ils n’ont donc – par principe – pas besoin d’être autorisés par le titulaire des droits !

Les titulaires des droits sur les contenus peuvent cependant s’opposer à la fouille de texte « de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne ». Cet « opt-out » n’a pas besoin d’être motivé. Il peut être exprimé par tout moyen, particulièrement « au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d’utilisation d’un site internet ou d’un service » (CPI, art. R122-28).

Recommandations. Editeurs, si vous souhaitez vous opposer à la fouille de texte, que ce soit de manière générale, comme de manière plus spécifique, il convient de le prévoir explicitement dans vos conditions générales d’utilisation (CGU) ou dans vos mentions légales.

La clause type proposée par le SNE constitue une base utile. Le cabinet Derriennic Associées est de plus à votre disposition pour adapter ces clauses à vos contraintes et à votre contexte spécifique.

A noter que ces protections contractuelles peuvent se doubler par des protections techniques, afin que l’opt out puisse être exercé par l’usage de métadonnées lisibles par les machines. Le SNE recommande à cet égard le standard de métadonnées développé par EDRLab (TDM Reservation Protocol – TDMRep).

Source : SNE – Une clause-type pour s’opposer à la fouille de textes et de données par les intelligences artificielles