top of page

IA et droit d'auteur : les défis de l'exception de fouille de textes et de données

Les interactions entre l'intelligence artificielle et le droit s'articulent à deux niveaux : d'abord, lorsque l'IA utilise des créations protégées comme données d'entraînement ; ensuite, lorsqu'elle génère des contenus créatifs à partir de ces données. Cela soulève ainsi deux questions majeures : (1) L'IA est-elle autorisée à exploiter des œuvres protégées ? (2) Les créations générées par l'IA peuvent-elles être protégées par des droits d'auteur ? J'ai déjà abordé la deuxième question dans un article précédent. Aujourd'hui, je vous propose alors de répondre à la première, qui implique de se pencher sur une exception au droit d'auteur bien particulière : la fouille de textes et de données.


Intelligence artificielle et droits d'auteur

Sommaire

  1. Le principe de l'autorisation en droit d'auteur

  2. Les exceptions au droit d'auteur

  3. L'exception de fouille de textes et l'IA


1. Le principe de l'autorisation en droit d'auteur

Le droit d'auteur, tout comme le droit des marques ou des brevets par exemple, fait partie de la catégorie des droits de propriété intellectuelle. Dès lors que deux conditions sont remplies, à savoir l'existence d'une œuvre de l'esprit qui soit à la fois matérialisée (condition n°1) et originale (condition n°2), la création bénéficie automatiquement de la protection par le droit d'auteur, sans nécessiter de dépôt.


Les droits de propriété intellectuelle, dont fait partie le droit d'auteur, confèrent un monopole d'exploitation à leur titulaire. Autrement dit, la personne qui détient les droits d'auteur sur une œuvre est la seule à pouvoir en autoriser ou interdire l'exploitation par des tiers. Ce droit exclusif nécessite donc des autorisations formelles, qui se concrétisent par la conclusion de contrats, les deux principaux étant la licence et la cession.


Par conséquent, si une personne exploite une création protégée sans l'autorisation du titulaire, elle commet un acte de contrefaçon, qui constitue à la fois un délit civil et pénal. On peut ainsi définir la contrefaçon comme regroupant tous les actes d'exploitation d'un droit de propriété intellectuelle qu'elle qu'il soit, et ce sans l'autorisation de son titulaire.


On comprend donc que, par principe, toute exploitation d'une création protégée par le droit d'auteur, y compris dans le cadre du développement d'un système d'intelligence artificielle, nécessite impérativement l'autorisation du titulaire des droits. À défaut, la personne qui exploite l'œuvre sans cette autorisation s'expose à des poursuites pour contrefaçon, peu importe que l'utilisation soit commerciale ou non.


2. Les exceptions au droit d'auteur


Les exceptions au droit d’auteur constituent des dérogations au principe exclusif d'autorisation et d'interdiction qui appartient au titulaire des droits. Bien qu'une œuvre puisse satisfaire aux conditions de protection par le droit d’auteur, le Code de la propriété intellectuelle a prévu certaines exceptions, que l'on retrouve principalement à l'article L. 122-5. Ces exceptions résultent d’une quête d'équilibre entre les intérêts de l’auteur et ceux du public, justifiant ainsi que, dans certains cas, l’autorisation de l’auteur ne soit plus requise.


Parmi les exceptions les plus connues, on peut notamment citer l'exception de courte citation, l'exception de représentation privée, l'exception de copie privée, ainsi que l'exception de parodie par exemple. Il est essentiel de comprendre que chacune de ces exceptions, doit respecter les conditions très strictes qui sont énoncées. Si toutes les conditions ne sont pas remplies, l'exception ne pourra pas s'appliquer, et le principe de l'autorisation prévaudra.

Dans le contexte de l'intelligence artificielle, l'exception qui mérite une attention particulière est l'exception de fouille de textes et de données, qui est relativement récente.


Les limites et exceptions au droit d'auteur

3. L'exception de fouille de textes et l'IA


3.1 Historique et fonctionnement de l'exception de fouille de textes

Comme vous l'avez compris, il est par principe nécessaire d'obtenir une autorisation afin d'exploiter des créations protégées par le droit d'auteur, au risque de commettre un ou plusieurs actes de contrefaçon.


La Directive de 2019 (1) a néanmoins introduit une nouvelle exception au droit d'auteur, connue sous le nom de « fouille de textes et de données » ou « text and data mining » en anglais. La fouille de textes et de données est définie comme « la mise en œuvre d'une technique d'analyse automatisée de textes et données sous forme numérique afin d'en dégager des informations, notamment des constantes, des tendances et des corrélations ». Il s'agirait alors d'un processus qui consiste à analyser de grandes quantités de données textuelles ou numériques pour en extraire des informations utiles. Cette exception désormais transposée aux articles L. 122-5 10° et L. 122-5-3 du Code de la propriété intellectuelle.


On retrouve en réalité cette exception dans deux contextes différents :


  • aux fins de recherches scientifiques, d'une part, et

  • « quelle que soit la finalité de la fouille » d'autre part.


C'est ce second contexte qui nous intéresse particulièrement dans le cadre de l'IA, puisque nous ne sont pas dans une situation de recherche scientifique.


Article L. 122-3 III du Code de la propriété intellectuelle « Sans préjudice des dispositions du II, des copies ou reproductions numériques d'œuvres auxquelles il a été accédé de manière licite peuvent être réalisées en vue de fouilles de textes et de données menées à bien par toute personne, quelle que soit la finalité de la fouille, sauf si l'auteur s'y est opposé de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne. »

Il semblerait qu'à l'époque de la Directive de 2019 (1), l'exception de fouille de textes et de données n'ait pas été envisagée pour s'appliquer dans le contexte des interactions entre le droit d'auteur et l'IA. Pourtant, cette exception est devenue un véritable fourre-tout dans le domaine. Le fait qu'elle puisse être appliquée « quelle que soit la finalité de la fouille » ouvre bien la porte à son utilisation dans le cadre des IA, mais aussi dans de nombreux autres contextes, actuels ou futurs. Toutefois, cette exception ne peut être mise en œuvre que sous deux conditions :


  1. lorsque l'accès à la création est licite : il convient alors qu'il ne s'agisse pas d'une création obtenue illégalement ;

  2. lorsque l'auteur ne s'y est pas opposé : il s'agit ici de ce qu'on appelle l'exercice du droit d'opt out.


Malgré leur existence textuelle, ces deux conditions peuvent être discutées quand à leur réalité et leur effectivité. Il est facile d'imaginer que bon nombre des créations utilisées par les systèmes d'IA puissent provenir de sources illicites. En outre, le système d'opt out soulève diverses difficultés de mise en pratique.


3.2 La mise en pratique délicate du mécanisme d'opt out


Le mécanisme d'opt out permet aux titulaires de droits d'auteur de s'opposer à la fouille de leurs œuvres par des systèmes d'intelligence artificielle. Certains organismes de gestion collective ont d'ores-et-déjà communiqué avoir exercé leur droit d'opt out :


« Dans l’intérêt des auteurs et autrices qu’elle représente, la SAIF a décidé d’exercer son droit d’opposition générale à toute exploitation de l’ensemble des œuvres de son répertoire par les services d’intelligence artificielle. Les opérateurs d’intelligence artificielle quels qu’ils soient devront désormais obtenir l’autorisation préalable de la SAIF et négocier les conditions d’exploitation des œuvres de son répertoire. Considérant qu’un tel droit d’opposition n’est pas suffisant pour faire respecter le droit de ses auteurs et autrices, tant d’un point de vue juridique que des difficultés techniques de son véritable exercice au regard du nombre d’images déjà en circulation, la SAIF continuera d’œuvrer en faveur d’une modification législative qui permettrait la mise en place d’un véritable système de rémunération équitable des auteurs et des autrices. » La SAIF exerce son droit d'opt out, communiqué de presse, décembre 2023

L'article R. 122-28 du Code de la propriété intellectuelle (4) précise que le droit d'opt out « n'a pas à être motivée et peut être exprimée par tout moyen. Dans le cas de contenus mis à la disposition du public en ligne, cette opposition peut notamment être exprimée au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d'utilisation d'un site internet ou d'un service. » 


Toutefois, l'effectivité de ce droit est bien plus complexe et sujette à débat pour plusieurs raisons :


  1. Sensibilisation des auteurs : beaucoup d'auteurs ne sont pas informés de l'existence de ce droit d'opt out et n'en connaissent pas les implications. Ainsi, sans une sensibilisation adéquate, ce droit peut devenir une simple formalité sans impact réel sur la protection des œuvres ;

  2. Un droit circonscrit aux auteurs : Contrairement à ce que prévoit la Directive de 2019 (1), qui affirme que tous les titulaires de droits peuvent exercer l'opt-out, l'ordonnance de transposition a restreint cela aux seuls auteurs. Cette limitation (de tous les titulaires de droits aux seuls auteurs) restreint notamment la capacité des éditeurs, producteurs et autres titulaires de droits à protéger leurs intérêts, rendant ainsi le mécanisme moins efficace ;

  3. Mise en œuvre technique : la manière dont il convient de signaler et d'implémenter techniquement son droit d'opt-out reste floue, et pourrait être source d'insécurité juridique. Un cadre technique solide serait donc nécessaire pour garantir que ce droit puisse être exercé de manière efficace pour tous les auteurs.

  4. Transparence : Une fois le droit d'opt-out exercé, il est très difficile de s'assurer que la création n'est effectivement pas exploitée. Malgré leur opt-out, les auteurs n'ont aucune visibilité sur les exploitations passées ou futures de leurs créations. Les mesures de transparence prévues par le Règlement sur l'IA (5) permettront-elles de remédier à cette problématique ? Cela reste encore à voir... !


3.3 La légalité discutable du mécanisme d'opt out


Au-delà de toutes ces considérations, on peut également se demander si cette exception est conforme à ce qu'on appelle le triple test que toutes les exceptions au droit d'auteur doivent valider, et dont le principe est rappelé au Considérant 6 de la Directive de 2019 (1). Le triple test est un garde fou des exceptions au droit d'auteur, qui prévoit qu'elles doivent respecter les trois conditions suivantes :


  1. Être limitées à certains cas spéciaux ;

  2. Ne pas porter atteinte à l'exploitation normale de l'oeuvre ;

  3. Ne pas causer un préjudice injustifié aux intérêts légitimes de l'auteur.


Cependant, il apparaît que chacune de ces conditions est largement contestable, notamment en raison de l'ampleur des exploitations actuelles et futures des œuvres protégées par l'intelligence artificielle, qui ne relèvent pas vraiment de cas spéciaux. De plus, cette situation a le potentiel de perturber sérieusement l'exploitation normale des œuvres, engendrant ainsi un risque significatif de préjudice pour les auteurs, ce que l'on constate déjà largement.

« En l’état actuel, c’est tout le modèle économique de la création qui est en danger. Si la propriété intellectuelle peut se voir accaparée, comme c’est le cas aujourd’hui, à travers les intelligences artificielles génératrices de contenus, le préjudice est totalement hors de proportion puisqu’il remet en cause la valeur même de la propriété intellectuelle. » Le Cam, Stéphanie, et Maupomé, Frédéric. "IA génératives de contenus : pour une obligation de transparence des bases de données !" IP/IT et Communication, 11 mai 2023 (6)

--


Pour conclure...


Alors que le droit de la propriété intellectuelle impose un principe d'autorisation pour l'exploitation des créations protégées par des droits d'auteur, l'exception de fouille de textes et de données ouvre la porte à une exploitation massive des œuvres sans autorisation préalable. Et, bien que le droit d'opt out semble permettre aux auteurs de s'opposer à la mise en oeuvre de cette exception, on observe des limites significatives. De plus, l'absence de clarté sur son fonctionnement et le manque d'assurance quant à son efficacité semblent compromettre l'action des auteurs, les rendant alors vulnérables quant aux actes de contrefaçon réalisés dans le contexte de l'IA. À cela s'ajoute la question de la conformité de cette exception au triple test, qui vise à protéger les droits des créateurs tout en encadrant strictement les exceptions au droit d'auteur...


 

Si cet article vous a plu, je vous serais très reconnaissante de me soutenir en laissant un petit like et un commentaire sur ma publication LinkedIn ! 🙏✨



 







Comments


bottom of page