« Les contenus utilisés pour entraîner les IA ont une valeur et un prix »

Alexandra Bensamoun est spécialiste du droit d’auteur et professeure à l’université Paris-Saclay. Après avoir participé au rapport de la Commission de l’intelligence artificielle (IA), rendu en mars au gouvernement, elle s’est vu confier par le ministère de la culture – par l’entremise du Conseil supérieur de la propriété littéraire et artistique – une mission sur l’application d’une disposition très débattue du règlement européen AI Act : l’obligation, pour les fabricants d’IA, de fournir un résumé détaillé des données (articles, livres, photos…) utilisées en vue d’entraîner leurs modèles.

Son rapport sur ce point, qui avait suscité l’opposition de Paris et d’entreprises comme Mistral ou Meta, est attendu fin 2024, avant le sommet international de l’IA à Paris, en février 2025. M^me Bensamoun a aussi été missionnée pour rendre un avis sur les modèles d’affaires entre fabricants d’IA et propriétaires de contenus (presse, édition, musique…), un autre dossier délicat, alors qu’ont été noués de premiers accords rémunérés entre OpenAI et le Financial Times, News Corp (The Wall Street Journal…), Prisa Media (El Pais) ou, en France, Le Monde.

Pourquoi l’IA bouscule-t-elle le droit d’auteur ?

Le droit d’auteur est né d’une révolution technique : l’imprimerie. Et toutes les révolutions technologiques l’ont bousculé : l’Internet, le Web mobile, le streaming… Aujourd’hui, c’est au tour de l’IA de s’y opposer. En effet, l’IA générative, qui produit des textes, des images ou des sons, a besoin d’être entraînée sur des données de qualité. Et les contenus de la culture et des médias sont des données de qualité. Donc le droit d’auteur s’inscrit dans la chaîne de valeur de la conception d’une IA et doit être valorisé.

Comment concilier les deux principes contradictoires de l’AI Act : l’obligation, pour les fabricants d’IA, de fournir un résumé détaillé des données d’entraînement et leur droit d’invoquer le secret des affaires pour préserver leur savoir-faire ?

L’important, c’est de sortir des postures et de reconnaître qu’il existe une chaîne de valeur. On paie tous les intrants : les puces informatiques, les talents, l’électricité… Les contenus utilisés pour entraîner les IA ont aussi un prix. La difficulté, c’est que l’AI Act prévoit que ce résumé des données soit mis à la disposition de tous. Cela aurait peut-être été intéressant de le confier à un intermédiaire [par exemple, le Bureau européen de l’IA] pour préserver, si nécessaire, la confidentialité.

Cela étant, on ne peut pas invoquer le secret des affaires pour se dispenser d’appliquer la loi. Par ailleurs, ce concept est mentionné dans les considérants explicatifs [des annexes] du texte, mais pas dans la disposition elle-même, qui a force de loi.

Il vous reste 79.01% de cet article à lire. La suite est réservée aux abonnés.

#Les #contenus #utilisés #pour #entraîner #les #ont #une #valeur #prix

Source link

Home

« Les contenus utilisés pour entraîner les IA ont une valeur et un prix »

Pourquoi l’IA bouscule-t-elle le droit d’auteur ?

Comment concilier les deux principes contradictoires de l’AI Act : l’obligation, pour les fabricants d’IA, de fournir un résumé détaillé des données d’entraînement et leur droit d’invoquer le secret des affaires pour préserver leur savoir-faire ?

Publications similaires

Laisser un commentaire Annuler la réponse