Pour grandir, l'IA générative se tourne vers les livres

Bombay Durpun - Pour grandir, l'IA générative se tourne vers les livres

Mumbai 27°C

AED 3.821057

AFN 73.006821

ALL 98.512217

AMD 415.678797

ANG 1.873062

AOA 948.764769

ARS 1069.072052

AUD 1.649931

AWG 1.872562

AZN 1.770572

BAM 1.955447

BBD 2.098421

BDT 124.19758

BGN 1.956839

BHD 0.392129

BIF 3072.506989

BMD 1.040312

BND 1.411906

BOB 7.181704

BRL 6.505282

BSD 1.039312

BTN 88.499776

BWP 14.434394

BYN 3.401186

BYR 20390.119174

BZD 2.091322

CAD 1.49394

CDF 2985.696084

CHF 0.935655

CLF 0.037305

CLP 1029.367761

CNY 7.592096

CNH 7.600745

COP 4550.231947

CRC 527.704739

CUC 1.040312

CUP 27.568273

CVE 110.282725

CZK 25.128844

DJF 185.07659

DKK 7.463155

DOP 63.308572

DZD 140.574623

EGP 52.912125

ERN 15.604683

ETB 132.329112

FJD 2.41212

FKP 0.823909

GBP 0.828868

GEL 2.923205

GGP 0.823909

GHS 15.283044

GIP 0.823909

GMD 74.902906

GNF 8982.3785

GTQ 8.008518

GYD 217.440748

HKD 8.07922

HNL 26.406233

HRK 7.462062

HTG 135.862824

HUF 411.523555

IDR 16866.581743

ILS 3.79457

IMP 0.823909

INR 88.831167

IQD 1361.45423

IRR 43784.131855

ISK 145.175469

JEP 0.823909

JMD 161.930768

JOD 0.737895

JPY 163.687937

KES 134.324804

KGS 90.506913

KHR 4176.242501

KMF 484.915563

KPW 936.280401

KRW 1516.624314

KWD 0.320604

KYD 0.866144

KZT 538.412806

LAK 22728.896977

LBP 93069.29912

LKR 306.304706

LRD 189.22587

LSL 19.325111

LTL 3.071771

LVL 0.629274

LYD 5.102079

MAD 10.480808

MDL 19.175538

MGA 4902.11507

MKD 61.518895

MMK 3378.893454

MNT 3534.98073

MOP 8.314299

MRU 41.48851

MUR 48.96761

MVR 16.02902

MWK 1802.174671

MXN 20.97774

MYR 4.667854

MZN 66.479829

NAD 19.325111

NGN 1603.786908

NIO 38.243096

NOK 11.804528

NPR 141.547448

NZD 1.842566

OMR 0.400258

PAB 1.039312

PEN 3.870101

PGK 4.218239

PHP 60.909762

PKR 289.341068

PLN 4.260908

PYG 8105.536788

QAR 3.781353

RON 4.977166

RSD 116.947785

RUB 103.957734

RWF 1449.838275

SAR 3.906518

SBD 8.721515

SCR 14.841021

SDG 625.744421

SEK 11.551938

SGD 1.413264

SHP 0.823909

SLE 23.721347

SLL 21814.829886

SOS 593.992772

SRD 36.471239

STD 21532.362215

SVC 9.094358

SYP 2613.815872

SZL 19.33351

THB 35.547799

TJS 11.374265

TMT 3.651496

TND 3.31516

TOP 2.436519

TRY 36.73036

TTD 7.062725

TWD 34.010202

TZS 2517.555813

UAH 43.577933

UGX 3804.313245

USD 1.040312

UYU 46.277438

UZS 13417.577857

VES 53.654247

VND 26444.736193

VUV 123.507948

WST 2.874162

XAF 655.838608

XAG 0.035157

XAU 0.000398

XCD 2.811496

XDR 0.796856

XOF 655.838608

XPF 119.331742

YER 260.468147

ZAR 19.379149

ZMK 9364.060487

ZMW 28.762808

ZWL 334.980105

AEX

4.0100

876.26

+0.46%
BEL20

22.8100

4246.05

+0.54%
PX1

10.9100

7282.69

+0.15%
ISEQ

43.5100

9712.3

+0.45%
OSEBX

7.4200

1408

+0.53%
PSI20

20.1800

6325.74

+0.32%
ENTEC

-5.8300

1416.23

-0.41%
BIOTK

40.4000

3055.65

+1.34%
N150

6.7900

3238.97

+0.21%

Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

CULTURE 22.11.2024

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

K.Williams--BD

Bombay Durpun - Pour grandir, l'IA générative se tourne vers les livres

Pour grandir, l'IA générative se tourne vers les livres

En vedette

Pour le photographe de l'AFP Sameer al-Doumy, un retour émouvant dans sa ville syrienne

Iran: le Conseil suprême du cyberespace vote pour la levée de l'interdiction de WhatsApp

Notre-Dame accueille ses premières messes de Noël depuis l'incendie de 2019

Bassin d'Arcachon: un an après la pollution, la filière ostréicole peine à se relever