Dubai Telegraph - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.276798
AFN 76.973093
ALL 96.541337
AMD 443.660189
ANG 2.0846
AOA 1067.888653
ARS 1669.958677
AUD 1.752514
AWG 2.096182
AZN 1.984351
BAM 1.955625
BBD 2.34549
BDT 142.477215
BGN 1.956439
BHD 0.438161
BIF 3440.791247
BMD 1.164546
BND 1.508565
BOB 8.047278
BRL 6.334667
BSD 1.164496
BTN 104.702605
BWP 15.471612
BYN 3.348
BYR 22825.091832
BZD 2.34209
CAD 1.610159
CDF 2599.265981
CHF 0.936209
CLF 0.027366
CLP 1073.571668
CNY 8.233458
CNH 8.232219
COP 4424.302993
CRC 568.848955
CUC 1.164546
CUP 30.860456
CVE 110.255106
CZK 24.203336
DJF 207.371392
DKK 7.470448
DOP 74.533312
DZD 151.068444
EGP 55.295038
ERN 17.468183
ETB 180.629892
FJD 2.632397
FKP 0.873977
GBP 0.872678
GEL 3.138497
GGP 0.873977
GHS 13.246811
GIP 0.873977
GMD 85.012236
GNF 10119.091982
GTQ 8.9202
GYD 243.638138
HKD 9.065875
HNL 30.671248
HRK 7.535429
HTG 152.446321
HUF 381.994667
IDR 19435.740377
ILS 3.768132
IMP 0.873977
INR 104.760771
IQD 1525.563106
IRR 49041.926882
ISK 149.038983
JEP 0.873977
JMD 186.393274
JOD 0.825709
JPY 180.924237
KES 150.636483
KGS 101.839952
KHR 4662.581612
KMF 491.43861
KPW 1048.137083
KRW 1716.311573
KWD 0.357481
KYD 0.970513
KZT 588.927154
LAK 25252.733992
LBP 104283.942272
LKR 359.197768
LRD 204.961608
LSL 19.736529
LTL 3.438601
LVL 0.704422
LYD 6.330432
MAD 10.755735
MDL 19.814222
MGA 5194.533878
MKD 61.634469
MMK 2445.172268
MNT 4132.506664
MOP 9.338362
MRU 46.438833
MUR 53.651052
MVR 17.938355
MWK 2019.3188
MXN 21.165153
MYR 4.787492
MZN 74.426542
NAD 19.736529
NGN 1688.68458
NIO 42.856154
NOK 11.767853
NPR 167.523968
NZD 2.015483
OMR 0.44694
PAB 1.164595
PEN 3.914449
PGK 4.941557
PHP 68.66747
PKR 326.476804
PLN 4.229804
PYG 8009.281302
QAR 4.244719
RON 5.092096
RSD 117.389466
RUB 89.441974
RWF 1694.347961
SAR 4.370508
SBD 9.584899
SCR 15.747587
SDG 700.4784
SEK 10.946786
SGD 1.508673
SHP 0.873711
SLE 27.603998
SLL 24419.93473
SOS 664.340387
SRD 44.985272
STD 24103.740676
STN 24.497802
SVC 10.190086
SYP 12876.900539
SZL 19.72123
THB 37.119932
TJS 10.684641
TMT 4.087555
TND 3.416093
TOP 2.803946
TRY 49.523506
TTD 7.894292
TWD 36.437508
TZS 2841.64501
UAH 48.888813
UGX 4119.630333
USD 1.164546
UYU 45.545913
UZS 13931.74986
VES 296.437311
VND 30697.419423
VUV 142.156724
WST 3.247609
XAF 655.898144
XAG 0.019964
XAU 0.000277
XCD 3.147243
XCG 2.098812
XDR 0.815727
XOF 655.898144
XPF 119.331742
YER 277.802752
ZAR 19.711451
ZMK 10482.311144
ZMW 26.923584
ZWL 374.983176
  • AEX

    -0.2800

    947.5

    -0.03%

  • BEL20

    16.5400

    5029.74

    +0.33%

  • PX1

    -7.3100

    8114.74

    -0.09%

  • ISEQ

    -5.1000

    12741.69

    -0.04%

  • OSEBX

    7.1500

    1632.45

    +0.44%

  • PSI20

    -40.3700

    8198.25

    -0.49%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -87.0000

    4263

    -2%

  • N150

    13.5900

    3685.24

    +0.37%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.El-Nayady--DT