Dubai Telegraph - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.212777
AFN 72.835586
ALL 94.512843
AMD 422.248264
ANG 2.053494
AOA 1052.895931
ARS 1680.790338
AUD 1.635257
AWG 2.067368
AZN 1.95436
BAM 1.956354
BBD 2.309354
BDT 140.73988
BGN 1.939347
BHD 0.432422
BIF 3423.630825
BMD 1.146945
BND 1.480319
BOB 7.92328
BRL 5.90941
BSD 1.146625
BTN 108.087801
BWP 15.582008
BYN 3.185903
BYR 22480.122
BZD 2.305963
CAD 1.623185
CDF 2615.035015
CHF 0.925648
CLF 0.026299
CLP 1035.072439
CNY 7.764364
CNH 7.780559
COP 3960.034063
CRC 520.14739
CUC 1.146945
CUP 30.394043
CVE 110.569964
CZK 24.190336
DJF 203.835517
DKK 7.474072
DOP 66.986043
DZD 152.939427
EGP 57.331754
ERN 17.204175
ETB 181.647461
FJD 2.564
FKP 0.86699
GBP 0.866531
GEL 3.039852
GGP 0.86699
GHS 12.874504
GIP 0.86699
GMD 84.304874
GNF 10064.442782
GTQ 8.746478
GYD 239.84901
HKD 8.988436
HNL 30.606273
HRK 7.533254
HTG 149.77244
HUF 351.906109
IDR 20445.785654
ILS 3.394682
IMP 0.86699
INR 108.1919
IQD 1502.49795
IRR 1577049.375404
ISK 143.976448
JEP 0.86699
JMD 181.171337
JOD 0.813229
JPY 185.008009
KES 148.419043
KGS 100.300781
KHR 4599.249852
KMF 492.617229
KPW 1032.250901
KRW 1752.130969
KWD 0.353179
KYD 0.955446
KZT 559.543917
LAK 25295.872375
LBP 102708.92515
LKR 382.668433
LRD 208.916469
LSL 18.815678
LTL 3.386631
LVL 0.693776
LYD 7.311819
MAD 10.580612
MDL 20.248208
MGA 4817.169398
MKD 61.628611
MMK 2408.037641
MNT 4105.573741
MOP 9.256923
MRU 45.947051
MUR 54.881752
MVR 17.720734
MWK 1992.243861
MXN 19.872547
MYR 4.745948
MZN 73.301688
NAD 18.814173
NGN 1560.350288
NIO 41.990088
NOK 11.102662
NPR 172.945006
NZD 1.997675
OMR 0.441554
PAB 1.14663
PEN 3.881306
PGK 5.032508
PHP 69.638491
PKR 319.223511
PLN 4.259467
PYG 7041.056554
QAR 4.175458
RON 5.239364
RSD 117.183799
RUB 83.845404
RWF 1679.12748
SAR 4.299026
SBD 9.24601
SCR 15.693948
SDG 688.744688
SEK 10.98638
SGD 1.482316
SHP 0.85631
SLE 28.387314
SLL 24050.86738
SOS 655.483268
SRD 42.898615
STD 23739.445827
STN 24.544623
SVC 10.032843
SYP 126.774237
SZL 18.814083
THB 37.723444
TJS 10.63456
TMT 4.014308
TND 3.339618
TOP 2.761569
TRY 53.262066
TTD 7.775237
TWD 36.375404
TZS 3017.595134
UAH 51.508996
UGX 4173.182519
USD 1.146945
UYU 45.84299
UZS 13769.075108
VES 695.774297
VND 30176.12295
VUV 136.079641
WST 3.156168
XAF 656.142926
XAG 0.017684
XAU 0.000276
XCD 3.099677
XCG 2.066386
XDR 0.807102
XOF 648.024305
XPF 119.331742
YER 273.665193
ZAR 18.876464
ZMK 10323.885445
ZMW 20.552914
ZWL 369.315822
  • AEX

    -3.2400

    1078.16

    -0.3%

  • BEL20

    -1.1300

    5647.65

    -0.02%

  • PX1

    -46.5700

    8421.14

    -0.55%

  • ISEQ

    0.0000

    13785.73

    0%

  • OSEBX

    23.1300

    1950.43

    +1.2%

  • PSI20

    62.3800

    9102.6

    +0.69%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    42.0100

    4242.69

    +1%

  • N150

    3.3900

    4235.78

    +0.08%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.El-Nayady--DT