Dubai Telegraph - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.237583
AFN 72.693752
ALL 96.083665
AMD 433.726263
ANG 2.065521
AOA 1058.097238
ARS 1611.096401
AUD 1.627012
AWG 2.076964
AZN 1.957395
BAM 1.955434
BBD 2.317406
BDT 141.175387
BGN 1.972318
BHD 0.435926
BIF 3416.234019
BMD 1.153869
BND 1.470256
BOB 7.950648
BRL 5.996198
BSD 1.150604
BTN 106.252936
BWP 15.636342
BYN 3.451113
BYR 22615.829146
BZD 2.314007
CAD 1.580015
CDF 2613.512848
CHF 0.907177
CLF 0.026486
CLP 1045.785768
CNY 7.946522
CNH 7.938554
COP 4269.233915
CRC 539.31065
CUC 1.153869
CUP 30.577524
CVE 110.246257
CZK 24.445461
DJF 204.885168
DKK 7.471843
DOP 70.228365
DZD 152.511672
EGP 60.430077
ERN 17.308033
ETB 179.623441
FJD 2.54889
FKP 0.864765
GBP 0.863994
GEL 3.127214
GGP 0.864765
GHS 12.535869
GIP 0.864765
GMD 84.844491
GNF 10083.329455
GTQ 8.813502
GYD 240.719076
HKD 9.044641
HNL 30.452955
HRK 7.528765
HTG 150.924996
HUF 390.627295
IDR 19568.461556
ILS 3.569811
IMP 0.864765
INR 106.997682
IQD 1507.230698
IRR 1516183.648142
ISK 143.298995
JEP 0.864765
JMD 181.000013
JOD 0.818054
JPY 183.519391
KES 149.56326
KGS 100.905754
KHR 4617.235044
KMF 492.702289
KPW 1038.457027
KRW 1723.170402
KWD 0.353753
KYD 0.958829
KZT 554.390945
LAK 24690.588441
LBP 103033.2836
LKR 358.295982
LRD 210.554204
LSL 19.248161
LTL 3.407074
LVL 0.697964
LYD 7.365748
MAD 10.789366
MDL 20.071588
MGA 4790.102621
MKD 61.593693
MMK 2423.243908
MNT 4120.582999
MOP 9.287041
MRU 45.769417
MUR 53.666511
MVR 17.827435
MWK 1995.026251
MXN 20.352175
MYR 4.519126
MZN 73.744171
NAD 19.248161
NGN 1564.577088
NIO 42.342985
NOK 11.060872
NPR 170.005834
NZD 1.972608
OMR 0.44369
PAB 1.15052
PEN 3.932614
PGK 4.964178
PHP 68.948263
PKR 321.238287
PLN 4.262882
PYG 7458.731962
QAR 4.194987
RON 5.091795
RSD 117.421168
RUB 96.593463
RWF 1682.684766
SAR 4.332929
SBD 9.283085
SCR 15.84955
SDG 693.475127
SEK 10.746038
SGD 1.47424
SHP 0.8657
SLE 28.383287
SLL 24196.065005
SOS 656.391253
SRD 43.414286
STD 23882.755212
STN 24.495942
SVC 10.067201
SYP 127.601462
SZL 19.251727
THB 37.528395
TJS 11.028225
TMT 4.05008
TND 3.391723
TOP 2.778239
TRY 51.023508
TTD 7.806605
TWD 36.807836
TZS 3007.247299
UAH 50.55213
UGX 4343.261614
USD 1.153869
UYU 46.772048
UZS 13962.505268
VES 516.71188
VND 30358.289022
VUV 137.994476
WST 3.154336
XAF 655.834136
XAG 0.014683
XAU 0.000235
XCD 3.118389
XCG 2.073629
XDR 0.815647
XOF 655.845502
XPF 119.331742
YER 275.255428
ZAR 19.297997
ZMK 10386.182289
ZMW 22.442185
ZWL 371.545294
  • AEX

    -12.3600

    1000.49

    -1.22%

  • BEL20

    -41.8500

    5125.4

    -0.81%

  • PX1

    -3.9900

    7970.48

    -0.05%

  • ISEQ

    121.2900

    12373.13

    +0.99%

  • OSEBX

    13.6100

    1986.11

    +0.69%

  • PSI20

    -47.7100

    9127.96

    -0.52%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    7.5600

    3787.95

    +0.2%

  • N150

    6.6100

    3895.58

    +0.17%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.El-Nayady--DT