Dubai Telegraph - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.35335
AFN 77.050797
ALL 96.614026
AMD 452.873985
ANG 2.121943
AOA 1087.00321
ARS 1723.800654
AUD 1.702936
AWG 2.136666
AZN 2.019869
BAM 1.955248
BBD 2.406031
BDT 145.978765
BGN 1.990709
BHD 0.449191
BIF 3539.115218
BMD 1.18539
BND 1.512879
BOB 8.254703
BRL 6.231008
BSD 1.194568
BTN 109.699013
BWP 15.630651
BYN 3.402439
BYR 23233.647084
BZD 2.402531
CAD 1.615035
CDF 2684.909135
CHF 0.915881
CLF 0.026011
CLP 1027.058063
CNY 8.240537
CNH 8.248946
COP 4354.94563
CRC 591.535401
CUC 1.18539
CUP 31.412839
CVE 110.234327
CZK 24.334287
DJF 212.720809
DKK 7.470097
DOP 74.383698
DZD 153.702477
EGP 55.903178
ERN 17.780852
ETB 185.572763
FJD 2.613371
FKP 0.863571
GBP 0.865754
GEL 3.194674
GGP 0.863571
GHS 12.974143
GIP 0.863571
GMD 86.533903
GNF 10372.164298
GTQ 9.16245
GYD 249.920458
HKD 9.257838
HNL 31.365884
HRK 7.536597
HTG 156.336498
HUF 381.328619
IDR 19883.141804
ILS 3.663335
IMP 0.863571
INR 108.679593
IQD 1553.453801
IRR 49934.560565
ISK 144.985527
JEP 0.863571
JMD 187.197911
JOD 0.840489
JPY 183.433247
KES 152.915746
KGS 103.662825
KHR 4768.236408
KMF 491.93733
KPW 1066.928941
KRW 1719.752641
KWD 0.36382
KYD 0.995519
KZT 600.800289
LAK 25485.888797
LBP 101410.128375
LKR 369.427204
LRD 219.593979
LSL 19.132649
LTL 3.500149
LVL 0.717031
LYD 7.495914
MAD 10.835985
MDL 20.092409
MGA 5260.173275
MKD 61.631889
MMK 2489.287708
MNT 4228.659246
MOP 9.606327
MRU 47.30937
MUR 53.852723
MVR 18.32658
MWK 2059.023112
MXN 20.70407
MYR 4.672854
MZN 75.580924
NAD 18.967522
NGN 1643.520192
NIO 43.508231
NOK 11.437875
NPR 175.519161
NZD 1.96876
OMR 0.458133
PAB 1.194573
PEN 3.994177
PGK 5.066955
PHP 69.837307
PKR 331.998194
PLN 4.215189
PYG 8001.773454
QAR 4.316051
RON 5.097064
RSD 117.111851
RUB 90.544129
RWF 1742.915022
SAR 4.446506
SBD 9.544303
SCR 17.200951
SDG 713.016537
SEK 10.580086
SGD 1.505332
SHP 0.88935
SLE 28.834661
SLL 24857.038036
SOS 677.454816
SRD 45.104693
STD 24535.182964
STN 24.493185
SVC 10.452048
SYP 13109.911225
SZL 19.132635
THB 37.411351
TJS 11.151397
TMT 4.148866
TND 3.37248
TOP 2.854135
TRY 51.47818
TTD 8.110743
TWD 37.456003
TZS 3052.380052
UAH 51.199753
UGX 4270.811618
USD 1.18539
UYU 46.357101
UZS 14603.874776
VES 410.075543
VND 30749.020682
VUV 141.680176
WST 3.213481
XAF 655.774526
XAG 0.014004
XAU 0.000244
XCD 3.203577
XCG 2.153028
XDR 0.815573
XOF 655.774526
XPF 119.331742
YER 282.508153
ZAR 19.136335
ZMK 10669.938133
ZMW 23.443477
ZWL 381.695147
  • AEX

    4.6900

    1001.65

    +0.47%

  • BEL20

    11.8200

    5385.38

    +0.22%

  • PX1

    54.8900

    8126.53

    +0.68%

  • ISEQ

    182.8100

    13147.76

    +1.41%

  • OSEBX

    3.8600

    1760.38

    +0.22%

  • PSI20

    17.2900

    8662.19

    +0.2%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -39.8700

    4028.03

    -0.98%

  • N150

    11.3700

    3930.64

    +0.29%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.El-Nayady--DT