Dubai Telegraph - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.208972
AFN 73.34913
ALL 94.723353
AMD 421.974787
ANG 2.051943
AOA 1052.100506
ARS 1662.879862
AUD 1.633057
AWG 2.065807
AZN 1.978188
BAM 1.956541
BBD 2.309234
BDT 140.740843
BGN 1.937883
BHD 0.432188
BIF 3417.034603
BMD 1.146079
BND 1.480067
BOB 7.922931
BRL 5.913075
BSD 1.146514
BTN 108.094993
BWP 15.569964
BYN 3.174316
BYR 22463.148822
BZD 2.305953
CAD 1.620569
CDF 2635.982402
CHF 0.923513
CLF 0.02623
CLP 1032.353653
CNY 7.758154
CNH 7.7801
COP 3947.164915
CRC 519.496734
CUC 1.146079
CUP 30.371094
CVE 110.539495
CZK 24.21281
DJF 203.681339
DKK 7.474578
DOP 66.988435
DZD 152.877533
EGP 57.214216
ERN 17.191185
ETB 181.542388
FJD 2.57438
FKP 0.866335
GBP 0.866304
GEL 3.042833
GGP 0.866335
GHS 12.840022
GIP 0.866335
GMD 83.095899
GNF 10056.843814
GTQ 8.738271
GYD 239.878749
HKD 8.983701
HNL 30.577569
HRK 7.533061
HTG 149.887416
HUF 352.880059
IDR 20401.352662
ILS 3.389644
IMP 0.866335
INR 108.242008
IQD 1501.363518
IRR 1576145.174428
ISK 144.211309
JEP 0.866335
JMD 181.107005
JOD 0.812568
JPY 184.84937
KES 148.30689
KGS 100.224458
KHR 4595.776869
KMF 493.960537
KPW 1031.47152
KRW 1753.283128
KWD 0.353016
KYD 0.955453
KZT 559.764426
LAK 25288.233135
LBP 102631.376141
LKR 382.424825
LRD 208.58626
LSL 18.887737
LTL 3.384074
LVL 0.693252
LYD 7.306198
MAD 10.680023
MDL 20.070688
MGA 4813.532348
MKD 61.632041
MMK 2406.219499
MNT 4102.473907
MOP 9.255865
MRU 45.900542
MUR 54.863033
MVR 17.650441
MWK 1990.739584
MXN 19.87701
MYR 4.735597
MZN 73.245837
NAD 18.887637
NGN 1559.929785
NIO 41.980445
NOK 11.119145
NPR 172.952743
NZD 1.996321
OMR 0.440665
PAB 1.146524
PEN 3.877153
PGK 5.029002
PHP 69.62545
PKR 319.010697
PLN 4.260726
PYG 6982.613861
QAR 4.174591
RON 5.239069
RSD 117.378035
RUB 84.353628
RWF 1677.286648
SAR 4.300311
SBD 9.235444
SCR 15.640758
SDG 688.219677
SEK 10.975193
SGD 1.48023
SHP 0.855664
SLE 28.365606
SLL 24032.708241
SOS 654.985307
SRD 42.827769
STD 23721.521821
STN 24.583395
SVC 10.032887
SYP 126.678518
SZL 18.898513
THB 37.636661
TJS 10.640037
TMT 4.011277
TND 3.372337
TOP 2.759484
TRY 53.229627
TTD 7.785949
TWD 36.245092
TZS 3009.085442
UAH 51.527989
UGX 4184.548182
USD 1.146079
UYU 46.07745
UZS 13237.212413
VES 695.248966
VND 30176.260636
VUV 135.976896
WST 3.153785
XAF 656.199778
XAG 0.017601
XAU 0.000275
XCD 3.097336
XCG 2.066365
XDR 0.806493
XOF 652.688901
XPF 119.331742
YER 271.764039
ZAR 18.887164
ZMK 10316.082823
ZMW 20.508588
ZWL 369.036977
  • AEX

    -3.8900

    1077.47

    -0.36%

  • BEL20

    0.0000

    5648.94

    0%

  • PX1

    -11.8600

    8456.49

    -0.14%

  • ISEQ

    -67.5500

    13719.15

    -0.49%

  • OSEBX

    19.6600

    1947.09

    +1.02%

  • PSI20

    -7.2300

    9033.56

    -0.08%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.3500

    4200.66

    -2.06%

  • N150

    1.2700

    4233.94

    +0.03%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

O.Mehta--DT