Dubai Telegraph - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.381992
AFN 78.750894
ALL 96.772834
AMD 453.127673
ANG 2.135904
AOA 1094.155023
ARS 1723.006224
AUD 1.703048
AWG 2.147741
AZN 2.027312
BAM 1.958039
BBD 2.409237
BDT 146.15714
BGN 2.003807
BHD 0.449939
BIF 3543.827792
BMD 1.193189
BND 1.513334
BOB 8.264659
BRL 6.197065
BSD 1.196143
BTN 110.049154
BWP 15.598819
BYN 3.379033
BYR 23386.513916
BZD 2.405733
CAD 1.613288
CDF 2693.62495
CHF 0.916376
CLF 0.025958
CLP 1024.95004
CNY 8.290757
CNH 8.289248
COP 4358.721191
CRC 591.863639
CUC 1.193189
CUP 31.619521
CVE 110.393555
CZK 24.34441
DJF 213.004295
DKK 7.467153
DOP 75.15697
DZD 154.308073
EGP 56.001272
ERN 17.897842
ETB 185.122907
FJD 2.620781
FKP 0.864978
GBP 0.867162
GEL 3.215635
GGP 0.864978
GHS 13.067272
GIP 0.864978
GMD 87.697079
GNF 10497.500171
GTQ 9.177688
GYD 250.242459
HKD 9.315768
HNL 31.595737
HRK 7.533438
HTG 156.800337
HUF 381.275947
IDR 20028.222449
ILS 3.690338
IMP 0.864978
INR 109.703873
IQD 1563.674821
IRR 50263.107265
ISK 144.99605
JEP 0.864978
JMD 187.688003
JOD 0.845975
JPY 183.732053
KES 154.243589
KGS 104.344067
KHR 4800.801608
KMF 491.594467
KPW 1073.96939
KRW 1718.932363
KWD 0.365955
KYD 0.996727
KZT 600.839544
LAK 25677.437566
LBP 107117.524012
LKR 370.074058
LRD 221.3444
LSL 18.780413
LTL 3.523179
LVL 0.721749
LYD 7.487269
MAD 10.834074
MDL 20.11961
MGA 5321.625216
MKD 61.62671
MMK 2505.752956
MNT 4256.95142
MOP 9.615976
MRU 47.572579
MUR 54.20683
MVR 18.434798
MWK 2072.570214
MXN 20.625111
MYR 4.698727
MZN 76.065949
NAD 18.864464
NGN 1658.366152
NIO 43.187477
NOK 11.432366
NPR 176.101211
NZD 1.969586
OMR 0.458787
PAB 1.196098
PEN 3.989425
PGK 5.083586
PHP 70.333154
PKR 333.88428
PLN 4.210294
PYG 8026.784566
QAR 4.344522
RON 5.097187
RSD 117.389486
RUB 90.086234
RWF 1733.107728
SAR 4.475517
SBD 9.614842
SCR 16.593195
SDG 717.661496
SEK 10.535953
SGD 1.512051
SHP 0.895201
SLE 29.08404
SLL 25020.586042
SOS 681.867426
SRD 45.34538
STD 24696.61331
STN 24.609533
SVC 10.465837
SYP 13196.168479
SZL 18.855865
THB 37.48407
TJS 11.171609
TMT 4.188095
TND 3.373445
TOP 2.872914
TRY 51.903862
TTD 8.118318
TWD 37.534758
TZS 3072.463155
UAH 51.192889
UGX 4254.972804
USD 1.193189
UYU 45.262709
UZS 14550.945781
VES 437.717685
VND 30924.48849
VUV 142.715687
WST 3.23879
XAF 656.694211
XAG 0.011511
XAU 0.000235
XCD 3.224654
XCG 2.155638
XDR 0.816792
XOF 653.27021
XPF 119.331742
YER 284.461217
ZAR 19.03704
ZMK 10740.145808
ZMW 23.653834
ZWL 384.206528
  • AEX

    5.9800

    1002.93

    +0.6%

  • BEL20

    32.2400

    5405.7

    +0.6%

  • PX1

    65.3800

    8136.52

    +0.81%

  • ISEQ

    197.0500

    13160.76

    +1.52%

  • OSEBX

    0.7000

    1757.31

    +0.04%

  • PSI20

    57.0500

    8701.56

    +0.66%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -17.9800

    4068.04

    -0.44%

  • N150

    16.4600

    3935.47

    +0.42%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

O.Mehta--DT