Berliner Boersenzeitung - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.392391
AFN 77.741834
ALL 96.538372
AMD 452.882009
ANG 2.140975
AOA 1096.75198
ARS 1722.927385
AUD 1.709238
AWG 2.154335
AZN 2.031246
BAM 1.953566
BBD 2.407716
BDT 146.080475
BGN 2.008564
BHD 0.450878
BIF 3541.105393
BMD 1.196022
BND 1.508456
BOB 8.260621
BRL 6.204647
BSD 1.195418
BTN 109.806407
BWP 15.642044
BYN 3.39897
BYR 23442.031802
BZD 2.40427
CAD 1.620299
CDF 2679.089757
CHF 0.918423
CLF 0.025991
CLP 1026.174682
CNY 8.317915
CNH 8.307025
COP 4379.880517
CRC 593.313947
CUC 1.196022
CUP 31.694584
CVE 110.137647
CZK 24.299041
DJF 212.876519
DKK 7.467268
DOP 75.213031
DZD 154.502223
EGP 56.000513
ERN 17.94033
ETB 185.887343
FJD 2.627002
FKP 0.867868
GBP 0.867445
GEL 3.223246
GGP 0.867868
GHS 13.066165
GIP 0.867868
GMD 87.309258
GNF 10489.870484
GTQ 9.171357
GYD 250.102895
HKD 9.331238
HNL 31.547521
HRK 7.523813
HTG 156.548981
HUF 381.349833
IDR 20036.957081
ILS 3.701335
IMP 0.867868
INR 109.998743
IQD 1565.989235
IRR 50382.428233
ISK 144.742332
JEP 0.867868
JMD 187.393316
JOD 0.847973
JPY 182.934563
KES 154.287189
KGS 104.591648
KHR 4805.503629
KMF 492.760917
KPW 1076.350276
KRW 1710.119535
KWD 0.366569
KYD 0.996261
KZT 602.321086
LAK 25754.757922
LBP 107051.852802
LKR 370.161979
LRD 221.157048
LSL 19.007842
LTL 3.531542
LVL 0.723461
LYD 7.507319
MAD 10.808602
MDL 20.047071
MGA 5333.943814
MKD 61.663923
MMK 2511.623909
MNT 4272.958059
MOP 9.607292
MRU 47.72082
MUR 53.928924
MVR 18.490129
MWK 2072.929054
MXN 20.597317
MYR 4.687231
MZN 76.258672
NAD 19.007921
NGN 1668.642047
NIO 43.989686
NOK 11.508154
NPR 175.687851
NZD 1.982257
OMR 0.459881
PAB 1.195443
PEN 3.999892
PGK 5.117083
PHP 70.324847
PKR 334.41811
PLN 4.20586
PYG 8027.71749
QAR 4.346529
RON 5.094214
RSD 117.370479
RUB 91.216679
RWF 1744.105152
SAR 4.48567
SBD 9.661079
SCR 16.453664
SDG 719.413051
SEK 10.571159
SGD 1.50987
SHP 0.897326
SLE 29.060773
SLL 25079.983097
SOS 682.011385
SRD 45.558852
STD 24755.241277
STN 24.471703
SVC 10.459905
SYP 13227.495225
SZL 19.00003
THB 37.216018
TJS 11.171276
TMT 4.186077
TND 3.41879
TOP 2.879734
TRY 51.924338
TTD 8.113788
TWD 37.471966
TZS 3061.816073
UAH 51.099613
UGX 4280.050945
USD 1.196022
UYU 45.237691
UZS 14463.276005
VES 428.745373
VND 31174.314231
VUV 143.129373
WST 3.259589
XAF 655.199388
XAG 0.010478
XAU 0.000228
XCD 3.232309
XCG 2.154409
XDR 0.813546
XOF 655.196652
XPF 119.331742
YER 285.12971
ZAR 19.033273
ZMK 10765.630266
ZMW 23.759024
ZWL 385.118606
  • AEX

    -5.5100

    996.19

    -0.55%

  • BEL20

    -29.6800

    5367.2

    -0.55%

  • PX1

    -72.5600

    8080.26

    -0.89%

  • ISEQ

    -10.4100

    12996.23

    -0.08%

  • OSEBX

    6.8000

    1749.57

    +0.39%

  • PSI20

    -3.4600

    8650.73

    -0.04%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    147.5100

    4211.2

    +3.63%

  • N150

    16.8200

    3928.97

    +0.43%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

(A.Lehmann--BBZ)