Berliner Boersenzeitung - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.235181
AFN 72.652685
ALL 96.063881
AMD 433.704627
ANG 2.064353
AOA 1057.499887
ARS 1610.206312
AUD 1.624146
AWG 2.07579
AZN 1.96188
BAM 1.95537
BBD 2.316929
BDT 141.168957
BGN 1.971203
BHD 0.435402
BIF 3416.033994
BMD 1.153216
BND 1.47017
BOB 7.950252
BRL 5.990977
BSD 1.150367
BTN 106.247636
BWP 15.633122
BYN 3.450956
BYR 22603.041528
BZD 2.313921
CAD 1.579734
CDF 2612.035303
CHF 0.905875
CLF 0.026502
CLP 1046.440069
CNY 7.942028
CNH 7.93722
COP 4267.604159
CRC 539.286086
CUC 1.153216
CUP 30.560235
CVE 110.240758
CZK 24.440233
DJF 204.842982
DKK 7.472479
DOP 70.225166
DZD 152.359466
EGP 60.255785
ERN 17.298246
ETB 179.61526
FJD 2.546936
FKP 0.867021
GBP 0.863736
GEL 3.124951
GGP 0.867021
GHS 12.535243
GIP 0.867021
GMD 84.758236
GNF 10082.739062
GTQ 8.813062
GYD 240.707068
HKD 9.039458
HNL 30.451568
HRK 7.533156
HTG 150.916159
HUF 388.682936
IDR 19557.397004
ILS 3.574336
IMP 0.867021
INR 106.538457
IQD 1507.162036
IRR 1515326.355866
ISK 143.598865
JEP 0.867021
JMD 180.991769
JOD 0.817659
JPY 183.28126
KES 149.236476
KGS 100.848857
KHR 4616.964699
KMF 492.423264
KPW 1037.945396
KRW 1714.158155
KWD 0.353669
KYD 0.958785
KZT 554.36569
LAK 24689.463672
LBP 103028.590428
LKR 358.27966
LRD 210.543701
LSL 19.247284
LTL 3.405149
LVL 0.697569
LYD 7.364231
MAD 10.788828
MDL 20.070499
MGA 4789.199319
MKD 61.626525
MMK 2421.931154
MNT 4122.169257
MOP 9.286618
MRU 45.767333
MUR 53.762617
MVR 17.817532
MWK 1994.978598
MXN 20.357556
MYR 4.510246
MZN 73.701863
NAD 19.247284
NGN 1565.180636
NIO 42.340506
NOK 11.050817
NPR 169.998091
NZD 1.970189
OMR 0.443409
PAB 1.150547
PEN 3.932435
PGK 4.963908
PHP 68.738037
PKR 321.172143
PLN 4.261538
PYG 7457.196184
QAR 4.194778
RON 5.092836
RSD 117.427402
RUB 94.997468
RWF 1682.644573
SAR 4.329805
SBD 9.277836
SCR 15.960176
SDG 693.082886
SEK 10.703118
SGD 1.472432
SHP 0.865211
SLE 28.371698
SLL 24182.383878
SOS 656.361356
SRD 43.389742
STD 23869.251239
STN 24.494614
SVC 10.066743
SYP 127.863901
SZL 19.247763
THB 37.237966
TJS 11.027675
TMT 4.04779
TND 3.391554
TOP 2.776668
TRY 50.982781
TTD 7.80625
TWD 36.746662
TZS 3008.429877
UAH 50.542597
UGX 4343.044952
USD 1.153216
UYU 46.769715
UZS 13961.869212
VES 516.419716
VND 30326.131789
VUV 137.909859
WST 3.176199
XAF 655.818471
XAG 0.014671
XAU 0.000231
XCD 3.116625
XCG 2.073535
XDR 0.815493
XOF 655.710461
XPF 119.331742
YER 275.099806
ZAR 19.241988
ZMK 10380.331955
ZMW 22.441357
ZWL 371.335212
  • AEX

    5.0400

    1012.81

    +0.5%

  • BEL20

    37.9500

    5167

    +0.74%

  • PX1

    38.8800

    7974.49

    +0.49%

  • ISEQ

    -80.1600

    12252.18

    -0.65%

  • OSEBX

    5.7000

    1972.42

    +0.29%

  • PSI20

    45.6500

    9175.24

    +0.5%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    7.5600

    3787.95

    +0.2%

  • N150

    30.4800

    3889.07

    +0.79%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

(Y.Berger--BBZ)