Berliner Boersenzeitung - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.331285
AFN 75.468553
ALL 95.455853
AMD 435.133136
ANG 2.110613
AOA 1082.496254
ARS 1649.279971
AUD 1.625795
AWG 2.125489
AZN 2.009303
BAM 1.960362
BBD 2.374715
BDT 144.673819
BGN 1.967008
BHD 0.445031
BIF 3508.088307
BMD 1.179189
BND 1.49518
BOB 8.147963
BRL 5.795828
BSD 1.179039
BTN 111.34021
BWP 15.830843
BYN 3.332255
BYR 23112.111202
BZD 2.371308
CAD 1.612011
CDF 2670.864298
CHF 0.916177
CLF 0.026704
CLP 1051.00014
CNY 8.019372
CNH 8.014083
COP 4422.526062
CRC 542.013173
CUC 1.179189
CUP 31.248518
CVE 110.903223
CZK 24.334582
DJF 209.565995
DKK 7.476537
DOP 69.985351
DZD 155.960046
EGP 62.195977
ERN 17.68784
ETB 185.491052
FJD 2.574218
FKP 0.866493
GBP 0.864889
GEL 3.154379
GGP 0.866493
GHS 13.313508
GIP 0.866493
GMD 86.674958
GNF 10353.282886
GTQ 9.002953
GYD 246.714182
HKD 9.235117
HNL 31.390478
HRK 7.538916
HTG 154.379289
HUF 353.981307
IDR 20491.303919
ILS 3.421187
IMP 0.866493
INR 111.345548
IQD 1544.738045
IRR 1546506.829043
ISK 143.873347
JEP 0.866493
JMD 185.842514
JOD 0.836092
JPY 184.734208
KES 152.328133
KGS 103.085327
KHR 4728.549695
KMF 492.90156
KPW 1061.212561
KRW 1723.880942
KWD 0.36279
KYD 0.982687
KZT 544.929701
LAK 25889.102525
LBP 105596.406437
LKR 379.599647
LRD 216.385693
LSL 19.327363
LTL 3.48184
LVL 0.71328
LYD 7.458419
MAD 10.754655
MDL 20.163928
MGA 4911.324039
MKD 61.616155
MMK 2475.833955
MNT 4220.203791
MOP 9.507427
MRU 47.102764
MUR 55.210091
MVR 18.163925
MWK 2054.148249
MXN 20.255648
MYR 4.623647
MZN 75.362436
NAD 19.327358
NGN 1609.593864
NIO 43.293982
NOK 10.859513
NPR 178.160636
NZD 1.976185
OMR 0.453919
PAB 1.179144
PEN 4.04993
PGK 5.129916
PHP 71.358689
PKR 328.581553
PLN 4.239717
PYG 7202.120307
QAR 4.29269
RON 5.21945
RSD 117.297547
RUB 87.543025
RWF 1722.206041
SAR 4.459737
SBD 9.456429
SCR 16.459646
SDG 708.107537
SEK 10.86706
SGD 1.494391
SHP 0.880384
SLE 29.067455
SLL 24727.006491
SOS 673.91103
SRD 44.100547
STD 24406.83871
STN 24.939855
SVC 10.317092
SYP 130.352242
SZL 19.303765
THB 37.973479
TJS 11.001504
TMT 4.127163
TND 3.379601
TOP 2.839205
TRY 53.475102
TTD 7.990886
TWD 36.927538
TZS 3063.998569
UAH 51.791223
UGX 4417.888438
USD 1.179189
UYU 47.025255
UZS 14309.46312
VES 588.693738
VND 31022.113342
VUV 139.175172
WST 3.188636
XAF 657.487181
XAG 0.014668
XAU 0.00025
XCD 3.186819
XCG 2.124956
XDR 0.82014
XOF 657.402298
XPF 119.331742
YER 281.384102
ZAR 19.315951
ZMK 10614.123377
ZMW 22.449247
ZWL 379.698489
  • AEX

    -1.9400

    1017.5

    -0.19%

  • BEL20

    -6.5600

    5463.32

    -0.12%

  • PX1

    -89.4000

    8112.57

    -1.09%

  • ISEQ

    -222.6400

    12721.67

    -1.72%

  • OSEBX

    -8.9100

    1970.28

    -0.45%

  • PSI20

    -66.6800

    9067.26

    -0.73%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -6.0000

    3992.65

    -0.15%

  • N150

    -9.6600

    4189.18

    -0.23%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

(Y.Berger--BBZ)