Berliner Boersenzeitung - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

EUR -
AED 4.324258
AFN 78.159703
ALL 96.383167
AMD 449.156954
ANG 2.108143
AOA 1079.738642
ARS 1707.87429
AUD 1.756
AWG 2.119737
AZN 2.005431
BAM 1.953036
BBD 2.371843
BDT 143.906311
BGN 1.955188
BHD 0.444171
BIF 3482.670534
BMD 1.177468
BND 1.51196
BOB 8.155422
BRL 6.501388
BSD 1.177633
BTN 105.803243
BWP 15.480023
BYN 3.437335
BYR 23078.380234
BZD 2.368438
CAD 1.610312
CDF 2590.430336
CHF 0.92851
CLF 0.027159
CLP 1065.420746
CNY 8.275837
CNH 8.252063
COP 4408.206118
CRC 588.167492
CUC 1.177468
CUP 31.202912
CVE 110.109149
CZK 24.255963
DJF 209.260258
DKK 7.469536
DOP 73.81552
DZD 152.411917
EGP 55.986856
ERN 17.662026
ETB 183.219888
FJD 2.671914
FKP 0.873156
GBP 0.872475
GEL 3.161539
GGP 0.873156
GHS 13.1014
GIP 0.873156
GMD 87.722608
GNF 10292.431813
GTQ 9.02223
GYD 246.370235
HKD 9.156247
HNL 31.041064
HRK 7.53285
HTG 154.191753
HUF 388.727094
IDR 19698.045137
ILS 3.751399
IMP 0.873156
INR 105.771572
IQD 1542.716397
IRR 49600.855336
ISK 148.017534
JEP 0.873156
JMD 187.84412
JOD 0.834804
JPY 183.703875
KES 151.834946
KGS 102.9694
KHR 4720.298717
KMF 492.181659
KPW 1059.742393
KRW 1700.794052
KWD 0.361706
KYD 0.981407
KZT 605.253308
LAK 25485.818458
LBP 105455.487634
LKR 364.544015
LRD 208.434092
LSL 19.599159
LTL 3.476758
LVL 0.712239
LYD 6.37298
MAD 10.744292
MDL 19.754954
MGA 5385.354555
MKD 61.56485
MMK 2472.482045
MNT 4186.077786
MOP 9.432808
MRU 46.632994
MUR 54.104525
MVR 18.191462
MWK 2042.001025
MXN 21.123417
MYR 4.76287
MZN 75.252435
NAD 19.599159
NGN 1707.858683
NIO 43.338657
NOK 11.782767
NPR 169.285389
NZD 2.018369
OMR 0.452732
PAB 1.177628
PEN 3.962691
PGK 5.085801
PHP 69.220423
PKR 329.880978
PLN 4.214724
PYG 7980.703895
QAR 4.292424
RON 5.092783
RSD 117.235823
RUB 93.019657
RWF 1715.165026
SAR 4.416325
SBD 9.600361
SCR 17.93687
SDG 708.248983
SEK 10.798898
SGD 1.512052
SHP 0.883406
SLE 28.347594
SLL 24690.927494
SOS 671.846198
SRD 45.138836
STD 24371.218152
STN 24.465371
SVC 10.304415
SYP 13019.125625
SZL 19.583281
THB 36.584237
TJS 10.822336
TMT 4.132914
TND 3.426051
TOP 2.835062
TRY 50.450044
TTD 8.010628
TWD 37.022319
TZS 2912.405642
UAH 49.679682
UGX 4250.983043
USD 1.177468
UYU 46.024855
UZS 14192.910969
VES 339.215494
VND 30990.967743
VUV 142.639159
WST 3.283513
XAF 655.027075
XAG 0.016365
XAU 0.000263
XCD 3.182167
XCG 2.122396
XDR 0.81366
XOF 655.029853
XPF 119.331742
YER 280.76767
ZAR 19.625454
ZMK 10598.625778
ZMW 26.584259
ZWL 379.144338
  • AEX

    -0.8500

    941.37

    -0.09%

  • BEL20

    -17.2000

    5040.37

    -0.34%

  • PX1

    0.0000

    8103.58

    0%

  • ISEQ

    -6.5200

    13037.23

    -0.05%

  • OSEBX

    4.1600

    1666.51

    +0.25%

  • PSI20

    13.8900

    8183.11

    +0.17%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    5.4700

    4214.37

    +0.13%

  • N150

    6.3700

    3753.91

    +0.17%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

(S.G.Stein--BBZ)