Berliner Boersenzeitung - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

EUR -
AED 4.375801
AFN 78.040829
ALL 96.573317
AMD 447.838113
ANG 2.132888
AOA 1092.012093
ARS 1687.730961
AUD 1.681895
AWG 2.144708
AZN 2.027049
BAM 1.957286
BBD 2.392416
BDT 145.170211
BGN 2.000977
BHD 0.449177
BIF 3514.768359
BMD 1.191505
BND 1.507344
BOB 8.225244
BRL 6.188201
BSD 1.187802
BTN 107.6833
BWP 15.653884
BYN 3.423399
BYR 23353.489619
BZD 2.388914
CAD 1.614522
CDF 2639.182703
CHF 0.91283
CLF 0.025736
CLP 1016.198884
CNY 8.248193
CNH 8.22856
COP 4376.837151
CRC 588.847044
CUC 1.191505
CUP 31.574871
CVE 110.348312
CZK 24.225134
DJF 211.520583
DKK 7.471204
DOP 74.776769
DZD 154.293807
EGP 55.832357
ERN 17.872569
ETB 185.274257
FJD 2.609637
FKP 0.875956
GBP 0.870078
GEL 3.20495
GGP 0.875956
GHS 13.071924
GIP 0.875956
GMD 87.571985
GNF 10427.960511
GTQ 9.111879
GYD 248.508664
HKD 9.312407
HNL 31.376821
HRK 7.535103
HTG 155.768257
HUF 376.806152
IDR 19991.063716
ILS 3.67269
IMP 0.875956
INR 108.038426
IQD 1556.081354
IRR 50192.1303
ISK 145.008364
JEP 0.875956
JMD 185.79105
JOD 0.844721
JPY 185.099639
KES 153.233467
KGS 104.196778
KHR 4790.63698
KMF 493.28266
KPW 1072.346493
KRW 1732.94732
KWD 0.365506
KYD 0.989851
KZT 586.605342
LAK 25527.380004
LBP 106369.854398
LKR 367.639106
LRD 220.936805
LSL 19.038254
LTL 3.518203
LVL 0.72073
LYD 7.509701
MAD 10.863547
MDL 20.175317
MGA 5214.959119
MKD 61.659559
MMK 2501.771917
MNT 4249.247942
MOP 9.56286
MRU 47.167809
MUR 54.785078
MVR 18.42084
MWK 2059.663666
MXN 20.49227
MYR 4.676063
MZN 75.970043
NAD 19.038254
NGN 1615.811596
NIO 43.713186
NOK 11.424569
NPR 172.293803
NZD 1.97085
OMR 0.458131
PAB 1.187802
PEN 3.989329
PGK 5.167923
PHP 69.654758
PKR 332.14606
PLN 4.207739
PYG 7831.945896
QAR 4.329969
RON 5.08987
RSD 117.373907
RUB 91.743957
RWF 1734.216591
SAR 4.468599
SBD 9.597424
SCR 16.26441
SDG 716.692716
SEK 10.634583
SGD 1.506884
SHP 0.893937
SLE 29.221614
SLL 24985.254258
SOS 677.614435
SRD 45.243216
STD 24661.73901
STN 24.518614
SVC 10.393891
SYP 13177.534056
SZL 19.029447
THB 37.043414
TJS 11.123998
TMT 4.170266
TND 3.431191
TOP 2.868857
TRY 51.952335
TTD 8.047109
TWD 37.588991
TZS 3078.367627
UAH 51.203673
UGX 4228.209994
USD 1.191505
UYU 45.544385
UZS 14613.972057
VES 458.479533
VND 30846.861875
VUV 142.594433
WST 3.253665
XAF 656.455371
XAG 0.014604
XAU 0.000237
XCD 3.220101
XCG 2.140725
XDR 0.81642
XOF 656.455371
XPF 119.331742
YER 283.994879
ZAR 18.948375
ZMK 10724.971239
ZMW 22.456048
ZWL 383.663986
  • AEX

    3.6800

    999.03

    +0.37%

  • BEL20

    59.0400

    5576.62

    +1.07%

  • PX1

    49.6400

    8323.28

    +0.6%

  • ISEQ

    143.5800

    13438.07

    +1.08%

  • OSEBX

    7.2600

    1823.3

    +0.4%

  • PSI20

    100.4600

    8991.17

    +1.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    46.0000

    4046.13

    +1.15%

  • N150

    42.9200

    4053.74

    +1.07%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

(S.G.Stein--BBZ)