Berliner Boersenzeitung - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

EUR -
AED 4.100273
AFN 78.60757
ALL 98.166966
AMD 432.286638
ANG 1.997847
AOA 1023.661719
ARS 1274.492205
AUD 1.739351
AWG 2.012159
AZN 1.902168
BAM 1.95574
BBD 2.26123
BDT 136.075794
BGN 1.958829
BHD 0.422187
BIF 3332.496993
BMD 1.116315
BND 1.454255
BOB 7.738761
BRL 6.322034
BSD 1.119965
BTN 95.745041
BWP 15.144532
BYN 3.665087
BYR 21879.783696
BZD 2.24963
CAD 1.559549
CDF 3204.942189
CHF 0.935299
CLF 0.027413
CLP 1051.967484
CNY 8.048081
CNH 8.048713
COP 4704.554582
CRC 567.282465
CUC 1.116315
CUP 29.582361
CVE 110.261592
CZK 24.899757
DJF 199.433835
DKK 7.461011
DOP 65.907963
DZD 148.865399
EGP 55.928271
ERN 16.744732
ETB 151.194627
FJD 2.537725
FKP 0.842071
GBP 0.840567
GEL 3.05914
GGP 0.842071
GHS 13.887571
GIP 0.842071
GMD 80.937172
GNF 9698.700213
GTQ 8.598734
GYD 234.312757
HKD 8.722499
HNL 29.141099
HRK 7.532941
HTG 146.54547
HUF 402.867531
IDR 18412.786848
ILS 3.96752
IMP 0.842071
INR 95.543378
IQD 1467.15465
IRR 47010.84053
ISK 145.891703
JEP 0.842071
JMD 178.534481
JOD 0.791807
JPY 162.594147
KES 144.755526
KGS 97.622219
KHR 4481.861466
KMF 492.857526
KPW 1004.660245
KRW 1561.859763
KWD 0.343145
KYD 0.933371
KZT 571.02235
LAK 24221.251321
LBP 100346.698283
LKR 335.109642
LRD 223.983077
LSL 20.217275
LTL 3.29619
LVL 0.675249
LYD 6.178809
MAD 10.389879
MDL 19.509397
MGA 5019.844837
MKD 61.528098
MMK 2343.870677
MNT 4001.744803
MOP 9.015121
MRU 44.32763
MUR 51.47373
MVR 17.25866
MWK 1941.939975
MXN 21.73009
MYR 4.795735
MZN 71.336723
NAD 20.217275
NGN 1788.71739
NIO 41.208726
NOK 11.593835
NPR 153.192265
NZD 1.897963
OMR 0.429497
PAB 1.119965
PEN 4.129072
PGK 4.654856
PHP 62.294316
PKR 315.375252
PLN 4.268489
PYG 8941.723611
QAR 4.081974
RON 5.106255
RSD 117.226377
RUB 90.497203
RWF 1603.750428
SAR 4.186446
SBD 9.31055
SCR 15.922308
SDG 670.351558
SEK 10.907859
SGD 1.452108
SHP 0.877249
SLE 25.344455
SLL 23408.578004
SOS 640.080215
SRD 40.8365
STD 23105.476908
SVC 9.799697
SYP 14514.229131
SZL 20.222375
THB 37.223582
TJS 11.546543
TMT 3.912686
TND 3.376696
TOP 2.614527
TRY 43.377235
TTD 7.596765
TWD 33.732379
TZS 3021.006621
UAH 46.488763
UGX 4097.873335
USD 1.116315
UYU 46.59856
UZS 14520.55117
VES 105.163869
VND 28936.572095
VUV 135.253884
WST 3.10171
XAF 655.936725
XAG 0.034565
XAU 0.000349
XCD 3.016899
XDR 0.815775
XOF 655.936725
XPF 119.331742
YER 272.496621
ZAR 20.143411
ZMK 10048.183034
ZMW 30.104069
ZWL 359.453134
  • AEX

    1.8600

    930.9

    +0.2%

  • BEL20

    44.9000

    4447.35

    +1.02%

  • PX1

    32.9900

    7886.69

    +0.42%

  • ISEQ

    -48.9500

    11075.49

    -0.44%

  • OSEBX

    18.4100

    1565.56

    +1.19%

  • PSI20

    43.8700

    7235.99

    +0.61%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    82.3400

    2608.08

    +3.26%

  • N150

    16.4000

    3582.54

    +0.46%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

(S.G.Stein--BBZ)