Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Berliner Boersenzeitung - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Berlin - 18.05. 2025 - 07:15:19

Berlin 7°C

EUR -

AED 4.100273

AFN 78.60757

ALL 98.166966

AMD 432.286638

ANG 1.997847

AOA 1023.661719

ARS 1274.492205

AUD 1.739351

AWG 2.012159

AZN 1.902168

BAM 1.95574

BBD 2.26123

BDT 136.075794

BGN 1.958829

BHD 0.422187

BIF 3332.496993

BMD 1.116315

BND 1.454255

BOB 7.738761

BRL 6.322034

BSD 1.119965

BTN 95.745041

BWP 15.144532

BYN 3.665087

BYR 21879.783696

BZD 2.24963

CAD 1.559549

CDF 3204.942189

CHF 0.935299

CLF 0.027413

CLP 1051.967484

CNY 8.048081

CNH 8.048713

COP 4704.554582

CRC 567.282465

CUC 1.116315

CUP 29.582361

CVE 110.261592

CZK 24.899757

DJF 199.433835

DKK 7.461011

DOP 65.907963

DZD 148.865399

EGP 55.928271

ERN 16.744732

ETB 151.194627

FJD 2.537725

FKP 0.842071

GBP 0.840567

GEL 3.05914

GGP 0.842071

GHS 13.887571

GIP 0.842071

GMD 80.937172

GNF 9698.700213

GTQ 8.598734

GYD 234.312757

HKD 8.722499

HNL 29.141099

HRK 7.532941

HTG 146.54547

HUF 402.867531

IDR 18412.786848

ILS 3.96752

IMP 0.842071

INR 95.543378

IQD 1467.15465

IRR 47010.84053

ISK 145.891703

JEP 0.842071

JMD 178.534481

JOD 0.791807

JPY 162.594147

KES 144.755526

KGS 97.622219

KHR 4481.861466

KMF 492.857526

KPW 1004.660245

KRW 1561.859763

KWD 0.343145

KYD 0.933371

KZT 571.02235

LAK 24221.251321

LBP 100346.698283

LKR 335.109642

LRD 223.983077

LSL 20.217275

LTL 3.29619

LVL 0.675249

LYD 6.178809

MAD 10.389879

MDL 19.509397

MGA 5019.844837

MKD 61.528098

MMK 2343.870677

MNT 4001.744803

MOP 9.015121

MRU 44.32763

MUR 51.47373

MVR 17.25866

MWK 1941.939975

MXN 21.73009

MYR 4.795735

MZN 71.336723

NAD 20.217275

NGN 1788.71739

NIO 41.208726

NOK 11.593835

NPR 153.192265

NZD 1.897963

OMR 0.429497

PAB 1.119965

PEN 4.129072

PGK 4.654856

PHP 62.294316

PKR 315.375252

PLN 4.268489

PYG 8941.723611

QAR 4.081974

RON 5.106255

RSD 117.226377

RUB 90.497203

RWF 1603.750428

SAR 4.186446

SBD 9.31055

SCR 15.922308

SDG 670.351558

SEK 10.907859

SGD 1.452108

SHP 0.877249

SLE 25.344455

SLL 23408.578004

SOS 640.080215

SRD 40.8365

STD 23105.476908

SVC 9.799697

SYP 14514.229131

SZL 20.222375

THB 37.223582

TJS 11.546543

TMT 3.912686

TND 3.376696

TOP 2.614527

TRY 43.377235

TTD 7.596765

TWD 33.732379

TZS 3021.006621

UAH 46.488763

UGX 4097.873335

USD 1.116315

UYU 46.59856

UZS 14520.55117

VES 105.163869

VND 28936.572095

VUV 135.253884

WST 3.10171

XAF 655.936725

XAG 0.034565

XAU 0.000349

XCD 3.016899

XDR 0.815775

XOF 655.936725

XPF 119.331742

YER 272.496621

ZAR 20.143411

ZMK 10048.183034

ZMW 30.104069

ZWL 359.453134

AEX

1.8600

930.9

+0.2%
BEL20

44.9000

4447.35

+1.02%
PX1

32.9900

7886.69

+0.42%
ISEQ

-48.9500

11075.49

-0.44%
OSEBX

18.4100

1565.56

+1.19%
PSI20

43.8700

7235.99

+0.61%
ENTEC

-5.8300

1416.23

-0.41%
BIOTK

82.3400

2608.08

+3.26%
N150

16.4000

3582.54

+0.46%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

ECONOMIE 13.05.2025

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

(S.G.Stein--BBZ)

Berliner Boersenzeitung - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

En vedette

Un mort dans une explosion considérée comme "terroriste" devant une clinique en Californie

La finale de l'Eurovision bien lancée

Niger: des acteurs ont exprimé leur intérêt pour reprendre des sites miniers du français Orano

Céline Dion à l'Eurovision : "Le Père Noël existe", lâche le patron du concours