Berliner Boersenzeitung - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.208972
AFN 73.34913
ALL 94.723353
AMD 421.974787
ANG 2.051943
AOA 1052.100506
ARS 1662.879862
AUD 1.633057
AWG 2.065807
AZN 1.978188
BAM 1.956541
BBD 2.309234
BDT 140.740843
BGN 1.937883
BHD 0.432188
BIF 3417.034603
BMD 1.146079
BND 1.480067
BOB 7.922931
BRL 5.913075
BSD 1.146514
BTN 108.094993
BWP 15.569964
BYN 3.174316
BYR 22463.148822
BZD 2.305953
CAD 1.620569
CDF 2635.982402
CHF 0.923513
CLF 0.02623
CLP 1032.353653
CNY 7.758154
CNH 7.7801
COP 3947.164915
CRC 519.496734
CUC 1.146079
CUP 30.371094
CVE 110.539495
CZK 24.21281
DJF 203.681339
DKK 7.474578
DOP 66.988435
DZD 152.877533
EGP 57.214216
ERN 17.191185
ETB 181.542388
FJD 2.57438
FKP 0.866335
GBP 0.866304
GEL 3.042833
GGP 0.866335
GHS 12.840022
GIP 0.866335
GMD 83.095899
GNF 10056.843814
GTQ 8.738271
GYD 239.878749
HKD 8.983701
HNL 30.577569
HRK 7.533061
HTG 149.887416
HUF 352.880059
IDR 20401.352662
ILS 3.389644
IMP 0.866335
INR 108.242008
IQD 1501.363518
IRR 1576145.174428
ISK 144.211309
JEP 0.866335
JMD 181.107005
JOD 0.812568
JPY 184.84937
KES 148.30689
KGS 100.224458
KHR 4595.776869
KMF 493.960537
KPW 1031.47152
KRW 1753.283128
KWD 0.353016
KYD 0.955453
KZT 559.764426
LAK 25288.233135
LBP 102631.376141
LKR 382.424825
LRD 208.58626
LSL 18.887737
LTL 3.384074
LVL 0.693252
LYD 7.306198
MAD 10.680023
MDL 20.070688
MGA 4813.532348
MKD 61.632041
MMK 2406.219499
MNT 4102.473907
MOP 9.255865
MRU 45.900542
MUR 54.863033
MVR 17.650441
MWK 1990.739584
MXN 19.87701
MYR 4.735597
MZN 73.245837
NAD 18.887637
NGN 1559.929785
NIO 41.980445
NOK 11.119145
NPR 172.952743
NZD 1.996321
OMR 0.440665
PAB 1.146524
PEN 3.877153
PGK 5.029002
PHP 69.62545
PKR 319.010697
PLN 4.260726
PYG 6982.613861
QAR 4.174591
RON 5.239069
RSD 117.378035
RUB 84.353628
RWF 1677.286648
SAR 4.300311
SBD 9.235444
SCR 15.640758
SDG 688.219677
SEK 10.975193
SGD 1.48023
SHP 0.855664
SLE 28.365606
SLL 24032.708241
SOS 654.985307
SRD 42.827769
STD 23721.521821
STN 24.583395
SVC 10.032887
SYP 126.678518
SZL 18.898513
THB 37.636661
TJS 10.640037
TMT 4.011277
TND 3.372337
TOP 2.759484
TRY 53.229627
TTD 7.785949
TWD 36.245092
TZS 3009.085442
UAH 51.527989
UGX 4184.548182
USD 1.146079
UYU 46.07745
UZS 13237.212413
VES 695.248966
VND 30176.260636
VUV 135.976896
WST 3.153785
XAF 656.199778
XAG 0.017601
XAU 0.000275
XCD 3.097336
XCG 2.066365
XDR 0.806493
XOF 652.688901
XPF 119.331742
YER 271.764039
ZAR 18.887164
ZMK 10316.082823
ZMW 20.508588
ZWL 369.036977
  • AEX

    -4.0000

    1077.36

    -0.37%

  • BEL20

    6.2100

    5654.83

    +0.11%

  • PX1

    0.8500

    8469.16

    +0.01%

  • ISEQ

    -27.5700

    13758.35

    -0.2%

  • OSEBX

    16.7700

    1944.11

    +0.87%

  • PSI20

    -0.9000

    9039.92

    -0.01%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.3500

    4200.66

    -2.06%

  • N150

    4.6600

    4237.06

    +0.11%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

(G.Gruner--BBZ)