Berliner Boersenzeitung - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.256969
AFN 73.026624
ALL 95.949668
AMD 436.29849
ANG 2.074968
AOA 1062.937298
ARS 1612.956254
AUD 1.648622
AWG 2.089361
AZN 1.97515
BAM 1.955793
BBD 2.330592
BDT 141.989509
BGN 1.981339
BHD 0.437098
BIF 3425.188147
BMD 1.159146
BND 1.479895
BOB 7.995972
BRL 6.159011
BSD 1.157196
BTN 108.180626
BWP 15.778945
BYN 3.510788
BYR 22719.261378
BZD 2.327292
CAD 1.591102
CDF 2637.057544
CHF 0.913917
CLF 0.027244
CLP 1075.745893
CNY 7.982348
CNH 8.005172
COP 4253.385281
CRC 540.49813
CUC 1.159146
CUP 30.717369
CVE 110.264618
CZK 24.515015
DJF 206.059287
DKK 7.48519
DOP 68.689762
DZD 153.294785
EGP 59.995792
ERN 17.38719
ETB 182.369469
FJD 2.566871
FKP 0.87126
GBP 0.86899
GEL 3.147128
GGP 0.87126
GHS 12.613956
GIP 0.87126
GMD 85.201694
GNF 10142.964899
GTQ 8.863969
GYD 242.099162
HKD 9.082199
HNL 30.628894
HRK 7.547552
HTG 151.809475
HUF 393.739159
IDR 19654.711213
ILS 3.60393
IMP 0.87126
INR 108.971952
IQD 1515.894754
IRR 1525001.44174
ISK 144.047519
JEP 0.87126
JMD 181.799371
JOD 0.82188
JPY 184.582853
KES 149.909481
KGS 101.364887
KHR 4623.983998
KMF 494.955743
KPW 1043.080849
KRW 1744.874492
KWD 0.35536
KYD 0.964297
KZT 556.328075
LAK 24848.914008
LBP 103633.441366
LKR 360.978751
LRD 211.759267
LSL 19.520632
LTL 3.422657
LVL 0.701156
LYD 7.407974
MAD 10.813063
MDL 20.15193
MGA 4824.983303
MKD 61.639787
MMK 2434.137979
MNT 4156.167228
MOP 9.340468
MRU 46.32084
MUR 53.912319
MVR 17.920835
MWK 2006.593056
MXN 20.746631
MYR 4.565921
MZN 74.073751
NAD 19.520632
NGN 1572.092184
NIO 42.579853
NOK 11.093021
NPR 173.089401
NZD 1.985179
OMR 0.445696
PAB 1.157196
PEN 4.000686
PGK 4.994983
PHP 69.723065
PKR 323.078682
PLN 4.282755
PYG 7557.973845
QAR 4.231485
RON 5.101986
RSD 117.449594
RUB 96.003268
RWF 1683.694173
SAR 4.352195
SBD 9.33305
SCR 15.877645
SDG 696.647132
SEK 10.831104
SGD 1.486609
SHP 0.86966
SLE 28.486057
SLL 24306.724357
SOS 661.297712
SRD 43.45349
STD 23991.981659
STN 24.499915
SVC 10.124965
SYP 128.128397
SZL 19.526932
THB 38.14522
TJS 11.114462
TMT 4.068602
TND 3.417588
TOP 2.790945
TRY 51.295112
TTD 7.850973
TWD 37.135217
TZS 3008.589588
UAH 50.693025
UGX 4373.984863
USD 1.159146
UYU 46.629839
UZS 14107.951178
VES 527.05282
VND 30499.449254
VUV 138.346896
WST 3.161587
XAF 655.95473
XAG 0.017031
XAU 0.000257
XCD 3.13265
XCG 2.085493
XDR 0.815797
XOF 655.95473
XPF 119.331742
YER 276.576393
ZAR 19.85325
ZMK 10433.709028
ZMW 22.593922
ZWL 373.244535
  • AEX

    -16.0300

    961.62

    -1.64%

  • BEL20

    -88.0900

    4916.79

    -1.76%

  • PX1

    -142.1000

    7665.62

    -1.82%

  • ISEQ

    -203.0200

    11881.24

    -1.68%

  • OSEBX

    -31.9800

    1966.5

    -1.6%

  • PSI20

    -190.5700

    8756.26

    -2.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -27.8400

    3634.93

    -0.76%

  • N150

    -58.3500

    3755.58

    -1.53%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

(G.Gruner--BBZ)