Dubai Telegraph - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.223936
AFN 72.459626
ALL 95.625923
AMD 433.015565
ANG 2.058868
AOA 1054.6893
ARS 1573.442377
AUD 1.671004
AWG 2.073149
AZN 1.957174
BAM 1.949
BBD 2.31292
BDT 140.907151
BGN 1.965965
BHD 0.433612
BIF 3411.091117
BMD 1.150152
BND 1.475761
BOB 7.953251
BRL 6.066823
BSD 1.148339
BTN 108.22499
BWP 15.790486
BYN 3.448588
BYR 22542.981659
BZD 2.309631
CAD 1.595226
CDF 2628.673947
CHF 0.917781
CLF 0.027129
CLP 1071.20497
CNY 7.949219
CNH 7.961301
COP 4243.440261
CRC 532.405408
CUC 1.150152
CUP 30.479031
CVE 109.886384
CZK 24.543729
DJF 204.496733
DKK 7.471395
DOP 69.233629
DZD 153.151704
EGP 60.730105
ERN 17.252282
ETB 177.477381
FJD 2.596354
FKP 0.861536
GBP 0.866352
GEL 3.099699
GGP 0.861536
GHS 12.555521
GIP 0.861536
GMD 84.537027
GNF 10067.175447
GTQ 8.785881
GYD 240.259646
HKD 9.009154
HNL 30.492755
HRK 7.529588
HTG 150.386802
HUF 390.636538
IDR 19530.733242
ILS 3.626901
IMP 0.861536
INR 108.962994
IQD 1504.398841
IRR 1510494.78673
ISK 143.400945
JEP 0.861536
JMD 180.479324
JOD 0.815453
JPY 183.863271
KES 149.39231
KGS 100.581391
KHR 4598.695285
KMF 491.115256
KPW 1035.238473
KRW 1738.77706
KWD 0.354177
KYD 0.957028
KZT 553.221334
LAK 24803.949548
LBP 102835.542724
LKR 361.157941
LRD 210.747529
LSL 19.64576
LTL 3.3961
LVL 0.695715
LYD 7.333064
MAD 10.72219
MDL 20.170398
MGA 4786.031084
MKD 61.591028
MMK 2418.239118
MNT 4117.532138
MOP 9.253891
MRU 45.806993
MUR 53.792604
MVR 17.781399
MWK 1991.240041
MXN 20.757992
MYR 4.615582
MZN 73.506528
NAD 19.64559
NGN 1590.925147
NIO 42.259434
NOK 11.177719
NPR 173.13788
NZD 1.999338
OMR 0.442229
PAB 1.148393
PEN 3.974399
PGK 4.962341
PHP 69.616981
PKR 320.584138
PLN 4.287508
PYG 7517.412308
QAR 4.187644
RON 5.097707
RSD 117.436278
RUB 93.944831
RWF 1676.954344
SAR 4.316005
SBD 9.249494
SCR 15.489295
SDG 691.241518
SEK 10.8734
SGD 1.481515
SHP 0.862912
SLE 28.23633
SLL 24118.127446
SOS 656.270335
SRD 43.202003
STD 23805.826849
STN 24.413125
SVC 10.048591
SYP 127.12204
SZL 19.643428
THB 37.852681
TJS 10.991021
TMT 4.037034
TND 3.379315
TOP 2.76929
TRY 51.134901
TTD 7.794399
TWD 36.818899
TZS 2963.351973
UAH 50.389743
UGX 4272.205731
USD 1.150152
UYU 46.560385
UZS 13988.074066
VES 535.99176
VND 30292.131604
VUV 137.681472
WST 3.168478
XAF 653.639515
XAG 0.017026
XAU 0.00026
XCD 3.108344
XCG 2.069707
XDR 0.812918
XOF 653.645178
XPF 119.331742
YER 274.483923
ZAR 19.79199
ZMK 10352.747435
ZMW 21.560744
ZWL 370.348515
  • AEX

    -13.0100

    957.77

    -1.34%

  • BEL20

    -40.5500

    4965.72

    -0.81%

  • PX1

    -61.3800

    7707.93

    -0.79%

  • ISEQ

    -43.3000

    11983.16

    -0.36%

  • OSEBX

    -14.1200

    1973.92

    -0.71%

  • PSI20

    -115.1600

    8881.67

    -1.28%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -3.6200

    3621.06

    -0.1%

  • N150

    -45.4900

    3777.16

    -1.19%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

T.Jamil--DT