Berliner Boersenzeitung - Expertos preocupados porque la inteligencia artificial ya engaña a humanos

EUR -
AED 4.180966
AFN 72.281788
ALL 94.236629
AMD 419.464886
ANG 2.038011
AOA 1043.819048
ARS 1674.139709
AUD 1.645771
AWG 2.050358
AZN 1.938024
BAM 1.956569
BBD 2.297093
BDT 140.115077
BGN 1.924725
BHD 0.429183
BIF 3397.817884
BMD 1.138297
BND 1.477481
BOB 7.898105
BRL 5.91698
BSD 1.140543
BTN 107.984447
BWP 15.509096
BYN 3.203259
BYR 22310.629991
BZD 2.293802
CAD 1.616895
CDF 2582.796654
CHF 0.921679
CLF 0.026434
CLP 1040.369583
CNY 7.729612
CNH 7.735482
COP 3903.802483
CRC 517.396563
CUC 1.138297
CUP 30.164882
CVE 110.308361
CZK 24.214945
DJF 202.297724
DKK 7.475103
DOP 66.755361
DZD 152.103828
EGP 56.581581
ERN 17.074462
ETB 183.875471
FJD 2.553997
FKP 0.859276
GBP 0.862062
GEL 3.010836
GGP 0.859276
GHS 12.802032
GIP 0.859276
GMD 83.095791
GNF 9993.44542
GTQ 8.70142
GYD 238.613796
HKD 8.925334
HNL 30.514861
HRK 7.535648
HTG 149.118616
HUF 355.672343
IDR 20440.976432
ILS 3.410704
IMP 0.859276
INR 108.284533
IQD 1494.087304
IRR 1565158.992122
ISK 143.983202
JEP 0.859276
JMD 179.529782
JOD 0.807046
JPY 183.842978
KES 147.352771
KGS 99.544494
KHR 4577.377071
KMF 490.606213
KPW 1024.468102
KRW 1743.518623
KWD 0.351689
KYD 0.950474
KZT 554.788079
LAK 25256.928139
LBP 102133.84736
LKR 381.589998
LRD 207.571593
LSL 18.807593
LTL 3.361096
LVL 0.688544
LYD 7.318845
MAD 10.674696
MDL 20.078893
MGA 4764.873004
MKD 61.650549
MMK 2389.727291
MNT 4073.966585
MOP 9.210521
MRU 45.300414
MUR 54.593053
MVR 17.598261
MWK 1977.668706
MXN 19.986343
MYR 4.712889
MZN 72.737681
NAD 18.807593
NGN 1558.436413
NIO 41.966496
NOK 11.109465
NPR 172.774156
NZD 2.005811
OMR 0.437659
PAB 1.140548
PEN 3.860718
PGK 5.001988
PHP 70.050556
PKR 317.20809
PLN 4.280255
PYG 6952.702468
QAR 4.157634
RON 5.247437
RSD 117.380119
RUB 84.803037
RWF 1672.550109
SAR 4.274638
SBD 9.180415
SCR 15.236117
SDG 683.551122
SEK 11.087478
SGD 1.475465
SHP 0.849854
SLE 28.172588
SLL 23869.532518
SOS 651.853371
SRD 42.666816
STD 23560.458971
STN 24.50845
SVC 9.979923
SYP 125.818405
SZL 18.801391
THB 37.825158
TJS 10.578358
TMT 3.995424
TND 3.376027
TOP 2.740748
TRY 52.895655
TTD 7.744044
TWD 36.076858
TZS 2988.02854
UAH 51.196925
UGX 4174.640992
USD 1.138297
UYU 45.747983
UZS 13703.386606
VES 702.176169
VND 29965.680332
VUV 135.182527
WST 3.137518
XAF 656.212065
XAG 0.018479
XAU 0.000277
XCD 3.076306
XCG 2.055508
XDR 0.816121
XOF 656.212065
XPF 119.331742
YER 271.65506
ZAR 18.800009
ZMK 10246.030928
ZMW 20.460043
ZWL 366.531314
Expertos preocupados porque la inteligencia artificial ya engaña a humanos
Expertos preocupados porque la inteligencia artificial ya engaña a humanos / Foto: Kirill KUDRYAVTSEV - AFP/Archivos

Expertos preocupados porque la inteligencia artificial ya engaña a humanos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

(T.Burkhard--BBZ)