Berliner Boersenzeitung - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.353382
AFN 77.05154
ALL 96.6659
AMD 452.980789
ANG 2.12196
AOA 1087.011649
ARS 1715.27374
AUD 1.700138
AWG 2.136683
AZN 2.016962
BAM 1.955717
BBD 2.406598
BDT 146.013807
BGN 1.990725
BHD 0.449081
BIF 3539.949869
BMD 1.1854
BND 1.513236
BOB 8.25665
BRL 6.231058
BSD 1.194849
BTN 109.725346
BWP 15.634337
BYN 3.403256
BYR 23233.834642
BZD 2.403098
CAD 1.611918
CDF 2684.930667
CHF 0.911329
CLF 0.026011
CLP 1027.065402
CNY 8.240602
CNH 8.248669
COP 4350.11551
CRC 591.674907
CUC 1.1854
CUP 31.413093
CVE 110.260324
CZK 24.336607
DJF 212.770976
DKK 7.470147
DOP 75.22681
DZD 154.464449
EGP 55.903629
ERN 17.780996
ETB 185.616528
FJD 2.613392
FKP 0.865856
GBP 0.861451
GEL 3.194656
GGP 0.865856
GHS 13.089445
GIP 0.865856
GMD 86.534664
GNF 10484.555345
GTQ 9.164611
GYD 249.979398
HKD 9.259098
HNL 31.537662
HRK 7.536653
HTG 156.373368
HUF 380.868342
IDR 19883.302315
ILS 3.66336
IMP 0.865856
INR 108.694634
IQD 1565.333613
IRR 49934.963672
ISK 144.986215
JEP 0.865856
JMD 187.242059
JOD 0.840447
JPY 183.458423
KES 154.263458
KGS 103.663312
KHR 4804.796226
KMF 491.940791
KPW 1066.859756
KRW 1719.772596
KWD 0.363823
KYD 0.995758
KZT 600.944514
LAK 25713.909461
LBP 106999.862086
LKR 369.514329
LRD 215.370866
LSL 18.971995
LTL 3.500177
LVL 0.717036
LYD 7.497682
MAD 10.83854
MDL 20.097148
MGA 5339.773538
MKD 61.637386
MMK 2489.728817
MNT 4227.587506
MOP 9.608592
MRU 47.674978
MUR 53.852825
MVR 18.326127
MWK 2071.912129
MXN 20.704153
MYR 4.672852
MZN 75.580739
NAD 18.971995
NGN 1643.533583
NIO 43.968135
NOK 11.414558
NPR 175.560554
NZD 1.959292
OMR 0.458021
PAB 1.194849
PEN 3.994931
PGK 5.114783
PHP 69.837845
PKR 334.292423
PLN 4.212869
PYG 8003.660561
QAR 4.356415
RON 5.097103
RSD 117.395021
RUB 90.53616
RWF 1743.326065
SAR 4.447253
SBD 9.54438
SCR 17.20327
SDG 713.019239
SEK 10.549127
SGD 1.506168
SHP 0.889357
SLE 28.834855
SLL 24857.238699
SOS 682.871039
SRD 45.10505
STD 24535.381029
STN 24.498961
SVC 10.454557
SYP 13110.017057
SZL 18.966196
THB 37.222281
TJS 11.154027
TMT 4.148899
TND 3.433054
TOP 2.854158
TRY 51.401896
TTD 8.112656
TWD 37.456216
TZS 3076.769513
UAH 51.211828
UGX 4271.81883
USD 1.1854
UYU 46.368034
UZS 14607.380494
VES 410.078852
VND 30749.268909
VUV 140.815358
WST 3.213359
XAF 655.929182
XAG 0.014004
XAU 0.000244
XCD 3.203602
XCG 2.153409
XDR 0.815765
XOF 655.929182
XPF 119.331742
YER 282.51038
ZAR 19.104199
ZMK 10670.019447
ZMW 23.449006
ZWL 381.698228
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

(T.Renner--BBZ)