Berliner Boersenzeitung - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.196038
AFN 72.548266
ALL 93.983395
AMD 420.540936
ANG 2.045637
AOA 1048.866897
ARS 1669.851565
AUD 1.634419
AWG 2.056602
AZN 1.937156
BAM 1.951303
BBD 2.302094
BDT 140.416379
BGN 1.931927
BHD 0.430687
BIF 3410.531826
BMD 1.142557
BND 1.478193
BOB 7.897798
BRL 5.893083
BSD 1.142966
BTN 108.149745
BWP 15.512249
BYN 3.198029
BYR 22394.111824
BZD 2.298802
CAD 1.618202
CDF 2587.890714
CHF 0.924254
CLF 0.026315
CLP 1035.670747
CNY 7.740597
CNH 7.744546
COP 3936.165048
CRC 518.504991
CUC 1.142557
CUP 30.277753
CVE 110.685176
CZK 24.193414
DJF 203.055222
DKK 7.474488
DOP 66.610129
DZD 152.572485
EGP 56.826086
ERN 17.138351
ETB 184.276095
FJD 2.572241
FKP 0.863424
GBP 0.862613
GEL 3.027925
GGP 0.863424
GHS 12.830875
GIP 0.863424
GMD 83.406596
GNF 10028.78277
GTQ 8.715912
GYD 239.108921
HKD 8.957165
HNL 30.577527
HRK 7.533906
HTG 149.305892
HUF 352.232526
IDR 20500.89533
ILS 3.394936
IMP 0.863424
INR 108.201093
IQD 1497.349029
IRR 1571015.497997
ISK 144.00803
JEP 0.863424
JMD 180.603759
JOD 0.810112
JPY 184.584622
KES 147.86949
KGS 99.916444
KHR 4589.422662
KMF 490.726322
KPW 1028.301453
KRW 1759.417407
KWD 0.352661
KYD 0.952505
KZT 557.096049
LAK 25242.822342
LBP 102355.89823
LKR 382.189161
LRD 208.030548
LSL 18.780117
LTL 3.373673
LVL 0.691121
LYD 7.320609
MAD 10.655342
MDL 20.099676
MGA 4820.889196
MKD 61.629429
MMK 2399.275404
MNT 4089.475215
MOP 9.229529
MRU 45.702668
MUR 54.625306
MVR 17.66368
MWK 1983.478116
MXN 19.844495
MYR 4.7383
MZN 73.010218
NAD 18.780117
NGN 1561.486923
NIO 42.063056
NOK 11.086445
NPR 173.039193
NZD 2.002045
OMR 0.439314
PAB 1.142966
PEN 3.867586
PGK 5.092264
PHP 69.845651
PKR 317.897734
PLN 4.272876
PYG 6967.940842
QAR 4.166797
RON 5.237023
RSD 117.403487
RUB 84.835971
RWF 1674.041801
SAR 4.288919
SBD 9.210634
SCR 15.177226
SDG 686.108535
SEK 10.997611
SGD 1.478177
SHP 0.853034
SLE 28.278464
SLL 23958.847447
SOS 653.194569
SRD 42.766474
STD 23648.617409
STN 24.443664
SVC 10.000951
SYP 126.289192
SZL 18.775727
THB 37.670571
TJS 10.601367
TMT 3.998949
TND 3.379611
TOP 2.751003
TRY 53.095781
TTD 7.751136
TWD 36.221446
TZS 3002.904112
UAH 51.405724
UGX 4172.38382
USD 1.142557
UYU 45.704664
UZS 13698.428946
VES 693.112226
VND 30072.093021
VUV 135.22422
WST 3.144083
XAF 654.448679
XAG 0.01764
XAU 0.000273
XCD 3.087817
XCG 2.059952
XDR 0.813147
XOF 653.542317
XPF 119.331742
YER 272.615194
ZAR 18.751967
ZMK 10284.383366
ZMW 20.259308
ZWL 367.9028
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

(T.Renner--BBZ)