Berliner Boersenzeitung - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.313234
AFN 75.750435
ALL 95.578696
AMD 433.594907
ANG 2.102159
AOA 1078.160336
ARS 1638.971773
AUD 1.625109
AWG 2.11404
AZN 1.999672
BAM 1.958437
BBD 2.373175
BDT 144.574668
BGN 1.95913
BHD 0.444976
BIF 3506.83234
BMD 1.174466
BND 1.49167
BOB 8.141894
BRL 5.790702
BSD 1.178287
BTN 111.063856
BWP 15.776243
BYN 3.329855
BYR 23019.541599
BZD 2.369771
CAD 1.603364
CDF 2720.064631
CHF 0.915033
CLF 0.026588
CLP 1046.41439
CNY 7.992303
CNH 7.987329
COP 4391.212453
CRC 540.500166
CUC 1.174466
CUP 31.12336
CVE 110.414612
CZK 24.310747
DJF 209.820735
DKK 7.472819
DOP 70.07077
DZD 155.423039
EGP 61.917074
ERN 17.616996
ETB 183.972419
FJD 2.568381
FKP 0.863023
GBP 0.864883
GEL 3.147732
GGP 0.863023
GHS 13.255849
GIP 0.863023
GMD 85.736074
GNF 10340.659465
GTQ 8.997345
GYD 246.52194
HKD 9.192848
HNL 31.323911
HRK 7.539253
HTG 154.323854
HUF 355.902081
IDR 20401.597252
ILS 3.418737
IMP 0.863023
INR 110.912846
IQD 1543.578414
IRR 1541956.947453
ISK 143.801193
JEP 0.863023
JMD 185.589895
JOD 0.832657
JPY 184.144002
KES 151.682245
KGS 102.672444
KHR 4726.162529
KMF 492.10156
KPW 1056.962147
KRW 1724.486599
KWD 0.361498
KYD 0.981922
KZT 545.674746
LAK 25857.596849
LBP 105154.351013
LKR 379.417652
LRD 216.227592
LSL 19.224422
LTL 3.467894
LVL 0.710423
LYD 7.452972
MAD 10.799449
MDL 20.272124
MGA 4892.316697
MKD 61.676845
MMK 2465.917641
MNT 4203.300853
MOP 9.503997
MRU 47.141268
MUR 54.988565
MVR 18.15135
MWK 2043.037861
MXN 20.275107
MYR 4.603321
MZN 75.050158
NAD 19.224586
NGN 1599.599736
NIO 43.357827
NOK 10.917372
NPR 177.688178
NZD 1.973409
OMR 0.451583
PAB 1.178287
PEN 4.081295
PGK 5.127664
PHP 71.115081
PKR 328.303558
PLN 4.229206
PYG 7211.649015
QAR 4.294993
RON 5.262191
RSD 117.382025
RUB 87.677284
RWF 1727.425963
SAR 4.439687
SBD 9.433617
SCR 16.55833
SDG 705.267211
SEK 10.875383
SGD 1.489822
SHP 0.876858
SLE 28.892668
SLL 24627.968842
SOS 673.406736
SRD 43.961469
STD 24309.083409
STN 24.531883
SVC 10.309882
SYP 129.83015
SZL 19.218878
THB 37.847764
TJS 11.011555
TMT 4.122377
TND 3.417889
TOP 2.827833
TRY 53.276327
TTD 7.970733
TWD 36.867679
TZS 3063.471122
UAH 51.592714
UGX 4406.933896
USD 1.174466
UYU 47.115446
UZS 14278.225498
VES 582.780873
VND 30901.385664
VUV 138.617742
WST 3.175865
XAF 656.805031
XAG 0.014574
XAU 0.000249
XCD 3.174054
XCG 2.123559
XDR 0.816855
XOF 656.841431
XPF 119.331742
YER 280.225528
ZAR 19.270765
ZMK 10571.61339
ZMW 22.446032
ZWL 378.177704
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

(T.Renner--BBZ)