Dubai Telegraph - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.244814
AFN 72.802804
ALL 95.914677
AMD 436.246704
ANG 2.068623
AOA 1059.686486
ARS 1612.008363
AUD 1.638291
AWG 2.082972
AZN 1.962345
BAM 1.969574
BBD 2.328475
BDT 141.855734
BGN 1.97528
BHD 0.436297
BIF 3432.136637
BMD 1.155602
BND 1.483243
BOB 7.989252
BRL 6.063493
BSD 1.156105
BTN 107.709447
BWP 15.776079
BYN 3.574902
BYR 22649.790599
BZD 2.325171
CAD 1.587086
CDF 2628.993471
CHF 0.913988
CLF 0.026713
CLP 1054.763637
CNY 7.97417
CNH 7.960725
COP 4269.832208
CRC 540.913237
CUC 1.155602
CUP 30.623441
CVE 112.151229
CZK 24.481386
DJF 205.373253
DKK 7.47086
DOP 67.978235
DZD 152.576569
EGP 60.372554
ERN 17.334023
ETB 181.657116
FJD 2.588804
FKP 0.867479
GBP 0.862477
GEL 3.13749
GGP 0.867479
GHS 12.593607
GIP 0.867479
GMD 85.514573
GNF 10143.290905
GTQ 8.843733
GYD 241.874076
HKD 9.052001
HNL 30.704397
HRK 7.533481
HTG 151.647087
HUF 392.943851
IDR 19565.490032
ILS 3.613959
IMP 0.867479
INR 107.442864
IQD 1513.838045
IRR 1519760.503236
ISK 143.791825
JEP 0.867479
JMD 181.624669
JOD 0.819309
JPY 182.423841
KES 149.763421
KGS 101.054924
KHR 4633.962204
KMF 494.597345
KPW 1040.027513
KRW 1724.007673
KWD 0.353926
KYD 0.963484
KZT 555.984674
LAK 24816.543481
LBP 103484.119913
LKR 360.370478
LRD 211.937779
LSL 19.449397
LTL 3.412191
LVL 0.699012
LYD 7.372499
MAD 10.814987
MDL 20.260655
MGA 4813.080507
MKD 61.61802
MMK 2426.462186
MNT 4143.804949
MOP 9.328119
MRU 46.350722
MUR 53.741226
MVR 17.853738
MWK 2007.279745
MXN 20.551813
MYR 4.551849
MZN 73.838926
NAD 19.44871
NGN 1568.150995
NIO 42.433955
NOK 10.997704
NPR 172.329658
NZD 1.976252
OMR 0.444335
PAB 1.156145
PEN 3.992022
PGK 4.971446
PHP 69.284099
PKR 322.586743
PLN 4.27635
PYG 7512.308906
QAR 4.211707
RON 5.093891
RSD 117.455653
RUB 99.556773
RWF 1686.022678
SAR 4.338713
SBD 9.300955
SCR 17.161078
SDG 694.516441
SEK 10.775205
SGD 1.478315
SHP 0.867
SLE 28.485234
SLL 24232.399446
SOS 660.428353
SRD 43.337431
STD 23918.619165
STN 24.845434
SVC 10.116052
SYP 127.727213
SZL 19.448949
THB 37.709593
TJS 11.069987
TMT 4.044605
TND 3.364245
TOP 2.782411
TRY 51.186048
TTD 7.836174
TWD 36.808226
TZS 3001.680884
UAH 50.840265
UGX 4369.74838
USD 1.155602
UYU 46.828911
UZS 14092.560843
VES 525.435424
VND 30380.765043
VUV 137.988555
WST 3.157358
XAF 660.611205
XAG 0.01622
XAU 0.000251
XCD 3.123071
XCG 2.083589
XDR 0.821585
XOF 660.428833
XPF 119.331742
YER 275.668443
ZAR 19.4876
ZMK 10401.796193
ZMW 22.631445
ZWL 372.103231
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

J.Alaqanone--DT