Dubai Telegraph - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.315061
AFN 77.724052
ALL 96.430624
AMD 448.409899
ANG 2.103659
AOA 1077.442142
ARS 1689.86317
AUD 1.771311
AWG 2.117872
AZN 2.000409
BAM 1.955407
BBD 2.365825
BDT 143.551156
BGN 1.955723
BHD 0.442954
BIF 3469.888012
BMD 1.174964
BND 1.514389
BOB 8.146363
BRL 6.363838
BSD 1.174664
BTN 106.549193
BWP 15.513883
BYN 3.43521
BYR 23029.292606
BZD 2.362425
CAD 1.618037
CDF 2643.668428
CHF 0.935862
CLF 0.027385
CLP 1074.304613
CNY 8.280264
CNH 8.270365
COP 4486.012203
CRC 587.581934
CUC 1.174964
CUP 31.136544
CVE 110.242848
CZK 24.334798
DJF 209.177969
DKK 7.469862
DOP 74.615007
DZD 152.355249
EGP 55.786091
ERN 17.624459
ETB 182.824164
FJD 2.707411
FKP 0.878162
GBP 0.87939
GEL 3.166584
GGP 0.878162
GHS 13.508286
GIP 0.878162
GMD 86.356626
GNF 10214.903998
GTQ 8.998192
GYD 245.75062
HKD 9.139045
HNL 30.940783
HRK 7.533746
HTG 153.908419
HUF 384.767195
IDR 19613.555028
ILS 3.788072
IMP 0.878162
INR 107.0163
IQD 1538.79735
IRR 49477.729809
ISK 148.209797
JEP 0.878162
JMD 187.72228
JOD 0.83304
JPY 181.945504
KES 151.570389
KGS 102.7508
KHR 4700.035597
KMF 493.48453
KPW 1057.467812
KRW 1734.02351
KWD 0.360476
KYD 0.978907
KZT 605.860839
LAK 25453.88542
LBP 105208.716305
LKR 363.207019
LRD 207.354807
LSL 19.70844
LTL 3.469363
LVL 0.710724
LYD 6.367721
MAD 10.782034
MDL 19.828016
MGA 5235.947914
MKD 61.529756
MMK 2467.149311
MNT 4167.41132
MOP 9.416348
MRU 46.726611
MUR 53.953914
MVR 18.090249
MWK 2036.890717
MXN 21.142242
MYR 4.799753
MZN 75.091164
NAD 19.708524
NGN 1706.364458
NIO 43.231129
NOK 11.939308
NPR 170.456749
NZD 2.033351
OMR 0.451772
PAB 1.174664
PEN 3.955622
PGK 4.991976
PHP 69.151912
PKR 329.196053
PLN 4.220693
PYG 7889.414739
QAR 4.28114
RON 5.092412
RSD 117.375408
RUB 93.410413
RWF 1710.256349
SAR 4.408683
SBD 9.587758
SCR 16.622882
SDG 706.738724
SEK 10.924779
SGD 1.517208
SHP 0.881527
SLE 28.257383
SLL 24638.409984
SOS 670.16534
SRD 45.365159
STD 24319.380662
STN 24.494974
SVC 10.277979
SYP 12993.304299
SZL 19.712039
THB 37.042495
TJS 10.802308
TMT 4.112374
TND 3.43531
TOP 2.829032
TRY 50.181881
TTD 7.972398
TWD 36.98804
TZS 2919.78564
UAH 49.650723
UGX 4184.159255
USD 1.174964
UYU 46.036627
UZS 14211.204945
VES 314.232054
VND 30939.73712
VUV 142.713252
WST 3.265592
XAF 655.825222
XAG 0.018677
XAU 0.000274
XCD 3.175399
XCG 2.116984
XDR 0.815636
XOF 655.825222
XPF 119.331742
YER 280.170076
ZAR 19.761072
ZMK 10576.086666
ZMW 27.22253
ZWL 378.337899
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

J.Alaqanone--DT