El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema

Dubai Telegraph - El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema

Dubai 30°C

AED 4.212777

AFN 72.835586

ALL 94.512843

AMD 422.248264

ANG 2.053494

AOA 1052.895931

ARS 1680.790338

AUD 1.635257

AWG 2.067368

AZN 1.95436

BAM 1.956354

BBD 2.309354

BDT 140.73988

BGN 1.939347

BHD 0.432422

BIF 3423.630825

BMD 1.146945

BND 1.480319

BOB 7.92328

BRL 5.90941

BSD 1.146625

BTN 108.087801

BWP 15.582008

BYN 3.185903

BYR 22480.122

BZD 2.305963

CAD 1.623185

CDF 2615.035015

CHF 0.925648

CLF 0.026299

CLP 1035.072439

CNY 7.764364

CNH 7.780559

COP 3960.034063

CRC 520.14739

CUC 1.146945

CUP 30.394043

CVE 110.569964

CZK 24.190336

DJF 203.835517

DKK 7.474072

DOP 66.986043

DZD 152.939427

EGP 57.331754

ERN 17.204175

ETB 181.647461

FJD 2.564

FKP 0.866759

GBP 0.866531

GEL 3.039852

GGP 0.866759

GHS 12.874504

GIP 0.866759

GMD 84.304874

GNF 10064.442782

GTQ 8.746478

GYD 239.84901

HKD 8.988436

HNL 30.606273

HRK 7.533248

HTG 149.77244

HUF 351.906109

IDR 20445.785654

ILS 3.394682

IMP 0.866759

INR 108.1919

IQD 1502.49795

IRR 1577049.375404

ISK 143.976448

JEP 0.866759

JMD 181.171337

JOD 0.813229

JPY 185.008009

KES 148.419043

KGS 100.300781

KHR 4599.249852

KMF 492.617229

KPW 1032.250901

KRW 1752.130969

KWD 0.353179

KYD 0.955446

KZT 559.543917

LAK 25295.872375

LBP 102708.92515

LKR 382.668433

LRD 208.916469

LSL 18.815678

LTL 3.386631

LVL 0.693776

LYD 7.311819

MAD 10.580612

MDL 20.248208

MGA 4817.169398

MKD 61.628611

MMK 2407.987936

MNT 4106.547494

MOP 9.256923

MRU 45.947051

MUR 54.881752

MVR 17.720734

MWK 1992.243861

MXN 19.872546

MYR 4.745948

MZN 73.301688

NAD 18.814173

NGN 1560.350288

NIO 41.990088

NOK 11.102658

NPR 172.945006

NZD 1.997675

OMR 0.441554

PAB 1.14663

PEN 3.881306

PGK 5.032508

PHP 69.638491

PKR 319.223511

PLN 4.259467

PYG 7041.056554

QAR 4.175458

RON 5.239364

RSD 117.183799

RUB 83.845404

RWF 1679.12748

SAR 4.299026

SBD 9.24601

SCR 15.693948

SDG 688.744688

SEK 10.986379

SGD 1.482316

SHP 0.85631

SLE 28.387314

SLL 24050.86738

SOS 655.483268

SRD 42.898615

STD 23739.445827

STN 24.544623

SVC 10.032843

SYP 126.774237

SZL 18.814083

THB 37.723444

TJS 10.63456

TMT 4.014308

TND 3.339618

TOP 2.761569

TRY 53.26206

TTD 7.775237

TWD 36.375404

TZS 3017.595134

UAH 51.508996

UGX 4173.182519

USD 1.146945

UYU 45.84299

UZS 13769.075108

VES 695.774297

VND 30176.12295

VUV 135.491976

WST 3.156157

XAF 656.142926

XAG 0.017685

XAU 0.000276

XCD 3.099677

XCG 2.066386

XDR 0.807102

XOF 648.024305

XPF 119.331742

YER 273.665193

ZAR 18.876464

ZMK 10323.847966

ZMW 20.552914

ZWL 369.315822

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema / Foto: Fabrice COFFRINI - AFP

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema

CULTURA 03.08.2024

Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.

Tamaño del texto:

Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.

Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.

Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.

Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.

- Como las vacas locas -

Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.

Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.

Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.

Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.

Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.

"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.

Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.

"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.

- "Basura" -

Para otros especialistas, no obstante, el problema es exagerado.

Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.

El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.

"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.

Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.

"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.

D.Farook--DT

Dubai Telegraph - El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema

Destacados

Cinco cosas destacadas de la Semana de la Moda masculina de París

Alerta máxima por ola de calor en más de un tercio de Francia el domingo

El flamenco "es un arte muy visceral, muy directo", destaca la 'bailaora' Eva Yerbabuena

James Burrows, prolífico director detrás de series como "Friends", muere a los 85 años