Dubai Telegraph - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.31683
AFN 75.228656
ALL 95.068131
AMD 432.88885
ANG 2.103914
AOA 1079.059869
ARS 1643.281536
AUD 1.624521
AWG 2.118743
AZN 1.991897
BAM 1.948996
BBD 2.361158
BDT 143.847849
BGN 1.960765
BHD 0.442655
BIF 3489.319312
BMD 1.175447
BND 1.486511
BOB 8.100722
BRL 5.763923
BSD 1.172308
BTN 110.704547
BWP 15.739057
BYN 3.312935
BYR 23038.755179
BZD 2.357769
CAD 1.608505
CDF 2662.386498
CHF 0.915908
CLF 0.026661
CLP 1049.297515
CNY 7.99392
CNH 7.984785
COP 4406.77316
CRC 538.918716
CUC 1.175447
CUP 31.149337
CVE 109.881421
CZK 24.321109
DJF 208.761246
DKK 7.473067
DOP 69.71663
DZD 155.469647
EGP 61.803693
ERN 17.6317
ETB 183.048306
FJD 2.570526
FKP 0.862123
GBP 0.865123
GEL 3.14435
GGP 0.862123
GHS 13.2059
GIP 0.862123
GMD 86.401959
GNF 10286.092801
GTQ 8.950754
GYD 245.283751
HKD 9.203248
HNL 31.165207
HRK 7.53743
HTG 153.48421
HUF 354.855317
IDR 20475.693665
ILS 3.425131
IMP 0.862123
INR 111.903699
IQD 1535.738967
IRR 1541598.337446
ISK 143.804144
JEP 0.862123
JMD 184.765013
JOD 0.833364
JPY 184.699082
KES 151.80888
KGS 102.758144
KHR 4703.580509
KMF 491.336451
KPW 1057.901973
KRW 1733.5845
KWD 0.361799
KYD 0.976989
KZT 541.818593
LAK 25709.252874
LBP 104981.226364
LKR 377.43244
LRD 215.119052
LSL 19.232562
LTL 3.470789
LVL 0.711016
LYD 7.413122
MAD 10.721772
MDL 20.047019
MGA 4896.905641
MKD 61.66263
MMK 2467.881405
MNT 4204.228756
MOP 9.452303
MRU 46.857428
MUR 54.928689
MVR 18.102674
MWK 2032.40518
MXN 20.243366
MYR 4.618341
MZN 75.122928
NAD 19.232562
NGN 1596.209455
NIO 43.139407
NOK 10.809994
NPR 177.127674
NZD 1.977548
OMR 0.451959
PAB 1.172308
PEN 4.053251
PGK 5.176928
PHP 71.820961
PKR 326.72565
PLN 4.240594
PYG 7161.002021
QAR 4.285042
RON 5.221219
RSD 117.39068
RUB 87.569554
RWF 1718.600624
SAR 4.428479
SBD 9.426415
SCR 17.186198
SDG 705.853791
SEK 10.880463
SGD 1.492464
SHP 0.87759
SLE 28.974525
SLL 24648.524918
SOS 669.961266
SRD 43.960489
STD 24329.373323
STN 24.414772
SVC 10.25819
SYP 129.943205
SZL 19.219906
THB 38.155068
TJS 10.937718
TMT 4.114063
TND 3.405113
TOP 2.830194
TRY 53.338599
TTD 7.945264
TWD 36.929038
TZS 3067.915591
UAH 51.495537
UGX 4392.665866
USD 1.175447
UYU 46.756779
UZS 14220.358871
VES 586.82527
VND 30943.634188
VUV 139.381869
WST 3.182048
XAF 653.675119
XAG 0.014665
XAU 0.000252
XCD 3.176703
XCG 2.112824
XDR 0.812962
XOF 653.675119
XPF 119.331742
YER 280.490981
ZAR 19.363135
ZMK 10580.421228
ZMW 22.319087
ZWL 378.493355
  • AEX

    0.1000

    1017.64

    +0.01%

  • BEL20

    21.8500

    5485.13

    +0.4%

  • PX1

    -63.2800

    8049.22

    -0.78%

  • ISEQ

    1.2700

    12722.54

    +0.01%

  • OSEBX

    3.5500

    1973.8

    +0.18%

  • PSI20

    67.1000

    9134.46

    +0.74%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -6.0000

    3992.65

    -0.15%

  • N150

    0.0000

    4189.25

    0%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

Y.Rahma--DT