Dubai Telegraph - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.18819
AFN 72.986681
ALL 94.093169
AMD 419.336766
ANG 2.041812
AOA 1046.33874
ARS 1689.237159
AUD 1.659493
AWG 2.052756
AZN 1.94463
BAM 1.95365
BBD 2.294415
BDT 140.405512
BGN 1.928314
BHD 0.429516
BIF 3389.081848
BMD 1.14042
BND 1.47354
BOB 7.889319
BRL 5.917526
BSD 1.139217
BTN 107.645086
BWP 15.481423
BYN 3.303807
BYR 22352.23589
BZD 2.291119
CAD 1.622653
CDF 2594.455617
CHF 0.922304
CLF 0.026717
CLP 1051.512997
CNY 7.747957
CNH 7.749845
COP 3928.462479
CRC 516.717864
CUC 1.14042
CUP 30.221135
CVE 110.143809
CZK 24.253544
DJF 202.861456
DKK 7.474285
DOP 67.74368
DZD 152.01573
EGP 56.112895
ERN 17.106303
ETB 183.659588
FJD 2.566291
FKP 0.864276
GBP 0.861456
GEL 3.01051
GGP 0.864276
GHS 12.884823
GIP 0.864276
GMD 83.816709
GNF 9987.098794
GTQ 8.691399
GYD 238.297802
HKD 8.944589
HNL 30.487722
HRK 7.533841
HTG 148.893562
HUF 354.549819
IDR 20408.959872
ILS 3.407063
IMP 0.864276
INR 107.959005
IQD 1492.351426
IRR 1569218.193112
ISK 143.989507
JEP 0.864276
JMD 179.376341
JOD 0.808589
JPY 184.93172
KES 147.661924
KGS 99.729769
KHR 4580.879333
KMF 492.661826
KPW 1026.378578
KRW 1765.353362
KWD 0.353142
KYD 0.949347
KZT 553.126546
LAK 25550.215035
LBP 102013.471253
LKR 383.048456
LRD 207.330965
LSL 18.717313
LTL 3.367364
LVL 0.689829
LYD 7.318755
MAD 10.675554
MDL 20.135315
MGA 4847.708586
MKD 61.633119
MMK 2394.482869
MNT 4082.621573
MOP 9.202834
MRU 45.464779
MUR 53.87344
MVR 17.631033
MWK 1975.443746
MXN 19.951315
MYR 4.635352
MZN 72.815319
NAD 18.717313
NGN 1574.15682
NIO 41.924238
NOK 11.340258
NPR 172.227967
NZD 2.019211
OMR 0.438486
PAB 1.139246
PEN 3.890319
PGK 5.001563
PHP 69.920269
PKR 316.774443
PLN 4.289009
PYG 6937.184543
QAR 4.152613
RON 5.24217
RSD 117.382277
RUB 87.817385
RWF 1672.301315
SAR 4.279379
SBD 9.197535
SCR 15.304587
SDG 684.834289
SEK 11.091419
SGD 1.475214
SHP 0.851439
SLE 28.279206
SLL 23914.045531
SOS 651.060804
SRD 42.759486
STD 23604.395609
STN 24.473394
SVC 9.967945
SYP 126.053037
SZL 18.712754
THB 37.921829
TJS 10.560434
TMT 4.002875
TND 3.374372
TOP 2.745859
TRY 53.204252
TTD 7.744275
TWD 36.363447
TZS 2993.60643
UAH 51.128392
UGX 4175.405811
USD 1.14042
UYU 45.839764
UZS 13729.832902
VES 709.619078
VND 30002.744791
VUV 135.91446
WST 3.171375
XAF 655.241785
XAG 0.019835
XAU 0.000287
XCD 3.082043
XCG 2.053123
XDR 0.814911
XOF 655.218828
XPF 119.331742
YER 272.101636
ZAR 18.764075
ZMK 10265.153548
ZMW 20.624764
ZWL 367.214839
  • AEX

    4.5600

    1065.34

    +0.43%

  • BEL20

    -20.6600

    5719.28

    -0.36%

  • PX1

    -17.6100

    8367.33

    -0.21%

  • ISEQ

    -131.0200

    13807.63

    -0.94%

  • OSEBX

    5.8900

    1906.43

    +0.31%

  • PSI20

    23.7500

    9159.49

    +0.26%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    1.7100

    4288.95

    +0.04%

  • N150

    -21.5800

    4127.8

    -0.52%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

Y.Rahma--DT