Berliner Boersenzeitung - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.236995
AFN 72.682942
ALL 95.499599
AMD 434.251954
ANG 2.065235
AOA 1057.951222
ARS 1605.382781
AUD 1.64816
AWG 2.07956
AZN 1.962086
BAM 1.946619
BBD 2.31966
BDT 141.323481
BGN 1.972045
BHD 0.435048
BIF 3409.12169
BMD 1.153709
BND 1.472953
BOB 7.958466
BRL 6.13012
BSD 1.151768
BTN 107.673185
BWP 15.704931
BYN 3.49432
BYR 22612.692624
BZD 2.316375
CAD 1.582855
CDF 2624.687914
CHF 0.910144
CLF 0.027116
CLP 1070.699078
CNY 7.944902
CNH 7.968707
COP 4233.434017
CRC 537.962827
CUC 1.153709
CUP 30.573283
CVE 109.747403
CZK 24.475875
DJF 205.092729
DKK 7.470501
DOP 68.367561
DZD 152.575662
EGP 59.996458
ERN 17.305632
ETB 181.514032
FJD 2.554831
FKP 0.864812
GBP 0.866441
GEL 3.132315
GGP 0.864812
GHS 12.554788
GIP 0.864812
GMD 84.797727
GNF 10095.387511
GTQ 8.822391
GYD 240.963553
HKD 9.037878
HNL 30.485224
HRK 7.512147
HTG 151.097385
HUF 392.907233
IDR 19562.517279
ILS 3.587025
IMP 0.864812
INR 108.4608
IQD 1508.784179
IRR 1517848.149879
ISK 143.371629
JEP 0.864812
JMD 180.946608
JOD 0.81798
JPY 183.840071
KES 149.206304
KGS 100.889409
KHR 4602.294375
KMF 492.634265
KPW 1038.372085
KRW 1736.689162
KWD 0.353693
KYD 0.959773
KZT 553.718519
LAK 24732.355738
LBP 103147.330197
LKR 359.285515
LRD 210.765973
LSL 19.429067
LTL 3.406602
LVL 0.697867
LYD 7.373226
MAD 10.762342
MDL 20.057404
MGA 4802.350857
MKD 61.350654
MMK 2421.422446
MNT 4116.640054
MOP 9.296655
MRU 46.103564
MUR 53.658616
MVR 17.835848
MWK 1997.180773
MXN 20.704471
MYR 4.544428
MZN 73.7177
NAD 19.429067
NGN 1564.71816
NIO 42.380124
NOK 11.057422
NPR 172.277494
NZD 1.982693
OMR 0.4436
PAB 1.151768
PEN 3.98192
PGK 4.971553
PHP 69.395518
PKR 321.563224
PLN 4.276224
PYG 7522.521818
QAR 4.211637
RON 5.078046
RSD 116.898675
RUB 95.998092
RWF 1675.796505
SAR 4.33178
SBD 9.289271
SCR 15.803168
SDG 693.379249
SEK 10.79329
SGD 1.477088
SHP 0.86558
SLE 28.35236
SLL 24192.709325
SOS 658.195776
SRD 43.249663
STD 23879.442983
STN 24.384994
SVC 10.077472
SYP 127.728575
SZL 19.435338
THB 37.966256
TJS 11.062327
TMT 4.049518
TND 3.401557
TOP 2.777853
TRY 51.123432
TTD 7.814146
TWD 36.961029
TZS 2994.477262
UAH 50.45524
UGX 4353.467906
USD 1.153709
UYU 46.411113
UZS 14041.775313
VES 524.580585
VND 30356.386139
VUV 137.118236
WST 3.1471
XAF 652.877857
XAG 0.016971
XAU 0.000256
XCD 3.117956
XCG 2.07571
XDR 0.811971
XOF 652.877857
XPF 119.331742
YER 275.276092
ZAR 19.716207
ZMK 10384.764004
ZMW 22.487941
ZWL 371.493765
  • AEX

    -16.0300

    961.62

    -1.64%

  • BEL20

    -88.0900

    4916.79

    -1.76%

  • PX1

    -142.1000

    7665.62

    -1.82%

  • ISEQ

    -203.0200

    11881.24

    -1.68%

  • OSEBX

    -31.9800

    1966.5

    -1.6%

  • PSI20

    -190.5700

    8756.26

    -2.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -27.8400

    3634.93

    -0.76%

  • N150

    -58.3500

    3755.58

    -1.53%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

(K.Lüdke--BBZ)