in

Les chercheurs de Stony Brook combattent COVID avec HPC + AI

À l’aide de l’IA et d’une simulation de superordinateur, l’équipe de Ken Dill a dessiné l’équivalent d’affiches recherchées pour un gang de protéines qui composent COVID-19. Avec un peu de chance, l’un de leurs portraits pourrait identifier un moyen d’arrêter le coronavirus avec un médicament.

Lorsque la pandémie a frappé, «c’était terrible pour le monde et un grand défi de recherche pour nous», a déclaré Dill, qui dirige le Laufer Center for Physical & Quantitative Biology à l’Université Stony Brook, à Long Island, New York.

Pendant une décennie, il a aidé le centre à rassembler les chercheurs et les outils nécessaires pour étudier le fonctionnement interne des protéines – des molécules complexes qui sont fondamentales à la vie cellulaire. Le centre a l’habitude d’appliquer ses connaissances aux protéines virales, aidant les autres à identifier les médicaments pour les désactiver.

«Ainsi, lorsque la pandémie est survenue, nos gens ont voulu passer à l’action», a-t-il déclaré.

AI, Simulations se rencontrent au sommet

L’équipe avait pour objectif d’utiliser une combinaison d’outils physiques et d’IA pour prédire la structure 3D de plus d’une douzaine de protéines de coronavirus sur la base de listes de chaînes d’acides aminés qui les définissent. Il a remporté une subvention de temps sur le supercalculateur Summit construit par IBM à Oak Ridge National Laboratory pour effectuer ses calculs complexes.

«Nous avons effectué 30 simulations très étendues en parallèle, une sur chacun des 30 GPU, et nous les avons exécutées en continu pendant au moins quatre jours», explique Emiliano Brini, junior fellow au Laufer Center. «Summit est une machine formidable car elle a tellement de GPU, nous pouvons donc exécuter de nombreuses simulations en parallèle», a-t-il déclaré.

«Notre modélisation basée sur la physique consomme beaucoup de cycles de calcul. Nous utilisons les GPU presque exclusivement pour leur vitesse », a déclaré Dill.

Partager les résultats pour accélérer la recherche

Grâce à l’accélération, les prévisions sont déjà là. L’équipe Laufer les a rapidement partagées avec une centaine de chercheurs travaillant sur une douzaine de projets séparés qui mènent des expériences extrêmement lentes pour déterminer la structure réelle des protéines.

«Ils ont indiqué que certaines expériences pourraient être réalisées plus rapidement s’ils avaient une idée de notre travail sur ce que pourraient être ces structures 3D», a déclaré Dill.

Maintenant, c’est un jeu d’attente. Si l’une des prédictions donne aux chercheurs une longueur d’avance pour trouver une faiblesse que les fabricants de médicaments peuvent exploiter, ce serait une énorme victoire. Cela pourrait rapprocher la science de la mise en vente d’un médicament antiviral général sur l’étagère de votre pharmacie locale.

Fusion de l’apprentissage automatique et de la physique

L’équipe de Dill utilise un programme de dynamique moléculaire appelé MELD. Il associe des simulations physiques à des informations issues de l’apprentissage automatique basées sur des modèles statistiques.

L’IA fournit des informations clés MELD pour prédire la structure 3D d’une protéine à partir de sa séquence d’acides aminés. Il trouve rapidement des modèles dans une base de données d’informations au niveau atomique sur 200 000 protéines recueillies au cours des 50 dernières années.

MELD utilise ces informations dans des simulations physiques intensives en calcul pour déterminer la structure détaillée de la protéine. D’autres simulations peuvent alors prédire, par exemple, quelles molécules médicamenteuses se lieront étroitement à une protéine virale spécifique.

«Ainsi, ces deux mondes – l’inférence IA et les simulations physiques – jouent un rôle important dans la découverte de médicaments», a déclaré Dill. «Nous bénéficions des avantages des deux méthodes, et je pense que l’avenir est cette combinaison.»

MELD fonctionne sur CUDA, la plate-forme informatique accélérée de NVIDIA pour les GPU. «Il faudrait un temps prohibitif pour exécuter ses simulations sur des processeurs, donc la majorité des simulations biologiques sont effectuées sur des GPU», a déclaré Brini.

Jouer à un jeu en attente

Le défi COVID-19 a donné aux chercheurs de Laufer passionnés par la chimie une priorité. Maintenant, ils attendent des commentaires sur leurs travaux sur Summit.

«Une fois que nous aurons les résultats, nous publierons ce que nous apprenons des erreurs. Plusieurs fois, les chercheurs doivent retourner à la planche à dessin », a-t-il déclaré.

Et de temps en temps, ils célèbrent aussi.

Dill a organisé un petit rassemblement socialement éloigné pour une demi-douzaine de collègues dans sa cour une fois les travaux du Sommet terminés. Si ces résultats s’avèrent gagnants, il y aura une célébration beaucoup plus grande s’étendant bien au-delà du campus de Stony Brook.