CID 51 Modélisation, et analyse des données et des systèmes biologiques : approches informatiques, mathématiques et physique

II. Biologie structurale

La bioinformatique structurale est dédiée à l'étude et à la prédiction des structures des macromolécules biologiques comme les protéines, les acides nucléiques, les lipides ou les glycanes, de leurs interactions et de leurs complexes. Elle revêt deux aspects complémentaires. D'une part, des développements méthodologiques, dans lesquels les compétences interdisciplinaires en mathématiques, physique, chimie et informatique, nourries par les questions biologiques, sont essentielles et doivent être renforcées. D'autre part, un volet d'analyse, de structuration, de classification, d'exploitation et de valorisation de l'ensemble des données, souvent très hétérogènes, qui constituent le socle de connaissances sur lequel s'appuient les études fondamentales et prédictives, ainsi que la validation des nouvelles méthodologies. La France réalise dans ce domaine des développements novateurs et valorisés, notamment par la mise en place de serveurs souvent publiés dans des journaux spécialisés, la diffusion de logiciels et l'application à de très nombreuses thématiques biologiques.

Une des questions centrales de la bioinformatique structurale concerne l'étude des repliements des macromolécules, depuis la compréhension des mécanismes fondamentaux qui les gouvernent et la caractérisation de leurs briques fondamentales jusqu'à leur prédiction. Les études concernant les mécanismes de repliement ont très largement bénéficié ces dernières années de l'apport de techniques à très haute résolution temporelle. Par ailleurs, les développements méthodologiques se poursuivent dans les différentes voies de modélisation par homologie, par reconnaissance de repliement, ou ab initio/de novo. Ces approches facilitent la reconnaissance de parentés structurales entre protéines très éloignées sur le plan des séquences en acides aminés, ce qui est important pour poursuivre les efforts de modélisation à grande échelle et améliorer l'annotation fonctionnelle des génomes. Le couplage d'approches théoriques et expérimentales conduit également à des avancées significatives pour l'identification et la caractérisation des ARN non-codants et des structures désordonnées des protéines. La prédiction et la modélisation des interactions protéine-ligand et protéine-protéine est également un champ de recherche important, rejoignant pour partie le champ de la chémo-informatique.

La compréhension globale de la dynamique des complexes macromoléculaires nécessite le développement de méthodes d'intégration de données temporelles et spatiales multi-échelles, ainsi que de nouvelles méthodes de modélisation et de simulation. Toutefois, en parallèle, il convient de préserver, de développer et d'appliquer des expertises et des approches plus réductionnistes et de poursuivre des actions fondamentales et ciblées sur les acteurs même des complexes, en particulier pour la caractérisation et la modélisation des glucides, des lipides et des modifications post-traductionnelles, qui sont encore aujourd'hui insuffisamment explorées.

Grâce à l'augmentation des moyens de calcul et au développement de modèles physiques appropriés, la dynamique moléculaire connaît d'importantes évolutions, permettant de simuler des processus clés tels que le repliement, la liaison de ligands, ou les changements conformationnels de macromolécules. Ces avancées sont couplées au développement et à l'application de nouvelles méthodes d'exploration de l'espace énergétique, de calcul de l'énergie libre et de modèles simplifiés gros grain, permettant la mise en place d'approches multi-échelles. Mis en commun, ces développements autorisent un passage à l'échelle de la bioinformatique structurale, permettant la simulation et l'étude de très gros systèmes associant protéines, membranes, ADN et ARN, ou encore l'étude systématique par des méthodes de docking des interactions protéine-protéine. Ils laissent entrevoir à terme des interactions plus étroites avec le champ de la biologie des systèmes, même si plusieurs verrous, tant informatiques (exploration efficace sous contrainte de flexibilité) que biochimiques (calcul fiable de constantes d'association) restent encore à lever.

À l'interface avec la biologie structurale expérimentale, des méthodologies sont développées pour coupler les résultats obtenus à différentes résolutions par différentes techniques. Ces démarches seront d'autant plus essentielles que les informations structurales sont toujours plus nombreuses et variées, faisant écho au développement de nouvelles techniques comme les lasers à électrons libres. Les nombreux développements expérimentaux portant sur la cinétique suscitent également des développements spécifiques sur le plan de la bioinformatique. D'autres voient aussi le jour pour étudier la dynamique de complexes ou de structures particulières comme ceux des protéines intrinsèquement désordonnées ou des agrégats.

En conclusion, un effort conséquent de développement méthodologique à différents niveaux devrait permettre une intégration accrue de la bioinformatique structurale dans le contexte global et toujours évolutif du questionnement biologique, en lien étroit avec les expérimentateurs.