CID 51 Modélisation, et analyse des données et des systèmes biologiques : approches informatiques, mathématiques et physique

III. Biologie des systèmes

La biologie des systèmes est née au tournant des années 1990-2000 et a rapidement suscité un très fort intérêt dans la communauté biologique mais aussi aux interfaces de celle-ci avec la physique, l'informatique ou les mathématiques. En effet le programme scientifique de la biologie des systèmes répond à un besoin latent en biologie, à savoir disposer d'outils permettant de comprendre comment les systèmes vivants émergent comme des entités stables et structurées à partir de l'enchevêtrement complexe et dynamique des interactions moléculaires qui constituent leur substrat physico-chimique. L'apport de la biologie des systèmes, par rapport aux approches classiques de biologie moléculaire, de biologie cellulaire, de physiologie et de génétique, se situe dans la mobilisation systématique des outils de modélisation et de simulation dans l'analyse des systèmes biologiques, qui permettent de tester les hypothèses biologiques d'une manière formalisée, souvent quantitative, parfois même exhaustive. L'interdisciplinarité avec les mathématiques, l'informatique ou la physique en est donc une composante essentielle. En ce sens, on peut voir la biologie des systèmes comme une déclinaison biologique des « sciences de la complexité » à différentes échelles : cellule, tissu, organisme complet, voire éco-évolutive. De par sa nature intégrative et par la rationalisation, la quantification et l'identification de régulateurs clés des fonctions biologiques, la biologie des systèmes peut conduire à des applications importantes en recherche biomédicale. De même elle fournit un socle théorique essentiel à la biologie synthétique. En effet, produit du génie génétique et ayant comme objectif la ré-ingénierie de systèmes biologiques, la biologie synthétique puise son inspiration dans des principes de design révélés par la biologie des systèmes

À partir de ce programme très général, la biologie des systèmes se décline en deux grands courants méthodologiques. D'une part les approches centrées sur les données, guidées par le développement rapide des techniques à haut débit et leur diversification à un très grand nombre de systèmes moléculaires et cellulaires en lien avec le développement du séquençage et des techniques d'imagerie cellulaire. Ces techniques permettent en effet d'acquérir directement un grand volume de données sur des sous-systèmes différents et, de plus en plus souvent, dans un contexte de cellule unique qui donne accès à la distribution des observables, voire même aux dynamiques stochastiques dans un contexte de molécule unique. Elles offrent donc à la biologie des systèmes une vue de plus en plus complète mais qui demande à être structurée par la modélisation, par exemple via l'apprentissage de modèles. D'autre part les approches centrées sur les systèmes qui ont pour objectif d'identifier les grands principes régissant la dynamique des systèmes biologiques en construisant des modèles computationnels de plus en plus précis de systèmes biologiques bien caractérisés dans la littérature. À de rares exceptions près, ces deux approches restent encore trop isolées l'une de l'autre alors que l'objectif premier de la biologie des systèmes devrait être de les réconcilier. La faute en est probablement au morcellement disciplinaire (l'approche données-centrée venant souvent des laboratoires de biologie tandis que l'approche système-centrée est souvent issue des modélisateurs) mais aussi à l'insuffisance de formations transversales. La biologie des systèmes demande en effet que les chercheurs soient à la fois rompus aux techniques expérimentales mais aussi aux méthodes et outils d'analyse de données et à la modélisation mathématique. Un bagage que peu de formations dispensent à l'heure actuelle.

Malgré son très jeune âge – ou peut-être en raison de celui-ci – la biologie des systèmes est en évolution permanente et rapide. On est ainsi passé en quelques années des approches cartographiques en « grands réseaux », où les systèmes biologiques étaient décrits par les interconnexions statiques entre leurs composants moléculaires, à la prise en compte des dynamiques temporelles puis spatio-temporelles de ces mêmes réseaux au moyen de formalismes très divers, allant des systèmes dynamiques aux méthodes informatiques formelles en passant par la simulation individu-centrée ou la fouille de graphes statiques ou dynamiques. Les recherches théoriques parallèles qui concernent l'acquisition et le traitement de données à haut débit et d'imagerie cellulaire et tissulaire pourront se révéler cruciales pour le développement de ce domaine.

La France a des atouts en biologie des systèmes, avec une forte tradition en modélisation, en théorie du contrôle et en méthodes formelles appliquées à la biologie. Cependant, force est de constater que l'investissement individuel et collectif des chercheurs en biologie des systèmes n'a pas été soutenu à la hauteur de ce qu'il a été aux États-Unis, au Japon, en Allemagne et en Grande-Bretagne. En conséquence, la France manque de structures d'envergure dans ce domaine et joue un rôle moins important qu'elle ne le devrait. Il est donc stratégique de développer et de soutenir les initiatives interdisciplinaires qui intègrent des approches expérimentales et des approches de modélisation et d'analyse de données en veillant à ce qu'elles se développent au sein d'une même équipe ou en collaboration très étroite entre équipes complémentaires.