Section 21 Organisation, expression, évolution des génomes. Bioinformatique et biologie des systèmes

I. Organisation, expression et stabilité des génomes

Les mécanismes fondamentaux contrôlant l'intégrité, l'organisation, l'expression des génomes et la création de la diversité génétique constituent autant de champs disciplinaires extrêmement dynamiques, compétitifs et essentiels dans la compréhension des propriétés du vivant. Ces dernières années ont vu des avancées spectaculaires dans la caractérisation fine de l'organisation chromosomique et chromatinienne à l'échelle du génome, et les rôles régulateurs variés que joue cette organisation pour contrôler de façon parfois dynamique, parfois métastable, l'activité du génome et la manière dont il détermine les propriétés du vivant. De façon générale, des ponts sont établis entre biologie de la chromatine et fonctions du génome étudiées traditionnellement : transcription, épissage, réplication, réparation.

Des avancées majeures ont été réalisées grâce à l'investissement de consortiums importants (ENCODE, modENCODE), focalisés sur l'étude du génome humain ou sur celui d'organismes modèles, dont la souris et la drosophile. Mais notre compréhension s'enrichit également des découvertes réalisées chez des organismes eucaryotes moins étudiés, ainsi que chez les procaryotes et les archées.

On assiste à une dissection de plus en plus précise et riche des éléments constituants le génome, qu'ils soient éléments régulateurs (enhancers, promoteurs...), transcrits (ARNs codants ou non codants...), ou structuraux (télomères, centromères...). Une emphase importante a été mise sur l'étude des phénomènes épigénétiques, terme dont l'acception fait débat, mais par lequel nous entendrons ici l'ensemble des événements touchant la chromatine : nature et position des nucléosomes, modifications des histones, modifications chimiques de l'ADN (méthylation, hydroxyméthylation, et leurs dérivés). L'existence d'un « code des histones » est désormais bien acceptée. Ce code s'enrichit perpétuellement de modifications chimiques nouvellement découvertes et par conséquent se complexifie. L'épigénétique est un champ d'investigation d'importance stratégique dans le domaine de la génétique, et la France figure parmi les leaders dans ce domaine.

Aujourd'hui, l'état des connaissances épigénétiques et épigénomiques n'en est qu'à ses prémices. L'analyse mécanistique et fonctionnelle de l'organisation chromatinienne, chromosomique et nucléaire des génomes a progressé très significativement grâce à l'accès facilité aux techniques de séquençage à très haut débit (RNA-seq, ChIP-seq, MethylC-Seq, HiC...) qui permettent d'augmenter considérablement la précision des résultats et leur contenu informatif. En particulier, des travaux fondateurs d'équipes françaises ont récemment déterminé les principes d'organisation tridimensionnelle du génome. Le séquençage de nouvelle génération couplé à la technique de Capture de Conformation Chromosomique (des approches de « 5C » ou « HiC ») permet l'analyse à l'échelle du génome de la conformation et la topologie des chromosomes et des domaines chromatiniens. La compréhension des mécanismes fondamentaux impliqués nécessite de plus d'intégrer ces données à l'échelle cellulaire en y adjoignant l'imagerie cellulaire à haute résolution qui permet d'analyser la diversité des comportements à l'échelle de la cellule individuelle évitant ainsi une vision moyennée d'une population de cellules (voir aussi section 3). De la même manière, un défi majeur dans le futur sera d'adapter les approches à l'échelle génomique sur une seule cellule (single cell HiC). L'intégration de l'ensemble de ces données représente une nouvelle frontière de ce domaine scientifique et ouvre des perspectives passionnantes de modélisation des processus biologiques et moléculaires.

L'organisation chromatinienne joue un rôle clé pour l'ensemble des « 3R » (réparation, recombinaison, réplication). De nombreuses études menées par des équipes françaises montrent, en effet, comment la réparation des lésions de l'ADN est influencée par la structure chromatinienne et l'architecture nucléaire. Enfin, les séquences répétées et éléments transposables se sont révélés être des composants majeurs de tous les génomes et jouer un rôle aussi bien structural que fonctionnel. Mis sous silence par des voies de régulation impliquant de petits ARN, notamment dans la lignée germinale, les éléments transposables peuvent occasionnellement échapper à cette répression et amorcer des cycles de mobilisation qui vont conduire à de fortes instabilités génétiques. Si ces transpositions peuvent être délétères, les données de séquençage obtenues ces dernières années ont également mis en lumière leur rôle positif comme source de plasticité génétique grâce aux motifs fonctionnels qu'ils apportent au site de leur insertion. Ils sont également source de variations épigénétiques au sein des génomes, leur insertion pouvant conduire à la mise en place de structures chromatiniennes capables de modifier l'expression de gènes voisins. L'impact sur l'expression d'un génome où comme chez l'Homme ils représentent près de 50 % des séquences, est certainement considérable et reste largement incomprise.

Les dysfonctionnements de la stabilité et la plasticité des génomes jouent un rôle important dans un grand nombre de maladies dont les cancers. En effet, de nombreuses données montrent que la transformation tumorale est associée à l'instabilité génomique. Stress réplicatif, déficit de réparation de l'ADN, recombinaison désordonnée, mobilisation de séquences transposables jouent tous des rôles importants dans l'étiologie des anomalies génétiques associées au cancer et sont observables dans les tissus pré-néoplasiques. Pour étudier en détail les mécanismes de la stabilité, de la plasticité génomique et de la surveillance du génome, les liens avec la clinique et les patients, mais aussi l'utilisation des systèmes modèles, sont indispensables.

Le développement et l'amélioration du NGS a modifié nos approches au plan quantitatif (celui de la vitesse de génération des données), mais également au plan qualitatif, en permettant la mise en œuvre d'approches expérimentales radicalement différentes de celles existantes jusque-là. L'application de ces approches a été fructueuse dans différents domaines, parmi lesquels celui concernant l'étude de l'expression des génomes. L'hypothèse selon laquelle l'environnement modifie la fonction du génome par le biais de l'épigénome est particulièrement suivie. Un autre axe retenant l'intérêt de la communauté est la question de l'héritabilité transgénérationnelle portée non pas par le génome mais par l'épigénome. Cette héritabilité ne fait aucun doute chez C. elegans, D. melanogaster et A. thaliana, et les arguments s'accumulent pour soutenir son existence chez la souris, suggérant qu'elle pourrait également exister chez l'humain.

La facilité de séquencer des génomes, dont des génomes humains, permet de mieux discerner les différences génétiques inter-individus et d'arriver à terme à établir un outil prédictif personnalisé. Le catalogage des transcrits a mis en évidence la diversité fonctionnelle des ARNs produits par le génome, et l'éventail de leurs rôles s'élargit constamment tant chez les eucaryotes que chez les procaryotes.

Il existe en France un nombre important d'équipes dynamiques et performantes étudiant ces différents aspects fondamentaux, et il est essentiel de soutenir les efforts dans ce domaine pour pouvoir maintenir cet avantage compétitif, assurer la vitalité du domaine et disposer d'un tissu de recherche qui permettra les retombées en terme de santé et d'applications qu'apportera une meilleure compréhension des liens entre génotype et phénotype.