Section 20 Biologie moléculaire et structurale, biochimie

II. Les ARN

L'étude des ARNs et de leurs fonctions a été modifiée de façon profonde par le développement et la démocratisation du séquençage de l'ADN à très haut débit et il est vraisemblable que cette (r)évolution se poursuivra par la combinaison d'approches à différentes échelles.

A. Les ARN régulateurs

Les ARN régulateurs ont pris une place centrale dans l'étude des ARN et de l'expression génique et il est vraisemblable qu'il reste plusieurs classes d'ARN régulateurs à découvrir en raison de la diversité de leurs voies de biogenèse. Il est donc important de développer de nouvelles stratégies expérimentales et bio-informatiques d'identification (RNomics) et d'élucider leur rôle biologique, leur cible primaire et les mécanismes d'action.

Longtemps focalisé sur l'étude des petits ARN, ce champ d'investigation donne de plus en plus de place aux longs ARN non-codants (lncRNA), linéaires ou circulaires. Les ARN régulateurs forment des réseaux complexes impliquant des régulateurs transcriptionnels. De plus, ils sont soumis à divers niveaux de régulation, aussi bien via de longs ARN non codants circulaires ou circRNA, que via leur dégradation, qui peut être modulée par des modifications post-transcriptionnelles. Il est donc primordial de considérer les systèmes de manière plus globale et intégrée en définissant les liens entre les régulateurs, le métabolisme cellulaire et les facteurs de signalisation.

Les ARN régulateurs ne se limitent pas aux seuls eucaryotes : ils jouent également un rôle important dans la virulence des bactéries pathogènes et se retrouvent chez certains virus ; ils commencent aussi à être identifiés chez les archaea où le niveau d'expression d'ARN antisens est relativement élevé. De nombreuses études des effets des ARN régulateurs cellulaires sur la réplication virale et vice-versa ont été entreprises et devront se poursuivre. En comparaison, l'étude du rôle des ARN dans les relations entre hôtes et bactéries pathogènes ou parasites n'en est qu'à ses débuts et pourrait déboucher sur de nouvelles stratégies de lutte contre ces infections.

Par ailleurs, de nombreux ARN sont multifonctionnels. Par exemple, des ARN non codants fonctionnels sont produits à partir des introns ou d'intermédiaires de dégradation des ARNm et il a été démontré récemment qu'un court ARN produit à partir d'un ARNm se fixe sur les ribosomes et module leur activité. Il a également été suggéré que des produits de dégradation d'ARNnc (ARNt) pourraient se lier au ribosome. À l'inverse, il devient de mieux en mieux établi que de nombreux longs ARN « non codants » codent en fait pour des peptides qui pourraient jouer des rôles clés, par exemple dans le développement embryonnaire. Jusqu'à présent les diverses activités des ARN multifonctionnels n'ont été étudiées que de façon individuelle et l'étude de l'influence mutuelle de ces multiples fonctions constitue un enjeu important.

B. ARN, épigénétique et organisation chromatinienne

Un nombre croissant d'études commence à mettre en évidence le rôle des ARN dans l'épigénétique et l'organisation spatiale de la chromatine en domaines fonctionnels dynamiques qui permettent de réguler à distance tout un ensemble de gènes. Il apparaît donc important d'intensifier les efforts pour identifier les ARN qui induisent des changements durables de l'expression génétique et de caractériser les facteurs et les mécanismes qui permettent cette « reprogrammation » génétique.

Actuellement, il est possible d'analyser la transcription non seulement dans une large population cellulaire, mais aussi sur un petit groupe de cellules, voire une cellule unique. La faisabilité d'une cartographie tridimensionnelle de l'expression génétique dans un tissu a ainsi été démontrée. Une cartographie spatio-temporelle des ARN codants et non-codants dans les cellules, les tissus, et les organes, chez l'homme et les organismes modèles, dans des conditions normales et pathologiques, ou encore lors du développement devient donc envisageable. Toutefois, ces projets nécessiteront des capacités de séquençage considérables et les moyens informatiques permettant de stocker, manipuler et analyser les données correspondantes. Parallèlement, les techniques de marquage des ARN in vivo nécessaires à leur imagerie, qui ont connu récemment des avancées considérables, devront encore être améliorées.

C. Maturation des ARN et complexes RNP impliqués

Le séquençage à haut débit a non seulement permis d'identifier de nouvelles classes d'ARN et d'analyser leur expression, mais aussi d'aborder la présence de nucléotides modifiés, la polyadénylation, l'épissage alternatif, la traduction, la stabilité et de manière générale le métabolisme des ARN. On peut envisager à terme de cataloguer les événements d'épissage alternatif, de recodage traductionnel, de modification post-transcriptionnelle, ou d'altération de la stabilité des ARN dans des conditions normales ou pathologiques, ou chez divers micro-organismes ou virus.

La plupart des fonctions biologiques impliquant l'ARN font intervenir des complexes ribonucléoprotéiques de taille importante (transcription, épissage, transport, traduction, stockage dans les granules de stress ou les P-bodies...). Si la cristallographie aux rayons X a bouleversé notre compréhension de la traduction, la cryo-EM a maintenant largement pris le relais, permettant d'obtenir des structures de complexes impossibles à purifier en quantité et homogénéité suffisantes pour l'obtention de cristaux. Des étapes « non-classiques » de la traduction deviennent ainsi progressivement accessibles à l'analyse structurale, de même que des sous-populations spécifiques de ribosomes (ribosomes spécialisés) notamment avec l'avènement de nouveaux algorithmes pour la classification des images couplés à des détecteurs extrêmement performants et permettant ainsi d'approcher des résolutions quasi atomiques. Ces études devraient permettre d'appréhender la traduction dans toute sa subtilité et sa variabilité, avec de possibles applications thérapeutiques. Il en est de même pour les complexes impliqués dans l'épissage, le transport, le stockage et la dégradation des ARN. Le nombre de structures à (très) haute résolution de complexes ARN-protéines restant relativement limité, il est crucial de poursuivre nos efforts dans ce domaine, si l'on souhaite comprendre les règles de reconnaissance mises en jeux et la dynamique des interactions.

D. Structure secondaire et tertiaire des ARN

L'analyse de la structure secondaire et tertiaire des ARN in vitro (et dans de rares cas dans des particules virales) a fait des progrès notables grâce au développement de la technique SHAPE alliée à l'analyse par électrophorèse capillaire. Elle permet une analyse relativement fine de la structure des ARN en solution ainsi que l'identification des sites de fixation des protéines. Cette technique qui nécessite une quantité importante de matériel continue à se développer par la combinaison de plusieurs sondes chimiques mais reste peu répandue en France.

Parallèlement, ces dernières années ont vu la publication de nouvelles méthodologies permettant de cartographier la structure secondaire des ARN au niveau d'un transcriptome entier, soit après extraction, soit directement dans la cellule. À ce stade, ces études permettent de répondre à des questions générales sur le degré de structuration des ARN, mais les données obtenues pour un ARN particulier restent fragmentaires, permettant de confirmer l'existence de structures déjà connues, mais rarement de proposer des structures sur la base de ces seules données. Il est vraisemblable que ces approches démontreront leur potentiel dans l'étude structurale des ARN viraux, dont la petite taille permettra l'obtention d'informations structurales à haute densité, aussi bien dans les cellules que dans les particules virales. Une comparaison et une évaluation systématique à large échelle des différentes stratégies disponibles seront donc nécessaires.

À côté de ces approches expérimentales, plusieurs approches de modélisation de la structure tertiaire des ARN ont vu le jour ces dernières années. Toutefois, elles pèchent par leur manque de précision en particulier pour de grosses molécules d'ARN. Des approches alternatives utilisant des algorithmes originaux semblent prometteuses pour la modélisation de grosses structures d'ARN. Les méthodes de simulation « gros-grain » utilisent une représentation des macromolécules où les résidus sont décrits de façon simplifiée (généralement par une sphère). Ce type de méthode fournit un outil intéressant pour la modélisation des gros complexes ARN-ARN et ARN-protéines. Des développements supplémentaires sont toutefois nécessaires pour adapter ces méthodes qui ont été utilisées essentiellement sur les protéines. L'utilisation de méthodes hybrides combinant une représentation « gros-grain » et une représentation atomique voire quantique de différentes parties de complexes macromoléculaires ribonucléoprotéiques est sans doute prometteuse pour des complexes ARN-protéines sujets à des changements de conformation et/ou porteurs d'activités catalytiques.

E. Nanotechnologies et ARN

La modularité de l'ARN et la connaissance de la structure tridimensionnelle de modules d'interaction ARN-ARN permettent de concevoir des nanostructures d'ARN s'assemblant spontanément. Le champ d'application de telles nanoparticules est très large et inclut les applications biomédicales, d'autant plus qu'il est possible d'envisager l'assemblage intracellulaire de ces nanostructures. Ce champ de recherche prometteur est peu représenté en France. Son développement requierera des avancées dans la modélisation de l'ARN, la visualisation de molécules uniques d'ARN et la chimie de l'ARN nécessaire pour fonctionnaliser les nanostructures d'ARN.