Informations

Pourquoi utilisons-nous de l'ARNc au lieu de l'ARN extrait initial dans la technique des puces à ADN ?

Pourquoi utilisons-nous de l'ARNc au lieu de l'ARN extrait initial dans la technique des puces à ADN ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je récapitule pour l'examen en transcriptomique et suis tombé sur une question sur les puces à ADN. Ainsi, notre flux de travail régulier consiste à

  1. extraire l'ARN des cellules
  2. générer de l'ADNc à partir de l'ARN initial en utilisant la transcription inverse
  3. transcrire l'ARNc à partir de l'ADNc
  4. marquer l'ARNc avec de la biotine
  5. fragment d'ARNc marqué à la biotine
  6. hybrider à une plaque, scanner et quantifier

La question est donc : puisque nous utilisons l'ARN pour les étapes de quantification ultérieures, pourquoi devrions-nous effectuer une transcription inverse + une transcription pour produire de l'ARNc alors que nous pourrions simplement utiliser l'ARN initial ?

L'ARNc est-il plus stable que l'ARN ? Ou nous fabriquons déjà de l'ARNc marqué en utilisant des nucléotides marqués ?


Après clarification via les commentaires de la question PO :

1) La procédure que vous décrivez est ne pas pour les expériences de puces à ARN standard, il olgionucléotide puce à ADN. Ce type de puce est spécial car il possède plusieurs sondes pour chaque gène afin de permettre la détection de caractéristiques spéciales (c'est-à-dire des mutations, un épissage alternatif,…).

2) La raison de la génération d'ADNc avec transcription inverse et biotinylation ultérieures n'est pas explicitement indiquée dans la source de l'OP, mais il existe certains avantages possibles :

  • Amplification du matériel : l'ADNc peut être facilement amplifié, ce qui faciliterait l'analyse d'échantillons à faible rendement en ARN, de gènes à faible niveau d'expression ou d'analyser le même échantillon sur plusieurs puces.

  • Sensibilité : les puces à oligonucléotides peuvent utiliser des sondes très courtes (10-25 bases), pour lesquelles la lecture de la fluorescence peut ne pas être suffisamment sensible. La biotinylation d'une base d'ARN donnée (par l'utilisation de NTP pré-biotinylés pendant la transcription inverse) peut donner plusieurs « marques » sur chaque fragment, qui peuvent être lues sans signaux couplés à la streptavidine. De plus, cela permettrait à la force du signal de changer en réponse à certains SNP/mutations.


par @WYSIWYG

je suppose que l'ADNc final après avoir effectué la RT-PCR (pas le premier brin) qui est double brin est transcrit pour former un ARNss qui peut ensuite être utilisé comme sonde. L'ADNsb fonctionnerait également, mais la synthèse d'ADNc suivie par PCR ne produirait pas d'ADNsb. Vous pouvez simplement utiliser le premier brin après RT mais la concentration serait moindre. Avec une bibliothèque d'ADNc, vous pouvez produire beaucoup d'ARN en utilisant IVT.


Réaction en chaîne par polymérase de transcription inverse

Réaction en chaîne par polymérase de transcription inverse (RT-PCR) est une technique de laboratoire combinant la transcription inverse de l'ARN en ADN (appelée dans ce contexte ADN complémentaire ou ADNc) et l'amplification de cibles ADN spécifiques par amplification en chaîne par polymérase (PCR). [1] Il est principalement utilisé pour mesurer la quantité d'un ARN spécifique. Ceci est réalisé en surveillant la réaction d'amplification en utilisant la fluorescence, une technique appelée PCR en temps réel ou PCR quantitative (qPCR). La RT-PCR et la qPCR combinées sont couramment utilisées pour l'analyse de l'expression génique et la quantification de l'ARN viral en recherche et en milieu clinique.

L'association étroite entre la RT-PCR et la qPCR a conduit à l'utilisation métonymique du terme qPCR pour désigner la RT-PCR. Une telle utilisation peut prêter à confusion, [2] car la RT-PCR peut être utilisée sans qPCR, par exemple pour permettre le clonage moléculaire, le séquençage ou la simple détection d'ARN. A l'inverse, la qPCR peut être utilisée sans RT-PCR, par exemple pour quantifier le nombre de copies d'un morceau d'ADN spécifique.


Bowtell, D.D. Options disponibles, du début à la fin, pour l'obtention de données d'expression par microarray. Nature Genet. 21, 25–32 (1999).

Singh-Gasson, S. et al. Fabrication sans masque de microréseaux d'oligonucléotides dirigés par la lumière à l'aide d'un réseau de micromiroirs numériques. Nature Biotechnol. 17, 974–978 (1999).

Lipshutz, R.J., Fodor, S.P., Gingeras, T.R. & Lockhart, D.J. Puces d'oligonucléotides synthétiques à haute densité. Nature Genet. 21, 20–24 (1999).

Hughes, T.R. et al. Profilage d'expression à l'aide de puces à ADN fabriquées par un synthétiseur d'oligonucléotides à jet d'encre. Nature Biotechnol. 19, 342–347 (2001).

Pollack, J.R. et al. Analyse à l'échelle du génome des modifications du nombre de copies d'ADN à l'aide de puces à ADNc. Nature Genet. 23, 41–46 (1999).

Albertson, D.G. et al. Cartographie quantitative de la structure de l'amplicon par puce CGH identifie le CYP24 comme un oncogène candidat. Nature Genet. 25, 144–146 (2000).

Snijders, A.M. et al. Assemblage de puces à ADN pour la mesure à l'échelle du génome du nombre de copies d'ADN. Nature Genet. 29, 263–264 (2001).

Pinkel, D. et al. Analyse à haute résolution de la variation du nombre de copies d'ADN à l'aide d'une hybridation génomique comparative avec des puces à ADN. Nature Genet. 20, 207–211 (1998).

Hayward, R.E. et al. Puces à ADN Shotgun et expression génique spécifique au stade dans Plasmodium falciparum paludisme. Mol. Microbiole. 35, 6–14 (2000).

El-Sayed, N.M., Hegde, P., Quackenbush, J., Melville, S.E. & Donelson, J.E. Le génome des trypanosomes africains. Int. J. Parasitol. 30, 329–345 (2000).

Lee, J.M., Williams, M.E., Tingey, S.V. & Rafalski, J.A. Profilage des puces à ADN des modifications de l'expression des gènes au cours du développement de l'embryon de maïs. Fonction. Intégr. Génomique 2, 13–27 (2002).

Osoegawa, K. et al. Une bibliothèque de chromosomes artificiels bactériens pour le séquençage du génome humain complet. Génome Res. 11, 483–496 (2001).

Halgren, R.G., Fielden, M.R., Fong, C.J. et amp Zacharewski, T.R. Évaluation de l'identité des clones et de la fidélité de séquence pour 1189 clones d'ADNc IMAGE. Acides nucléiques Res. 29, 582–588 (2001).

Knight, J. Quand les jetons sont tombés. La nature 410, 860–861 (2001).

Bowtell, D.D. & Sambrook, J.F. Puces à ADN : un manuel de clonage moléculaire (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2002).

Relogio, A., Schwager, C., Richter, A., Ansorge, W. & Valcarcel, J. Optimisation des puces à ADN à base d'oligonucléotides. Acides nucléiques Res. 30, e51 (2002).

Rouillard, J.M., Herbert, C.J. & Zuker, M. OligoArray : conception d'oligonucléotides à l'échelle du génome pour les puces à ADN. Bioinformatique 18, 486–487 (2002).

DeRisi, J.L., Iyer, V.R. & Brown, P.O. Exploration du contrôle métabolique et génétique de l'expression des gènes à l'échelle génomique. Science 278, 680–686 (1997).

Wei, Y. et al. Profilage d'expression génique à médiation par microarray haute densité de Escherichia coli. J. Bactériol. 183, 545–556 (2001).

Hegde, P. et al. Un guide concis pour l'analyse des puces à ADNc. Biotechnique 29, 548–556 (2000).

Schena, M. et al. Analyse parallèle du génome humain : suivi de l'expression par microarray de 1000 gènes. Proc. Natl Acad. Sci. Etats-Unis 93, 10614–10619 (1996).

Schena, M., Shalon, D., Davis, R.W. & Brown, P.O. Suivi quantitatif des modèles d'expression génique avec une puce à ADN complémentaire. Science 270, 467–470 (1995).

Bertucci, F. et al. Problèmes de sensibilité dans les mesures d'expression basées sur les puces à ADN et les performances des puces en nylon pour les petits échantillons. Hum. Mol. Genet. 8, 1715–1722 (1999).

Yue, H. et al. Une évaluation de la performance des puces à ADNc pour détecter les changements dans l'expression globale de l'ARNm. Acides nucléiques Res. 29, E41 (2001).

Wang, X., Ghosh, S. & Guo, S.W. Contrôle de qualité quantitatif dans le traitement d'images de microarrays et l'acquisition de données. Acides nucléiques Res 29, E75 (2001).

Lock, C. et al. L'analyse par puces à ADN des lésions de sclérose en plaques donne de nouvelles cibles validées dans l'encéphalomyélite auto-immune. Nature Med. 8, 500–508 (2002).

Alizadeh, A.A. et al. Types distincts de lymphome diffus à grandes cellules B identifiés par le profilage de l'expression génique. La nature 403, 503–511 (2000).

Bittner, M. et al. Classification moléculaire du mélanome malin cutané par profil d'expression génique. La nature 406, 536–540 (2000).

Dhanasekaran, S.M. et al. Délimitation des biomarqueurs pronostiques dans le cancer de la prostate. La nature 412, 822–826 (2001).

Golub, T.R. et al. Classification moléculaire du cancer : découverte de classe et prédiction de classe par le suivi de l'expression génique. Science 286, 531–537 (1999).

Hedenfalk, I. et al. Profils d'expression génique dans le cancer du sein héréditaire. N. Engl. J. Méd. 344, 539–548 (2001).

Shipp, M.A. et al. Prédiction diffuse de l'issue du lymphome à grandes cellules B par profilage de l'expression génique et apprentissage automatique supervisé. Nature Med. 8, 68–74 (2002).

Sorlie, T. et al. Les profils d'expression génique des carcinomes du sein distinguent les sous-classes de tumeurs ayant des implications cliniques. Proc. Natl Acad. Sci. Etats-Unis 98, 10869–10874 (2001).

van't Veer, L.J. et al. Le profilage de l'expression génique prédit l'issue clinique du cancer du sein. La nature 415, 530–536 (2002).

Volm, M., Koomagi, R., Mattern, J. & Efferth, T. Profil d'expression des gènes dans les carcinomes pulmonaires non à petites cellules de patients survivants à long terme. Clin. Cancer Rés. 8, 1843–1848 (2002).

Miki, R. et al. Délimiter les voies de développement et métaboliques in vivo par profilage d'expression en utilisant l'ensemble RIKEN de 18 816 puces d'ADNc de souris enrichies de pleine longueur. Proc. Natl Acad. Sci. Etats-Unis 98, 2199–2204 (2001).

Iyer, V.R. et al. Le programme transcriptionnel dans la réponse des fibroblastes humains au sérum. Science 283, 83–87 (1999).

Tiens, A.W. et al. Une nouvelle analyse d'immunoprécipitation et de matrice de chromatine (CIA) identifie un ADN néocentromère de liaison CENP-A de 460 kb. Génome Res. 11, 448–457 (2001).

Shannon, M.F. & Rao, S. Transcription. Des chips et des Chips. Science 296, 666–669 (2002).

Ahrendt, S.A. et al. Analyse rapide de la séquence p53 dans le cancer primitif du poumon à l'aide d'un réseau de sondes oligonucléotidiques. Proc. Natl Acad. Sci. Etats-Unis 96, 7382–7387 (1999).

Lindblad-Toh, K. et al. Analyse de la perte d'hétérozygotie des carcinomes pulmonaires à petites cellules à l'aide de puces à polymorphisme à nucléotide unique. Nature Biotechnol. 18, 1001–1005 (2000).

Lindblad-Toh, K. et al. Découverte et génotypage à grande échelle de polymorphismes mononucléotidiques chez la souris. Nature Genet. 24, 381–386 (2000).

Ziauddin, J. & Sabatini, D.M. Microarrays de cellules exprimant des ADNc définis. La nature 411, 107–110 (2001).

Kerr, M.K. & Churchill, G.A. Conception statistique et analyse des données de microarray d'expression génique. Genet Rés. 77, 123–128 (2001).

Dudley, A.M., Aach, J., Steffen, M.A. & Church, G.M. Mesure de l'expression absolue avec des puces à ADN avec un échantillon de référence calibré et une plage d'intensité de signal étendue. Proc. Natl Acad. Sci. Etats-Unis 99, 7554–7559 (2002).

Hill, A.A. et al. Évaluation des procédures de normalisation pour les données de puces à oligonucléotides basées sur des contrôles d'ARNc enrichis. Génome Biol. 2, recherche0055 (2001).

Yang, Y.H. et al. Normalisation des données de microarrays d'ADNc : une méthode composite robuste abordant la variation systématique à une ou plusieurs lames. Acides nucléiques Res. 30, e15 (2002).

Van Gelder, R.N. et al. ARN amplifié synthétisé à partir de quantités limitées d'ADNc hétérogène. Proc. Natl Acad. Sci. Etats-Unis 87, 1663–1667 (1990).

Karsten, S.L., Van Deerlin, V.M., Sabatti, C., Gill, L.H. & Geschwind, D.H. Une évaluation de l'amplification du signal tyramide et des tissus fixés et congelés archivés dans l'analyse de l'expression génique des microréseaux. Acides nucléiques Res. 30, E4 (2002).

Colantuoni, C., Henry, G., Zeger, S. & Pevsner, J. Normalisation moyenne locale des intensités de signal d'élément de microréseau sur une surface de réseau : contrôle de qualité et correction des artefacts spatialement systématiques. Biotechnique 32, 1316–1320 (2002).

Stoeckert, C.J., Causton, H.C. & Ball, C.A. Bases de données de puces à ADN : standards et ontologies. Nature Genet. 32, 469–473 (2002).

Saal, L.H. et al. Environnement logiciel BioArray : une plate-forme pour la gestion et l'analyse complètes des données de microarray. Génome Biol. 3, logiciel 0003.1-0003.6 (2002).

Fielden, M.R., Halgren, R.G., Dere, E. & Zacharewski, T.R. GP3 : programme de post-traitement GenePix pour l'analyse automatisée de données brutes de puces à ADN. Bioinformatique 18, 771–773 (2002).

Geschwind, D.H. Partage des données d'expression génique : un éventail d'options. Nat. Rév. Neurosci. 2, 435–438 (2001).

Kellam, P. Microarray gene expression database: progrès vers un référentiel international de données d'expression génique. Génome Biol. 2, rapports 4011 (2001).

Enfin des standards de puces à ADN. La nature 419, 323 (2002).

Accepter les puces à ADN. Nature Genet. 32, 333–334 (2002).

Gardiner-Garden, M. & Littlejohn, T.G. Une comparaison des bases de données de microarrays. Bref. Bio-informer. 2, 143–158 (2001).

Bilban, M., Buehler, L.K., Head, S., Desoye, G. & Quaranta, V. Normalizing DNA microarray data. Cour. Problèmes Mol. Biol. 4, 57–64 (2002).

Quackenbush, normalisation et transformation des données J. Microarray. Nature Genet. 32, 496–501 (2002).

Ripley, B.D. Les projet en calcul statistique. Connexions MSOR. Newsletter du réseau LTSN Maths, Stats & OR (Université de Birmingham, Edgbaston, Royaume-Uni) 1, 23–25 (2001).

Slonim, D. Des schémas aux voies : l'analyse des données d'expression génique arrive à maturité. Nature Genet. 32, 502–508 (2002).

Eisen, M.B., Spellman, P.T., Brown, P.O. & Botstein, D. Analyse de cluster et affichage des modèles d'expression à l'échelle du génome. Proc. Natl Acad. Sci. Etats-Unis 95, 14863–14868 (1998).

Brown, député et al. Analyse basée sur les connaissances des données d'expression génique des puces à ADN à l'aide de machines à vecteurs de support. Proc. Natl Acad. Sci. Etats-Unis 97, 262–267 (2000).

Pomeroy, S.L. et al. Prédiction de l'évolution des tumeurs embryonnaires du système nerveux central basée sur l'expression des gènes. La nature 415, 436–442 (2002).

Khan, J. et al. Classification et prédiction diagnostique des cancers à l'aide du profilage de l'expression génique et des réseaux de neurones artificiels. Nature Med. 7, 673–679 (2001).

Xu, Y. et al. Les réseaux de neurones artificiels et le filtrage génique font la distinction entre les profils d'expression génique globale de l'œsophage de Barrett et du cancer de l'œsophage. Cancer Rés. 62, 3493–3497 (2002).

Ramaswamy, S. et al. Diagnostic multiclasse du cancer à l'aide de signatures d'expression de gènes tumoraux. Proc. Natl Acad. Sci. Etats-Unis 98, 15149–15154 (2001).

Holmes, G. & Hall, M.A. Un environnement de développement pour la modélisation prédictive dans les aliments. Int. J. Microbiol alimentaire. 73, 351–362 (2002).

Le consortium d'ontologie génétique. Création de la ressource d'ontologie génétique : conception et mise en œuvre. Génome Res. 11, 1425–1433 (2001).

Ashburner, M. et al. Ontologie des gènes : outil d'unification de la biologie. Nature Genet. 25, 25–29 (2000).

Delozier, E.P. & Lingle, V.A. MEDLINE et MeSH : des défis pour les utilisateurs finaux. Méd. Réf. Serv. Q 11, 29–46 (1992).

Lowe, H.J. & Barnett, G.O. Comprendre et utiliser le vocabulaire des vedettes-matières médicales (MeSH) pour effectuer des recherches bibliographiques. Confiture. Méd. Assoc. 271, 1103–1108 (1994).


Résultats et discussion

Manipulation et traitement initial des échantillons de cellules leucémiques

Le matériel leucémique est généralement obtenu à partir de sang périphérique ou de moelle osseuse. Entre le prélèvement et l'évaluation en laboratoire, avec un traitement ultérieur (congélation, purification ou extraction d'ARN pour des analyses de microarray en aval), une durée variable peut exister, notamment dans le cadre d'études multicentriques. 40 Comme montré récemment, le sang ou la moelle osseuse prélevés dans des tubes stériles avec des anticoagulants appropriés doivent être traités dans les 24 heures. 41 Le matériel stocké à température ambiante pendant de plus longues périodes, en particulier s'il est envoyé dans des boîtes en polystyrène dans le cas d'études multicentriques, peut toujours fournir des données utiles s'il est utilisé dans de grandes séries de classification. Ces échantillons de patients et le temps jusqu'au traitement doivent être annotés. La chélation des cations divalents par un stockage prolongé dans l'acide éthylènediaminotétraacétique pourrait influencer négativement l'intégrité des lymphocytes. 42, 43 Cependant, il n'y a pas de données sur le rôle des différents anticoagulants dans les études d'expression génique. Par conséquent, aucun consensus sur l'utilisation d'un certain anticoagulant n'a été atteint. Plus important encore, le même anticoagulant doit être utilisé tout au long de l'étude.

Dans la plupart des études, la centrifugation par densité Ficoll est utilisée pour isoler la fraction de cellules mononucléées contenant les cellules leucémiques. Le principal avantage de la centrifugation par densité Ficoll est d'isoler les cellules mononucléées tandis que les granulocytes, les érythrocytes, les réticulocytes et les plaquettes sont éliminés. En particulier, l'exclusion des granulocytes est un avantage par rapport à toutes les autres méthodes, en ce qui concerne la « pureté » des profils génétiques et la qualité de l'ARN, car il est notoirement difficile d'obtenir un bon ARN à partir des granulocytes (U Lehmann, communication personnelle) . L'exclusion des réticulocytes réduit la contribution de l'ARNm de la globine au profil d'expression. Cependant, une réduction de l'ARNm de la globine peut également être obtenue en utilisant la lyse des érythrocytes. 41 Un autre avantage du Ficoll est qu'il peut être facilement utilisé sur du matériel décongelé pour éliminer les cellules mortes, ce qui permet d'obtenir une meilleure qualité d'ARN.

L'utilisation du système d'ARN sanguin PAXgene (PreAnalytiX GmbH, Hembrechtikon, Suisse) comme réactif de stabilisation offre un avantage par rapport à l'expédition d'échantillons non stabilisés par conservation directe de l'ARN. Cependant, pour les échantillons de moelle osseuse, il a été montré que le réactif PAXgene n'offrait qu'une protection insuffisante contre les altérations pré-analytiques pour un certain nombre de transcrits. 41 En outre, un inconvénient de cette approche est la contamination par, par exemple, de grandes quantités d'ARNm spécifiques de la globine et d'autres érythrocytes, ce qui influence considérablement l'ensemble du profil d'expression génique en raison de son abondance. 44 Bien que, par exemple, Affymetrix ait développé des protocoles de réduction de la globine, ceux-ci prennent beaucoup de temps et sont difficiles à mettre en œuvre dans des études cliniques à grande échelle. Cependant, les protocoles de réduction de la globine offrent un énorme avantage pour les tumeurs solides, où l'application de Ficoll ou d'autres méthodes de purification (par exemple à base d'anticorps par trieur de cellules magnétiques activées (MACS)) est difficile.

Si l'ARN n'est pas directement préparé (voir ci-dessous), les cellules peuvent ensuite être congelées, de préférence par étapes à une densité inférieure à 20 × 10 6 cellules/ml pour assurer une bonne récupération lors de la décongélation. D'après notre expérience, une décongélation rapide à 37°C produit les meilleurs résultats en termes de récupération de l'ARN total des cellules leucémiques. En effet, une décongélation rapide (jusqu'à ce qu'un petit amas reste dans l'ampoule, suivi d'une dilution rapide dans un milieu dépourvu de diméthylsulfoxyde) permet la meilleure récupération des cellules leucémiques.

Purifier ou ne pas purifier

Avant de procéder à l'extraction d'ARN, il est important d'examiner s'il faut purifier la population de cellules leucémiques. Parfois, les charges tumorales approchent les 100 % et la purification n'est évidemment pas nécessaire. Dans la plupart des cas, cependant, les charges tumorales varient entre 30 et 95 %. Cela dépend de la question à laquelle il faut répondre si la purification est une exigence absolue. Pour comprendre les voies de signalisation, l'analyse d'une population cellulaire pure est souvent nécessaire. Ainsi, si les charges tumorales sont inférieures à 90 % et si l'on souhaite faire des déclarations sur le profil d'expression génique des cellules tumorales avec une confiance statistique de 95 %, qui est un seuil standard dans la plupart des études, une purification 45 est nécessaire. Cependant, l'influence des procédures de purification sur l'expression des gènes n'a pas encore été étudiée de manière très approfondie dans des contextes expérimentaux. De plus, les caractéristiques moléculaires des cellules immunitaires non malignes présentes dans l'échantillon de tumeur ou de leucémie au moment du diagnostic peuvent fournir des informations importantes. 46 S'il existe un doute sur la spécificité des gènes détectés, par exemple une signature associée aux lymphocytes T dans la leucémie aiguë lymphoblastique (LAL) à précurseurs B, une alternative consiste à comparer les signatures d'expression génique des cellules non purifiées et purifiées dans un sous-ensemble d'échantillons. À des fins de classification, la purification n'est souvent pas obligatoire, mais permettrait certainement d'améliorer la qualité des données. Il faut se rendre compte que même dans les études de classification, la signature, c'est-à-dire la liste des gènes qui distinguent les différentes sous-catégories leucémiques, est sujette aux erreurs et des charges tumorales plus faibles conduisent à une plus grande proportion de gènes faussement identifiés, en particulier si le nombre d'échantillons par la classe est trop basse. Une bonne utilisation des outils biostatistiques et une validation adéquate sont importantes à cet égard. La charge tumorale minimale qui conduira toujours à une classification correcte dépend probablement de plusieurs variables, c'est-à-dire du sous-type leucémique en question et cette question devrait être explorée plus avant par une expérimentation future. Nous encourageons fortement de telles études.Pour l'instant, nous recommandons que, pour les études de classification, la charge tumorale des échantillons soit rapportée.

Dans la plupart des cas, la purification MACS basée sur des marqueurs exprimés sur les cellules tumorales, tels que CD34, CD19, (B-précurseur ALL) ou CD7 (T-ALL), est la technique la plus appropriée pour purifier les cellules leucémiques. Alternativement, la purification MACS via une sélection négative peut être effectuée avec un mélange d'anticorps qui peuvent épuiser toutes les cellules non leucémiques (par exemple, la leucémie myéloïde aiguë (LAM)). Il est parfois difficile d'atteindre une pureté suffisamment élevée (>90%) requise pour les analyses de matrice. 45 Comme la purification par sélection positive peut stimuler l'expression des récepteurs de surface cellulaire et altérer simultanément le profil d'expression génique, la procédure de purification doit être effectuée à froid pour réduire un tel effet.

Extraction d'ARN

L'extraction d'ARN est très importante, car les résultats des puces à ADN sont directement influencés par la qualité de l'ARN utilisé. La plupart des chercheurs utilisent actuellement deux techniques principales : TRIzol ® (Invitrogen Corp., Carlsbad, CA, USA) et RNeasy (Qiagen, Hilden, Allemagne) et parfois TRIzol suivi d'une purification sur colonne à partir du kit RNeasy. Certains chercheurs ont utilisé des méthodes d'extraction TRIzol adaptées, avec une qualité améliorée par rapport aux méthodes TRIzol originales. D'autres préfèrent RNeasy, car il est rapide, reproductible et facile à utiliser. Les résultats d'un cycle de qualité multicentrique au sein du projet Génomique/Protéomique du réseau de compétences allemand « Leucémies aiguës et chroniques » ont démontré que les deux méthodes fonctionnent pour extraire de l'ARN de haute qualité en quantités suffisantes (Figure 1). Cependant, comme les méthodes sont techniquement différentes, il est sage de n'utiliser qu'une seule méthode dans une série expérimentale. Ceci est illustré par une série d'échantillons T-ALL dont l'ARN a été extrait soit par RNeasy soit par TRIzol. En utilisant le regroupement hiérarchique, tous les échantillons de TRIzol se sont regroupés au lieu d'être regroupés avec les échantillons extraits par RNeasy des mêmes patients (voir Données supplémentaires). Cela démontre que la méthode d'extraction d'ARN utilisée peut avoir une influence significative sur le profil d'expression génique généré. Laquelle des nombreuses méthodes pour isoler l'ARN est la mieux adaptée pour les analyses de puces à ADN, en particulier sur un grand nombre d'études cliniques, justifie une étude future.

Résultats d'un cycle de qualité multicentrique dans le cadre du projet Génomique/Protéomique du Réseau allemand de compétences « Leucémies aiguës et chroniques ». Des cellules de moelle osseuse mononucléées AML primaires congelées (BM MNC) ont été envoyées à différents laboratoires. Extraction d'ARN à l'aide de TRIzol (une), RNeasy (b) ou TRIzol suivi d'une purification sur colonne du kit RNeasy (c) conduit à un ARN de haute qualité tel que mesuré par le Bioanalyzer Agilent 2100 (Agilent Technologies). L'ARN dégradé présente des pics supplémentaires à gauche du pic 18S et ne doit pas être pris en compte pour l'analyse ().

La quantité d'ARN extrait doit être quantifiée par spectrophotométrie. Le spectrophotomètre NanoDrop (NanoDrop Technologies, Wilmington, DE, USA) est devenu populaire, car il est capable de mesurer des acides nucléiques dans de très petits volumes, permettant une quantification précise sur de petites quantités de matière. Le rapport des spectres mesurés à 260 et 280 nm est très utile pour évaluer la pureté de l'ARN et souvent utilisé comme indicateur de la qualité de l'ARN. Cependant, il est important de considérer que le rapport d'absorption dépend du pH et de la force ionique et doit être mesuré dans des conditions identiques. 47 Le rapport ARN 260/280 devrait idéalement être de 2,0, mais tout ce qui est supérieur à 1,8 est également acceptable.

Pour le contrôle qualité (CQ), le Bioanalyseur Agilent 2100 s'est imposé comme un équipement de laboratoire important. Grâce à la technologie « Lab-on-a-chip », la qualité de l'ARN peut être estimée très précisément, encore une fois sur de petites quantités de matériel précieux. Des outils logiciels disponibles gratuitement tels que les systèmes Degradometer et RNA Integrity Number (RIN) produisent des mesures de qualité d'ARN indépendantes et objectives de l'utilisateur. 48, 49 Cependant, cet instrument ne doit pas être utilisé à des fins de quantification car une précision de quantification acceptable ne peut être obtenue que dans une petite plage de concentration.

Dans la plupart des études, les échantillons d'ARN de mauvaise qualité ne sont pas utilisés pour une analyse plus poussée des puces à ADN. Notre étude approfondie sur la qualité de l'ARN par rapport aux résultats des puces à ADN sur la plate-forme Affymetrix n'a pas montré de corrélation entre le rapport 260/280 et les résultats de la puce en termes de rapport 3′/5′ de glycéraldéhyde-3-phosphate déshydrogénase (GAPDH) ou de pourcentage de gènes. présent, en grande partie parce que les échantillons d'ARN pauvres n'ont pas été traités davantage et n'ont donc jamais donné de résultat GAPDH à partir de la puce (Figure 2). Le rapport GAPDH 3′/5′ est un paramètre de qualité couramment utilisé mesurant le signal dans les régions 3′ et 5′ de la GAPD L'ARNm, qui, sans dégradation de l'ARN, devrait idéalement être de 1,0. Un communément accepté GAPD le rapport est <3.0 (Figure 2). Une déclaration similaire doit être faite pour les rapports d'ARNr 28S:18S mesurés à l'aide du bioanalyseur Agilent et le nombre de spots bien mesurés sur les puces à taches. De notre point de vue, il est important de considérer à la fois les pics d'ARNr 28S et 18S et les signes de dégradation ou d'utiliser des métriques objectives telles que Degradometer ou RIN. D'autres études sont nécessaires pour traiter systématiquement la corrélation, par exemple, des numéros RIN et des résultats des puces à ADN. Cependant, les mesures objectives de la qualité de l'ARN doivent être signalées dans le cadre des normes MIAME. 35

Corrélation entre la qualité de l'ARN et le résultat des puces à ADN Affymetrix mesurée par 3′/5′ GAPD ratio et pourcentage de gènes présents. Les données de 421 puces Affymetrix différentes provenant de quatre centres différents ont été analysées pour la qualité de l'ARN mesurée par le rapport 260/280 et les résultats de la puce tels que mesurés par GAPD Rapport de signal de fluorescence 5′ et 3′. Les échantillons avec une faible qualité d'ARNc ne sont, en général, pas traités davantage par les chercheurs impliqués. Il existe cependant une faible corrélation entre le ratio 260/280 et le pourcentage de gènes présents, ainsi qu'une corrélation inverse attendue entre GAPD Ratios 3′/5′ et pourcentage de gènes présents.

Marquage ARN et amplification possible

Pour la plupart des systèmes de puces à ADN, des protocoles standard existent pour marquer l'ARN ou l'ADNc à hybrider sur la puce. La première méthode implique généralement une réaction d'ADNc pour produire une matrice appropriée qui peut être utilisée par les ARN polymérases (le plus souvent l'ARN polymérase T7) pour incorporer des nucléotides marqués. La plupart des puces tachetées utilisent les marqueurs Cy3 et Cy5, tandis qu'Affymetrix utilise des nucléotides biotinylés, qui sont ensuite colorés par la streptavidine conjuguée à la phycoérythrine après hybridation. Dans certaines applications, de l'ARN directement marqué est utilisé. Cela évite les artefacts pouvant résulter de l'amplification (généralement assez linéaire) par la polymérase T7. L'inconvénient est qu'au moins cinq à dix fois plus d'ARN d'entrée est nécessaire, ce qui peut signifier que de nombreux échantillons cliniques produisent un ARN insuffisant pour l'analyse des puces à ADN. De plus, le marquage direct peut provoquer des artefacts, que l'amplification soit appliquée ou non. Encore une fois, la même méthode d'étiquetage doit être utilisée tout au long de l'étude.

La plupart des fournisseurs ont maintenant des protocoles qui nécessitent 1 à 5 ??g d'ARN total comme matériel de départ. D'après notre expérience, en commençant par des montants bien inférieurs à 1 ??g pour les baies Affymetrix peut donner de bons résultats, mais cela est imprévisible. Des quantités égales de 1 à 2 ??g ne donnent pas toujours suffisamment d'ARNc pour l'hybridation sur une puce.

Lors de la réalisation d'études d'expression génique sur des échantillons leucémiques, dans la plupart des cas plus de 2 ??L'ARN g peut être isolé et les programmes d'amplification, qui sont également plus longs et plus coûteux, peuvent être facilement évités, en particulier lors de l'utilisation du système Affymetrix (n'oubliez pas que le protocole standard Affymetrix comprend déjà une étape d'amplification). De nombreuses puces tachetées nécessitent plus d'ARN d'entrée que les puces Affymetrix, par conséquent, l'amplification est plus souvent requise. Divers protocoles d'amplification utilisant une étape d'amplification supplémentaire ont été développés qui produisent suffisamment d'ARN pour l'hybridation. En utilisant, par exemple, des kits d'amplification disponibles dans le commerce basés sur le protocole d'amplification linéaire développé par Van Gelder et al., 50 profils d'expression génique à l'aide d'ARN amplifié ont pu être confirmés avec une grande précision lors de la réanalyse de l'expression de ces gènes à l'aide d'ARN non amplifié par amplification en chaîne par transcriptase inverse-polymérase (RT-PCR). 18 Si une amplification est appliquée, elle doit être effectuée dans tous les échantillons en utilisant le même protocole et la même chimie. Une validation RT-PCR quantitative à partir d'ARN non amplifié doit être effectuée pour tester le biais d'amplification.

Enfin, une recommandation générale doit être énoncée ici : comme en utilisant des puces à ADN, l'expression génique différentielle entre les échantillons et non principalement les valeurs d'expression absolues d'un échantillon individuel est mesurée, les échantillons au sein d'une étude doivent être traités de manière aussi identique que possible pour éviter toute variation technique de outrepasser la variation biologique de l'expression différentielle. Les variations techniques doivent être réduites au minimum et documentées en détail.

Aspects techniques de l'hybridation, du lavage et de la numérisation

A l'instar du marquage, l'hybridation est souvent réalisée selon des protocoles fournis par les fabricants des puces effectivement utilisées (Agilent, Affymetrix...). Étant donné que ces protocoles peuvent changer et qu'il n'existe donc pas de véritables protocoles standard, il est important de documenter le protocole utilisé. Pour les puces tachetées, une hybridation comparative de deux échantillons marqués avec des colorants fluorescents différents est souvent effectuée. Nous recommandons l'utilisation d'un standard d'ARN commun pour toutes les puces dans une étude, par exemple, l'Universal Human Reference RNA (Stratagene, Heidelberg, Allemagne), en particulier si un élargissement de la taille de l'échantillon est prévu. Pour les puces à ADN Affymetrix, des procédures établies existent également pour le lavage et la numérisation. Pour les matrices tachetées, le lavage peut être effectué manuellement ou à l'aide d'un système automatisé. Après la numérisation, il faut vérifier la matrice pour les rayures et les bulles et autres artefacts.

Extraction de données

Chaque fournisseur dispose de son propre logiciel pour traduire le signal de fluorescence en une valeur correspondant à l'expression du gène interrogé par la sonde. Dans les puces Affymetrix, plusieurs paramètres de qualité doivent être vérifiés : le rapport 3′/5′ mentionné ci-dessus pour les gènes de ménage tels que GAPD et ACTB, le bruit, le bruit de fond, le facteur d'échelle et le pourcentage de gènes ont été détectés comme présents. Ces paramètres indiquent non seulement à l'investigateur quelque chose sur l'échantillon en question, mais aussi s'il peut être comparé en toute sécurité à d'autres échantillons dans une série d'expériences donnée. Un facteur d'échelle ne doit pas différer de plus de trois fois entre les tableaux afin de les comparer. De plus, selon notre expérience, les échantillons leucémiques doivent avoir au moins 25 % de gènes présents sur les dernières puces Affymetrix HG-U133 Plus 2.0, ainsi que sur les puces U133A. Sur les baies U95A, les appels présents ont tendance à être plus élevés (35 à 50 %). Pour évaluer la qualité des puces tachetées, il est important de vérifier l'homogénéité de l'hybridation et d'assurer un fond d'hybridation uniformément bas. De plus, il faut soigneusement vérifier et optimiser l'alignement de la grille et définir des paramètres pour des points bien mesurés, qui peuvent être inclus dans les analyses ultérieures. Des exemples sont décrits dans des études récemment publiées. 8, 18, 50, 51 La procédure QC dépend de la plate-forme utilisée. Pour les matrices tachetées, il est difficile de proposer des directives strictes. Pour les puces Affymetrix, outre les aspects visuels, plusieurs paramètres peuvent être vérifiés, comme l'a récemment proposé le « Tumor Analysis Best Practices Working Group ». 34

Toutes les analyses de puces à ADN doivent inclure des répétitions techniques conduisant à une mesure de la reproductibilité technique afin que les chercheurs puissent déterminer si les mesures individuelles sont suffisamment reproductibles. Cependant, des réplicats de toute la série d'échantillons, tels qu'ils étaient effectués au début des analyses de microréseaux, ne sont généralement pas nécessaires en raison de la forte concordance des données obtenues par des chercheurs expérimentés. Au lieu d'augmenter le nombre de répétitions techniques, il faudrait augmenter le nombre d'échantillons biologiques dans, par exemple, deux groupes qui seront comparés. En incluant plusieurs échantillons biologiques, les influences des différences biologiques et des variations techniques sont prises en compte, bien qu'il ne soit pas clair dans quelle mesure la variation est due à la variation technique et dans quelle mesure à la variation biologique (voir la figure 3). Cependant, si l'on souhaite comparer le profil d'expression de, par exemple, un échantillon d'un patient atteint d'une maladie inconnue à un groupe de témoins normaux, des duplicatas techniques ou des triples de l'échantillon du patient doivent être réalisés, idéalement en commençant par le traitement du échantillon. À cet égard, l'utilisation de contrôles de pointe dans l'ARN (correspondant à des quantités connues d'ARN) peut également être utile, ainsi que des outils générés par l'External RNA Controls Consortium (ERCC), c'est-à-dire la fourniture d'ARN externe. 52

Exemples de répliques biologiques et techniques et leur influence sur l'expression différentielle par des analyses de microarray. Des expériences ont été réalisées en utilisant des puces à ADNc tachetées comme décrit récemment. 18 La corrélation des valeurs d'expression génique relative de deux expériences de microarray, respectivement, est montrée pour (une) deux réplicats biologiques (cellules mononucléées de moelle osseuse (BM MNC) de deux témoins sains) (b) deux réplicats biologiques d'une lignée cellulaire qui a été divisée, puis cultivée dans les mêmes conditions jusqu'à deux moments différents et ensuite traitée en parallèle et (c) deux réplicats techniques (l'ARN amplifié d'un échantillon a été divisé et les étapes suivantes ont été effectuées en parallèle). Les coefficients de corrélation R 2 sont affichés. Des coefficients de corrélation similaires ont été observés en utilisant le système Affymetrix. 57

En général, et en particulier pour les analyses de voies, les gènes d'intérêt doivent être validés à l'aide d'une technique alternative, par exemple, la RT-PCR quantitative.

Biostatistiques pour l'analyse des données

Divers progiciels existent pour aider les enquêteurs à exploiter l'énorme quantité d'informations générées par les expériences de microarray. Les techniques couramment utilisées sont l'analyse de signification statistique avec des tests paramétriques et non paramétriques (par ex. t-test, analyse de variance (ANOVA), analyse de signification des puces à ADN (SAM) 53, 54 ), avec correction pour tests multiples, une variété de méthodes de classification supplémentaires (par exemple analyse en composantes principales) et différents types d'analyse de cluster (par exemple clustering hiérarchique , K-moyenne). 55 Divers outils de visualisation peuvent aider à obtenir une meilleure vue d'ensemble des résultats de l'analyse, et la cartographie des gènes aux voies moléculaires et métaboliques aidera à identifier les résultats biologiquement pertinents. Il n'entre pas dans le cadre de cet article de discuter en détail de ces outils bioinformatiques (un aperçu est donné par Allison et al. 56). Nous avons répertorié plusieurs packages, à la fois commerciaux et disponibles gratuitement dans le tableau 1. Nous recommandons fortement aux chercheurs cliniques et biologiques de consulter un biostatisticien avant même d'effectuer l'expérience sur le réseau pour formuler des questions spécifiques de l'étude, définir les exigences et résoudre plusieurs problèmes de stratégies d'analyse des données. Il convient de noter que les mêmes données brutes de puces à ADN analysées par différentes méthodes bioinformatiques peuvent donner des résultats très différents, en particulier pour les gènes faiblement exprimés. Comme ces méthodes diffèrent dans les algorithmes statistiques utilisés pour analyser les données, ce n'est pas surprenant, mais c'est un aspect important à considérer. Il va également sans dire que la même méthode d'analyse doit être utilisée tout au long d'une étude pour comparer différents ensembles de données.

Les biostatistiques sont essentielles pour comprendre les résultats des expériences en réseau et doivent être utilisées de la manière la plus transparente possible, afin d'éviter d'induire en erreur les lecteurs qui ne sont pas experts dans ce domaine. Par exemple, une liste de gènes exprimés de manière différentielle qui constituent un profil de signature doit être accompagnée d'un taux de fausses découvertes (FDR) 58 ou d'un P-valeur corrigée pour plusieurs tests afin de donner une idée de l'importance réelle des résultats. Pour illustrer davantage cela, un profil de signature avec un FDR de, par exemple, 50% signifierait qu'environ la moitié des gènes de la signature sont sélectionnés par hasard, et il n'est pas possible de savoir sans études de validation indépendantes de quels gènes il s'agit. Dans certains cas, cela peut encore fournir des informations importantes, mais dans la plupart des cas, il s'agit d'un taux d'erreur très élevé et le FDR devrait être beaucoup plus faible (par exemple, dans la plage de 10 %). Concernant les gènes individuels, le lecteur se rendra compte que d'autres expériences sont nécessaires pour identifier les vrais positifs.

Toutes les informations pertinentes nécessaires à une bonne interprétation de l'expérience et de l'analyse bioinformatique doivent être incluses dans les publications. Les données de tableau téléchargées dans des bases de données publiques doivent être, dans la mesure du possible, des données brutes. Le téléchargement, par exemple, des estimations d'expression du logiciel d'exploitation Affymetrix GeneChip ® (GCOS) doit être accompagné de fichiers d'intensité cellulaire (CEL) pour permettre une analyse indépendante des données brutes. Comme indiqué ci-dessus, les données doivent être présentées conformément aux directives MIAME et inclure des informations sur le facteur d'échelle. De plus, la description de l'analyse bioinformatique doit documenter les progiciels et algorithmes utilisés, l'indication de la signification statistique comme P-valeurs ou FDR des listes de gènes et gestion des valeurs aberrantes et manquantes. Si possible, la robustesse des résultats doit être testée au moyen de tests d'amorçage ou de validation croisée Leave-one-out.


INTRODUCTION

Les ARN non codant pour les protéines (ARNnc) ne codent pas pour les protéines mais fonctionnent directement au niveau de l'ARN dans la cellule. Au cours des dernières années, l'importance de cette classe étonnamment diversifiée de molécules a été largement reconnue ( 1 - 5 ). Les ARNc ont été identifiés en nombre étonnamment élevé, avec des estimations actuelles - basées sur des approches bioinformatiques - de l'ordre de milliers par eucaryal et de centaines par génome bactérien (6 - 9). Ils jouent un rôle clé dans une variété de processus fondamentaux dans les trois domaines de la vie, c'est-à-dire Eukarya, Bacteria et Archaea. Leurs fonctions comprennent la réplication de l'ADN et la maintenance des chromosomes, la régulation de la transcription, le traitement de l'ARN (non seulement le clivage et la religation de l'ARN, mais aussi la modification et l'édition de l'ARN), la traduction et la stabilité des ARNm, et même la régulation de la stabilité et de la translocation des protéines (4, 5 , 10 – 13 ). Beaucoup d'entre eux ont été découverts fortuitement, suggérant qu'ils ne représentent que la partie émergée de l'iceberg. De nombreux ARNnc connus sont petits, c'est-à-dire généralement < 500 nt, et donc beaucoup plus courts que la majorité des ARNm. Cependant, les eucaryotes expriment également un certain nombre de grands ARNnc, par ex. ARN Xist ou Air, qui mesurent plusieurs 1000 nt de long (14 – 16). Les rôles hautement spécifiques des ARNnc reflètent dans la plupart des cas leur capacité à se lier sélectivement à un petit ensemble de protéines ainsi que leur potentiel à reconnaître spécifiquement des cibles d'ARN définies via des régions de complémentarité de séquence.

Ces dernières années, de nouvelles stratégies bioinformatiques et expérimentales ont été adoptées pour identifier un grand nombre de nouveaux candidats ARNnc dans divers organismes modèles de Escherichia coli à Homo sapiens ( 5 – 7 , 17 – 31 ). Ces résultats ont démontré que le nombre d'ARNnc dans les génomes d'organismes modèles est beaucoup plus élevé que prévu.

Dans ce qui suit, nous passerons en revue diverses stratégies expérimentales qui ont été utilisées pour identifier de nouveaux ARNnc dans les génomes d'organismes modèles. Pour ces approches, le terme « Experimental RNomics » a été inventé (3). Quatre méthodes différentes seront présentées et leurs avantages ainsi que leurs obstacles dans l'identification de nouvelles molécules d'ARNnc seront discutés : (i) le séquençage d'ARN (enzymatique ou chimique) comme méthode la plus traditionnelle pour révéler de nouvelles espèces d'ARNnc (ii) le parallèle clonage de nombreux ARNnc en générant des bibliothèques d'ADNc spécialisées (iii) l'utilisation de puces à ADN pour prédire les ARNnc exprimés dans des conditions expérimentales données (iv) « SELEX génomique » et son application potentielle pour sélectionner des candidats ARNnc à partir de l'espace de séquence représenté par le génome d'un organisme d'intérêt.

Alternativement aux méthodes biochimiques, des outils génétiques et bioinformatiques peuvent également être utilisés pour identifier les ARNnc dans des organismes modèles. En fait, certains des premiers ARNnc régulateurs codés par les chromosomes, par ex. MicF, DsrA et RprA de E. coli , ont été découverts au cours d'un criblage génétique (32 – 34). De même, la génétique a également découvert le membre fondateur, l'ARN lin-4, de la classe toujours croissante des miARN eucaryotes (35). En raison de contraintes d'espace, cependant, nous aimerions renvoyer le lecteur à (6, 36, 37) pour un examen plus détaillé des voies génétiques et bioinformatiques pour la découverte d'ARNnc.

Identification des ARNnc par séquençage chimique ou enzymatique

Au tout début de la recherche sur les ARNnc, par ex. Il y a environ 35 à 40 ans, des espèces d'ARNnc uniques (à l'époque ARN ribosomiques, ARNt ou ARN viraux) étaient sélectionnées par séparation par taille de l'ARN total sur des gels dénaturants, suivie de la visualisation et de l'excision de bandes spécifiques, représentant idéalement une seule espèce d'ARNnc. Ainsi, pour son identification, l'ARNnc d'intérêt doit être présent en grande quantité, par ex. visible sous la forme d'une bande distincte dans un gel de polyacrylamide coloré au bromure d'éthidium, exposé à la lumière ultraviolette (UV) (figure 1A).

Par la suite (et préalablement à leur identification par analyse de séquence), les ARNnc sont marqués soit à leur extrémité 5' soit à leur extrémité 3' : (i) pour le marquage des ARN à leur extrémité 5', le groupement mono- ou triphosphate habituellement l'extrémité 5' des ARNnc est retirée en premier. Ceci est obtenu par l'ajout de phosphatase alcaline intestinale de veau à une température élevée. L'inactivation de l'enzyme est réalisée par extraction répétée avec du phénol/chloroforme ou par purification sur gel (38). Le marquage de l'ARN est ensuite réalisé par l'ajout de polynucléotide kinase en présence de [γ-32 P]ATP (38). (ii) Pour le marquage à leur extrémité 3', les ARNnc peuvent être marqués par la procédure décrite par Bruce et Uhlenbeck en utilisant 5'-32 PpCp comme molécule donneuse en présence d'ARN ligase T4 (39). Par la suite, les ARNnc sont purifiés sur gel sur des gels de polyacrylamide dénaturants.

Les ARN peuvent également être marqués in vivo avant l'extraction d'un organisme. Dans certaines premières études, E. coli l'ARN total a été marqué métaboliquement à l'orthophosphate,

Après extraction d'une cellule ou d'un organisme, séparation de taille par PAGE et élution du gel, les ARNnc sont identifiés par analyse de séquence. Ceci est obtenu soit par empreinte ARN 2D, soit par séquençage enzymatique ou chimique des ARNnc.

Il existe plusieurs versions de techniques d'empreintes d'ARN 2D pour séquencer de petits ARN (ou oligonucléotides) ou préparer divers catalogues d'oligonucléotides digérés par la RNase. Les différences sont l'utilisation d'ARN marqués de manière uniforme ou terminale, la digestion partielle ou complète avec diverses RNases, l'électrophorèse sur bandelettes d'acétate de cellulose ou dans des gels d'acrylamide pour la première dimension, l'électrophorèse sur papier DEAE-cellulose, ou l'homochromatographie sur plaques DEAE-cellulose, ou Chromatographie sur couche mince en gradient sur des plaques de DEAE-cellulose (44 – 47).

Pour l'analyse des séquences enzymatiques, les ARNnc marqués (aux extrémités 5' ou 3') sont soumis à une digestion partielle avec des ribonucléases spécifiques des bases à des températures élevées (50-55°C) et en présence d'urée 7 M pour éviter l'interférence du secondaire /structure tertiaire de l'ARN avec des étapes d'hydrolyse enzymatique. Pour le clivage spécifique à une base, une pléthore de RNases (RNase T1, T2, U2, PHY1, PHY M, CL3, A ou M1) peuvent être utilisées qui clivent préférentiellement 3' en bases G, C, U ou A (48 - 50). Pour résoudre les fragments d'ARN obtenus par taille, une électrophorèse sur gel 1D est réalisée sur des gels de polyacrylamide dénaturants (voir ci-dessous).

Pour l'analyse de la séquence chimique des ARNnc, quatre réactions chimiques différentes spécifiques à une base génèrent un moyen de séquençage direct de l'ARN qui a été marqué de manière terminale avec 32 P (51). Après une modification spécifique partielle de chaque type de base d'ARN, une scission de brin catalysée par une amine génère des fragments marqués dont la longueur détermine les positions de chaque nucléotide dans une séquence. Le sulfate de diméthyle modifie la guanosine, le pyrocarbonate de diéthyle attaque principalement l'adénosine, l'hydrazine attaque l'uridine et la cytidine, mais le sel supprime la réaction avec l'uridine. Dans tous les cas, l'aniline induit une scission de brin ultérieure (51).

Suite à un séquençage enzymatique ou chimique, un fractionnement électrophorétique des fragments marqués est réalisé sur des gels de polyacrylamide dénaturants, suivi d'une autoradiographie, qui permet de déterminer la séquence d'ARN d'intérêt.

Les premières études pour identifier les molécules d'ARN par séquençage direct ont été réalisées sur les ARNt ainsi que sur les ARN ribosomiques (48, 52-54). Dans le cas de l'ARN ribosomique 16S, présentant une taille d'environ 1500 nt, des fragments plus petits ont d'abord été générés par clivage de la RNase T1 et ensuite analysés par des techniques d'empreintes de la RNase (54). Le séquençage direct d'ARN pour l'identification de nouvelles espèces d'ARN est loin d'être obsolète, comme l'ont montré des études plus récentes : par marquage et séquençage direct d'ARN, une nouvelle classe d'ARNnc, appelés petits ARN nucléolaires, impliqués dans la modification de l'ARNr (55) pourrait être identifié chez les eucaryotes. Dernièrement, cette technique a également été utilisée pour visualiser et ensuite séquencer des ARN abondants de bactéries gram-positives (56, 57).

Obstacles et avantages de la méthode

L'identification de nouvelles espèces d'ARNnc par séquençage d'ARN rencontre quatre obstacles principaux. Premièrement, pour l'identification, les ARNnc doivent être très abondants pour être visibles sous forme de bandes uniques dans les gels colorés au bromure d'éthidium afin de contourner ce problème, le marquage de l'ARN total, suivi d'une séparation par taille sur un système de gel (par ex. vice versa comme décrit ci-dessus), permet l'identification d'espèces d'ARNnc moins abondantes.

Deuxièmement, aucun autre ARNnc dans la même gamme de taille ne devrait être présent dans la population totale d'ARN, car cela entraverait l'isolement d'une seule espèce d'ARN et entraînerait ainsi des données de séquençage ambiguës. S'il s'avère qu'une bande ou un spot contient plusieurs espèces d'ARN, celles-ci peuvent être résolues par électrophorèse sur gel 2D, qui permet la séparation d'espèces d'ARN de tailles similaires ou identiques.

Troisièmement, le séquençage chimique ou enzymatique des ARNnc entraîne parfois des données de séquençage difficiles à interpréter. La raison étant que, pour le séquençage enzymatique, les RNases ne sont pas strictement spécifiques d'une base distincte mais possèdent une activité de clivage résiduelle pour d'autres bases de la même manière, le séquençage chimique n'entraîne pas toujours une modification et un clivage sans ambiguïté des nucléotides, obscurcissant ainsi la lecture des données de séquence obtenues. .

Enfin, en raison des méthodes de séquençage et de la capacité de résolution des gels de polyacrylamide, le séquençage est limité aux ARN d'une taille maximale de quelques centaines de nucléotides. Ainsi, les espèces d'ARNnc, qui dépassent cette plage de tailles, ne peuvent pas être analysées directement par cette méthode, mais doivent être clivées en morceaux plus petits (par exemple par digestion par la nucléase T1) avant une analyse plus approfondie.

L'avantage du séquençage direct d'ARN, par rapport au séquençage de clones d'ADNc générés à partir d'ARNnc (voir ci-dessous), est le fait que les ARNnc n'ont pas besoin d'être transcrits en sens inverse pour l'analyse. Ainsi, les structures secondaires/tertiaires de l'ARN qui pourraient entraver la transcription inverse en ADNc n'interfèrent pas avec l'identification de l'ARN en utilisant le séquençage direct de l'ARN.

Identification des ARNnc par des bibliothèques d'ADNc spécialisées

La deuxième méthode pour l'identification de nouvelles espèces d'ARNnc implique la génération de bibliothèques d'ADNc, par analogie aux bibliothèques d'étiquettes de séquences exprimées (bibliothèques EST) pour l'identification des ARNm (58, 59). La méthode originale de clonage d'ARNm est basée sur la transcription inverse des ARNm d'un organisme par une amorce oligo(dT) et la synthèse du second brin, résultant en une bibliothèque d'ADNc qui représente idéalement tous les transcrits codant pour les protéines d'un génome. Par rapport à ces bibliothèques EST conventionnelles, la principale différence entre les approches de bibliothèque d'ARNnc réside dans la source et le traitement de l'ARN cloné.

Étant donné que la plupart des ARNm ont une longueur supérieure à 500 nt mais que de nombreux ARNnc sont considérablement plus petits, les premiers ARN d'une taille comprise entre 20 et 500 nt sont isolés. Cette fraction est généralement épuisée dans les bibliothèques EST car elle ne sera pas présente dans l'ARNm poly(A) +. L'isolement des ARN de petite taille est obtenu par séparation de taille de l'ARN total (soit de l'organisme entier à différents stades de développement, soit d'un organe individuel) en dénaturant la PAGE (figure 1B).

Alternativement, en employant un anticorps contre une protéine de liaison à l'ARN d'intérêt, des groupes entiers d'ARNnc peuvent être isolés par immunoprécipitation. Ainsi, les ARN ne sont pas sélectionnés en fonction de leur taille mais plutôt en fonction de leur fonction puisqu'ils se lient à une protéine de liaison à l'ARN commune, par ex. une bibliothèque générée par immunoprécipitation avec un anticorps contre une petite protéine ARN nucléolaire commune aidera à identifier les ARNnc de la classe des snoARN (26).

Dans de nombreux cas, ces ARN sélectionnés par taille ou par anticorps manqueront de queues polyadénylées. En général, il existe trois méthodes différentes pour la transcription inverse des ARNnc en ADNc comme condition préalable au clonage et au séquençage (figure 1B).

Premièrement, pour générer de l'ADNc à partir de cette fraction d'ARNnc, l'ajout d'une queue oligo(C) ou oligo(A) à l'ARN est effectué en présence de poly(A) polymérase, qui utilise l'ATP, mais aussi, dans une moindre mesure, le CTP. -comme substrat ( 60 ). Par la suite, les ARN à queue sont transcrits en sens inverse en utilisant une amorce oligo(dG) ou oligo(dT), respectivement. Après la synthèse du deuxième brin en utilisant l'ADN polymérase I et des quantités limitées de RNase H et la ligature subséquente des lieurs d'ADN double brin, les ADNc double brin obtenus sont clonés dans un système de vecteur standard (par exemple pSPORT1/GibcoBRL), générant ainsi une bibliothèque d'ADNc [pour une description détaillée de la méthode, voir ( 61 )].

Comme deuxième approche après la queue C à l'extrémité 3' (voir ci-dessus), un lieur oligonucléotidique est ligaturé à l'extrémité 5' des ARNnc par l'ARN ligase T4. L'oligonucléotide peut être fabriqué à partir d'ARN ou presque entièrement à partir d'ADN [pour une description plus détaillée de la méthode, voir (62)]. Pour éviter la multimérisation des séquences de liaison, le 5'-oligonucléotide porte un groupe 5'-hydroxyle. Étant donné que l'ARN ligase T4 utilise l'ARN comme matrice, les 3 derniers nt à l'extrémité 3' de l'oligonucléotide doivent être des ribonucléotides pour augmenter l'efficacité de la ligature. Pour ajouter un linker aux ARN avec des extrémités 5' modifiées, comme une structure de coiffe ou un groupe triphosphate, l'ARN est d'abord traité avec de la pyrophosphatase acide de tabac (TAP) qui clive entre les groupes phosphate α et β, laissant ainsi 5' -monophosphates (62). Pour la RT-PCR des ARN, une amorce oligo(dC) ou d(T) est utilisée en combinaison avec une amorce 5' complémentaire de la séquence de liaison 5' ligaturée.

Dans une troisième méthode, des lieurs oligonucléotidiques d'ARN sont ligaturés séquentiellement à la fois aux extrémités 3' et 5' par l'ARN ligase T4. Pour éviter la multimérisation des séquences de liaison, l'oligonucléotide à l'extrémité 5' de l'ARN est dépourvu d'une extrémité 5' phosphorylée, tandis que l'oligonucléotide ligaturé à l'extrémité 3' de l'ARN contient une extrémité 3' bloquée. En règle générale, l'ensemble du pool d'ARN est soumis à un autre cycle d'extraction de gel après la première étape de ligature du lieur pour éliminer le lieur excessif qui formerait autrement des dimères avec le deuxième oligo adaptateur. Comme décrit ci-dessus, le 3 nt terminal du lieur 5'-oligonucléotidique et les trois premiers du lieur 3'-oligonucléotidique pourraient contenir des bases d'ARN pour augmenter l'efficacité de la ligature par l'ARN ligase T4. La RT-PCR de la fraction d'ARN ligaturée est réalisée par des amorces d'ADN complémentaires de l'oligonucléotide de liaison 5' ou 3' respectif [pour une description plus détaillée de la méthode, voir (61)].

Après la synthèse d'ADNc, des fragments d'ADNc sont clonés dans des systèmes de vecteurs standard et séquencés par séquençage cyclique. En fonction de la complexité attendue de la banque, jusqu'à 10 000 clones d'ADNc doivent être séquencés (par exemple dans le cas de grands génomes eucaryotes). Le séquençage est généralement suivi d'analyses bioinformatiques, par ex. cartographie du gène ncRNA à un certain locus sur le génome et identification de motifs de structure ou de séquence, qui pourraient contribuer à l'identification de la fonction de l'espèce ncRNA d'intérêt.

Dans un passé récent, de nombreuses études ont été réalisées pour identifier les ARNnc dans les génomes d'organismes modèles en construisant des bibliothèques d'ADNc spécialisées. La première étude a été initiée chez la souris Mus musculus , où, grâce à une bibliothèque d'ADNc dérivée d'ARN sélectionnés par taille (50-500 nt), 201 candidats pour les ARNnc ont été identifiés à partir de ∼ 5000 clones d'ADNc analysés, dont environ la moitié appartenant à la classe des snoARN (19). Cette étude a été suivie d'une approche similaire pour la plante Arabidopsis thaliana ( 20 ), la mouche des fruits, Drosophila melanogaster ( 23 ), les deux espèces d'archées Archaeoglobus fulgidus et Sulfolobus solfataricus ( 21 , 22 ) et les eubactéries E. coli ( 63 , 64 ) et Aquifex aeolicus ( 65 ).

Le clonage spécialisé de bibliothèques d'ADNc a également été appliqué pour identifier certaines sous-classes d'ARNnc, par ex. miARN, dans différents organismes modèles. Ici, les ARNnc avec une plage de tailles très étroite d'environ 18 à 25 nt, c'est-à-dire centrés autour des tailles connues des miARN, ont été sélectionnés par taille, clonés et séquencés (10, 66 - 72).

L'identification de petits ARNnc par génération de bibliothèques d'ADNc spécialisées est désormais largement répandue et comprend l'analyse des amibozoaires tels que la moisissure visqueuse Dictyostelium discoideum (62). Pour l'identification de classes spécifiques d'ARNnc (telles que les ARNnc), la méthode de génération de bibliothèque d'ADNc par immunoprécipitation avec une protéine de liaison à l'ARNc telle que la fibrillarine suivie du clonage des ARNnc a été utilisée avec succès pour les snoARN C/D et H/ACA (26, 73 ).

Obstacles et avantages de la méthode

La méthode ci-dessus pour le clonage d'ARNnc a ses inconvénients par le fait qu'il n'est pas toujours possible de transcrire à l'envers un ARNnc en ADNc en raison de sa structure ou de sa modification (par exemple, modifications de la base ou du squelette). Ainsi, une banque d'ADNc n'est pas susceptible de refléter tous les ARNnc dans une cellule, ni ne reflétera nécessairement - par le nombre de clones d'ADNc individuels - l'abondance de l'ARNnc respectif. La raison derrière cela est que les ARNnc moins structurés/modifiés sont plus facilement transcrits à l'envers que les autres et seront surreprésentés dans une bibliothèque d'ADNc de la même manière, les ARNnc plus petits seront plus abondants que les plus longs, car ils sont plus susceptibles d'être entièrement transcrits à l'envers. .

Pour les bibliothèques d'ADNc sélectionnées par taille, en général, il ne sera pas possible d'identifier tous les ARNnc d'un type de cellule ou d'un organisme, car le seuil par taille (par exemple 20-500 nt) interdira l'identification d'ARNnc plus longs (tels que les ARNnc comme Xist et Air RNA, qui présentent des tailles de l'ordre de plusieurs kb). De plus, de par la nature même d'une banque d'expression d'ADNc, seules les espèces d'ARNnc seront détectées, qui sont transcrites à partir d'un génome. Cela peut cependant dépendre d'un état de développement spécifique de l'organisme ou de l'expression dans un certain tissu. Ainsi, pour pouvoir cloner toutes les séquences d'ARN exprimées d'un organisme, idéalement, tous les stades de développement, dans tous les tissus dans toutes les conditions de croissance et de nutriments possibles devraient être analysés et l'ARN total extrait de ces différents états. Cela peut ne pas toujours être possible et, par conséquent, certaines espèces d'ARNnc, qui ne sont exprimées que dans certaines conditions, ne seront pas clonées.

En ce qui concerne les stratégies de clonage, en utilisant la méthode I pour la conversion des ARNnc en ADNc, par ex. la méthode de transcription inverse, de synthèse du deuxième brin et d'ajout de lieurs d'ADN (voir ci-dessus) n'aboutira pas à des clones d'ADNc complets, selon notre expérience, mais à des terminaisons 5' tronquées dépourvues d'environ 10 à 15 nt de la pleine longueur. longueur d'ARN.

Inversement, l'inconvénient des méthodes II et III impliquant un oligonucléotide de liaison (voir ci-dessus) est l'étape de ligature plutôt inefficace des lieurs à l'ARNnc potentiel d'intérêt et l'échec de la fixation du lieur aux extrémités modifiées. L'avantage de cette méthode est, cependant, que souvent des clones d'ADNc de pleine longueur peuvent être obtenus, par rapport à la méthode I.

En général, le clonage d'ADNc entraînera l'identification d'espèces d'ARNnc connues très abondantes, telles que les ARNt ou les petits ARN ribosomiques (par exemple, les ARNr 5S ou 5.8S). Pour contourner le séquençage répété de ces gènes d'ARNnc déjà connus, on peut essayer d'exciser ces espèces d'ARNnc du gel après PAGE. Cependant, cela pourrait entraîner la perte d'espèces d'ARNnc présentant des tailles identiques ou similaires à celles de ces espèces d'ARN connues. Alternativement, on peut repérer les ADNc sur des filtres (comme un dot blot) et hybrider des filtres avec des oligonucléotides radiomarqués dirigés contre les espèces d'ARNnc connues les plus abondantes. Par la suite, seuls les clones d'ADNc sont séquencés, qui ne montrent aucun signal d'hybridation sur les autoradiogrammes des filtres.

Analyse de puces à ADN

Les puces à ADN sont devenues la méthode préférée pour surveiller les niveaux de nombreux transcrits en parallèle et souvent au niveau du génome entier (figure 1C). Les puces à ADN, également appelées puces à ADN ou puces d'expression, sont des lames de verre (ou de silicium) sur la surface desquelles des sondes d'ADN ont été imprimées selon un agencement en forme de grille. À ce jour, les oligonucléotides d'ADN simple brin d'une longueur de 25 à 70 sont le type prédominant de sonde ADN sur les puces à ADN commerciales, bien que les produits PCR double brin puissent également servir de sondes.

Pour analyser le niveau entier des transcrits cellulaires, des échantillons sont préparés à partir de l'ARN total d'un organisme. Les échantillons utilisés pour l'hybridation microarray peuvent être l'ARN extrait, l'ADNc converti ou l'ARNc dans tous les cas, ces sondes seront généralement marquées avec des colorants fluorescents, tels que Cy3 ou Cy5. Pour plus de détails sur les différents protocoles de marquage actuellement utilisés, voir les références en (74) et les travaux cités ci-dessous. L'échantillon préparé est ensuite mélangé avec un tampon d'hybridation et appliqué sur la lame de verre afin qu'ils s'hybrident à un point sur le microarray.

La fluorescence des taches auxquelles l'échantillon s'est hybridé est lue par un scanner et les résultats sont affichés sous la forme d'un motif de couleur, par ex. des points rouges ou verts, l'intensité de la couleur reflétant la quantité de transcrits présents dans la cellule. Si deux échantillons marqués avec des colorants différents étaient hybridés en parallèle sur la même puce à ADN, des couleurs supplémentaires telles que le jaune ou l'orange indiqueraient les quantités relatives des transcrits individuels dans les deux pools d'ARN.

Les puces à ADN sont principalement utilisées pour le profilage de l'expression de l'ARNm, mais elles pourraient également être un moyen d'étudier l'expression de l'ARNnc ou même pour la découverte de l'ARNnc (Figure 2). Cependant, la principale mise en garde concernant leur utilisation avec les ARNnc était – et est toujours dans certains cas – la conception des puces à ADN disponibles dans le commerce. Étant donné qu'elles sont conçues pour le profilage d'ARNm, la plupart de ces puces portent des sondes uniquement pour les régions codantes, ainsi les transcrits des régions génomiques non codantes ne seront pas détectés. Néanmoins, ces dernières années ont vu une amélioration considérable de cette situation.

Chez les bactéries, la plupart des ARNnc fonctionnels sont codés dans des régions intergéniques (IGR). La première puce à ADN à inclure des IGR en plus des régions codantes a été introduite pour la bactérie modèle E. coli par ( 75 ). Leur puce à haute densité (matrice de tuilage) porte ∼300 000 sondes oligonucléotidiques 25mer spécifiques au brin pour toutes les régions d'ARNm, d'ARNt et d'ARNr à une résolution de 30 pb ainsi que pour tous les IGR de >40 pb avec une résolution de 6 pb.

Alors que cette étude initiale se concentrait principalement sur les problèmes techniques du profilage du niveau d'ARNm, Wassarman et al . (2001) ont ensuite utilisé ce type de puce à ADN pour analyser spécifiquement la sortie transcriptionnelle des IGR. Ils ont découvert que l'hybridation en réseau avec de l'ARN extrait de trois conditions de croissance différentes produisait des signaux pour au moins un tiers des ARNnc détectés par sondage parallèle sur des Northern blots.

Ces analyses globales de la E. coli transcriptome ont ensuite été étendus de (76). En incluant un ensemble beaucoup plus large de conditions de croissance, des transcrits supplémentaires d'IGR qui pourraient être de nouveaux candidats ARNnc ont été détectés. Notamment, la densité de sonde extraordinairement élevée ici a facilité la détection de fragments d'ARN 3'- ou 5'-UTR qui s'accumulent indépendamment après le traitement des transcrits d'ARNm.

Dans une troisième étude avec ce type de puce à ADN, les ARN cellulaires qui s'associent à E. coli Les protéines Hfq ont été analysées (77). Cette protéine bactérienne de type Sm, au cours des années précédentes, est devenue un acteur clé de la régulation par de petits ARNnc régulateurs (78) et était connue pour se lier à un certain nombre d'ARNnc bactériens (c'est-à-dire en plus des ARNm). Au moment de l'étude de Zhang et al . (2003), 46 ARNnc étaient connus dans E. coli , dont environ 30 % ont été détectés par des hybridations en réseau d'ARN co-immunoprécipité avec Hfq. Pour les bactéries autres que E. coli , les microarrys ont été appliqués pour soutenir la prédiction bioinformatique des ARNnc de Staphylococcus aureus (56). Contrairement à ce qui précède E. coli réseau de pavage d'oligonucléotides, sélectionné S. aureus Les IGR ont été amplifiés par PCR pour produire des sondes d'ADN double brin qui ont ensuite été déposées sur des lames de verre.

À l'instar des bactéries, les puces à ADN ont été de plus en plus utilisées pour confirmer les prédictions globales de certaines classes d'ARNnc eucaryotes ainsi que pour étudier leur profil d'expression dans différents tissus. Une de ces classes, les microARN 22 nt, est mûrie à partir de transcrits en épingle à cheveux pré-miARN de 60 à 110 nt qui dériveraient de produits pri-miARN plus longs. Microarrays avec des oligonucléotides 40 ou 60mer à détecter connu les microARN ou leurs précurseurs en épingle à cheveux ont été introduits récemment (79, 80). Barad et al . (80) ont évalué plusieurs aspects de la méthodologie afin de la standardiser et de définir les paramètres nécessaires pour obtenir une hybridation efficace et des résultats fiables, y compris l'analyse des mésappariements pour déterminer la spécificité des sondes de microARN. Il a été observé que l'intensité du signal est en corrélation avec l'emplacement de la séquence de microARN dans les sondes 60mères, montrant que l'emplacement dans la région 5' produit les signaux les plus élevés, tandis que l'emplacement final 3' entraîne des signaux médiocres. Ces résultats ont ensuite été utilisés pour développer une approche intégrative de la découverte de nouveaux microARN, dans laquelle des régions précurseurs potentielles de microARN ont été prédites dans le génome humain et 5300 de ces candidats ont été testés à haut débit sur les microarrays susmentionnés (81).

Plusieurs groupes ont récemment utilisé des puces à ADN pour étudier les ARNnc de la levure Saccharomyces cerevisiae . À la suite de travaux antérieurs avec des puces à ADN qui portent des sondes individuelles pour un ensemble représentatif de certains ARNnc, par ex. snoRNAs (82), le laboratoire Hughes a conçu une puce à ADN pour couvrir tous les ARNnc de levure connus et plusieurs prédits (83). Ici, chaque transcrit d'ARNnc est couvert par des sondes oligonucléotidiques à des intervalles de ∼5 nt, dont 100 nt de séquence flanquante aux extrémités 5' et 3'. Jusqu'à présent, cependant, ces puces ont principalement été utilisées pour surveiller la synthèse, le traitement et la modification d'ARNnc connus (84, 85).

De nouveaux ARNnc de levure ont été identifiés au moyen d'un microarray de génome complet contenant 6700 fragments PCR pour couvrir tous les cadres de lecture ouverts de levure, les petits ARN annotés et toutes les régions intergéniques (86, 87). Ici, Inada et Guthrie (87) ont cherché à identifier les partenaires de liaison à l'ARN de la protéine La de levure (Lhp1) à l'échelle mondiale. La est une protéine de liaison à l'ARN nucléaire ubiquitaire qui est conservée chez les eucaryotes. Outre la liaison des ARNm, il est connu de s'associer aux transcrits primaires de l'ARN polymérase III, y compris tous les ARNt et autres petits ARN. Pour identifier sélectivement les ARN de liaison La dans la levure, une protéine Lhp1 marquée par Myc a été immunoprécipitée avec ses ARN associés et une souche non marquée a été utilisée comme échantillon de référence dans les hybridations de puces à ADN ultérieures (figure 2). Les cibles La identifiées dans ce travail comprenaient 20 snoARN annotés. De plus, au moins trois nouveaux snoARN H/ACA qui n'étaient pas annotés comme tels auparavant ont été nouvellement découverts dans des régions intergéniques. Des signaux supplémentaires hautement enrichis provenant d'autres régions intergéniques suggèrent que ceux-ci représentent également de nouveaux transcrits non annotés qui peuvent être des ARNnc inconnus.

Des tableaux de mosaïque personnalisés ont également été appliqués pour rechercher systématiquement des ARNnc fonctionnels chez les eucaryotes supérieurs. Par exemple, une approche bioinformatique a été adoptée pour extraire 3478 séquences intergéniques et introniques qui sont conservées entre les génomes de l'homme, de la souris et du rat, et qui ont montré les caractéristiques des ARNnc selon un certain nombre d'autres critères (88). Ces informations ont ensuite été utilisées pour concevoir des matrices de mosaïque contenant des sondes pour cet ensemble candidat, et ces matrices ont été sondées avec de l'ARN isolé à partir de 16 tissus de souris de type sauvage. Par la suite, 55 candidats pour de nouveaux ARNnc hautement exprimés ont été testés sur des Northern blots, confirmant ainsi que huit d'entre eux étaient de petits ARN fortement exprimés de manière ubiquitaire chez la souris. Fait intéressant, seuls cinq de ces ARNnc ont également pu être détectés dans les tissus de rat, mais aucun dans les tissus humains ou les cellules en culture. L'expression conservée de ces cinq ARNnc chez la souris et le rat peut indiquer que ces molécules sont fonctionnelles dans ces deux organismes, mais pas chez l'homme.

Obstacles et avantages de la méthode

Les études susmentionnées ont fourni des indices précieux sur le potentiel de cette technique pour la découverte d'ARNnc ainsi que sur les problèmes associés aux puces à ADN lors du dosage d'ARNnc petits et hautement structurés. Analyser les signaux d'hybridation de E. coli matrices de pavage, il a été noté que souvent, seul un sous-ensemble des sondes oligonucléotidiques dans la plage d'une région de transcription d'ARNnc donnée produisait un pic de signal, même si le même locus d'ARNs donnait une bande forte et distincte sur les Northern blots [cf. Figures 2 et 3 dans (18)]. Tjaden et al . (76) ont occasionnellement observé des transcrits sur le brin opposé à un ARNnc validé expérimentalement, ce qui peut expliquer soit des transcrits antisens d'ARNnc inconnus, soit simplement du bruit expérimental.

Bien que jusqu'à présent les techniques de détection fiable des microarrays de petits ARN bactériens, qui sont généralement très structurés, n'aient pas été évaluées de manière approfondie, la préparation des échantillons semblerait un problème majeur. À ce jour, la plupart des approches de microarray impliquent un marquage fluorescent de l'ARN à utiliser comme échantillon. Fréquemment, l'ARN est converti en ADNc en présence de nucléotides modifiés qui portent des colorants fluorescents. La plupart des ARNnc bactériens se regroupent dans une plage de tailles de 100 à 150 nt (8, 9), et donc la transcription inverse peut ne pas être efficace et pourrait encore être entravée par une structure secondaire serrée.

Qu'il s'agisse d'approches d'étiquetage direct, par ex. le marquage chimique de l'ARN fragmenté comme alternativement utilisé dans (18), résoudrait complètement ces problèmes est actuellement inconnu. Cependant, Zhang et al . (2003) ont considérablement amélioré la sensibilité de détection en hybridant directement l'ARN à des puces d'oligonucléotides sans marquage ni synthèse d'ADNc (figure 2). Au lieu de cela, l'hybridation a été testée en utilisant un anticorps qui voit les hybrides ARN:ADN. La sensibilité très améliorée de cette méthode est démontrée par la détection de l'ARN OxyS induit par le stress oxydatif, qui est présent à de très faibles concentrations dans les conditions de croissance utilisées dans cette étude.

Par conséquent, les puces à ADN ont un grand potentiel non seulement pour détecter de nombreux ARN en parallèle, mais également pour pointer vers des transcrits présents à de faibles niveaux. À titre de mise en garde, le fait que la grande majorité des candidats ARNnc de souris suggérés par l'analyse des puces à ADN aient échoué dans l'analyse nordique en aval (88) souligne clairement la nécessité de valider les résultats de l'hybridation des puces à ADN par des méthodes indépendantes.

Ces auteurs soulignent également que l'hybridation de l'ARN total marqué de manière covalente telle qu'elle est appliquée dans leur étude, par opposition à l'ARN transcrit en inverse dérivé d'ARN poly-adénylé, serait importante dans les analyses de mosaïques, car toute étape d'amplification ou d'enrichissement est susceptible de fausser la représentation des grandes régions non codantes des génomes eucaryotes et peut donc rendre difficile la distinction de ces signaux du «bruit transcriptionnel» global. L'application de critères stricts lors de l'utilisation de puces à ADN pour la découverte d'ARNnc semble être impérative, car de plus en plus de données provenant de puces à ADN de génome entier deviennent disponibles (89 - 91) et ces données serviront de plus en plus d'entrée pour les prédictions bioinformatiques d'ARNnc par d'autres [par ex. ( 7 )].

SELEX génomique

De nombreux ARNnc forment des particules ribonucléoprotéiques (RNP) à différents moments de leur cycle de vie. De telles protéines de liaison à l'ARN peuvent aider un ARNnc à se replier dans sa conformation active, le protéger des nucléases avant d'exercer sa fonction ou favoriser son annelage avec des ARN cibles jusqu'à guider une protéine vers sa cible appropriée. D'autres ARNnc interagissent avec des protéines pour réguler directement leur activité.

Les techniques discutées jusqu'à présent permettent d'identifier les ARNnc à partir du pool d'ARN cellulaires exprimés après co-purification avec des protéines, c'est-à-dire par clonage, séquençage direct ou analyse par microarray. Étant donné que de nombreuses protéines de ce type lient leurs ligands d'ARN dans une gamme nanomolaire, il devrait également être possible de sélectionner des ligands d'ARN à partir du pool d'ARNnc qu'un organisme peut éventuellement exprimer même sans isoler leur in vivo transcriptions.

Cette approche, appelée SELEX génomique ( 92 ), est basée sur la in vitro génération d'espèces d'ARN qui sont dérivées d'une bibliothèque de l'ADN génomique entier d'un organisme (figure 1D). Le pool d'ARN généré subira des cycles successifs d'association avec une protéine de liaison à l'ARN donnée, une partition et une réamplification. En conséquence, les séquences d'ARN qui sont strictement liées par le partenaire protéique seront enrichies. Une fois que la séquence des ARN liés est déterminée, ces informations peuvent être utilisées pour rechercher des correspondances dans le génome, et ainsi les régions génomiques prédites pourraient ensuite être testées pour l'expression d'ARNnc inconnus. Genomic SELEX a été appliqué avec succès pour sélectionner des partenaires de liaison d'ARNm de protéines [par ex. (93, 94)], mais à notre connaissance, les études axées sur les ARNnc n'ont encore été publiées pour aucun organisme.

Actuellement, le laboratoire Schroeder a adopté cette approche pour identifier de nouveaux ARN liant Hfq à partir de E. coli (C. Lorenz et R. Schroeder, communication personnelle). Une bibliothèque représentative de la E. coli Le génome a été construit à partir de fragments d'ADN génomique aléatoires de 50 à 500 pb auxquels des lieurs définis, l'un d'entre eux contenant un promoteur d'ARN polymérase T7, ont été attachés au cours de l'étape de génération de bibliothèque initiale (92). Ces fragments étaient in vitro transcrit avec l'ARN polymérase T7, incubé avec Hfq et sélectionné pour la liaison de Hfq sur des filtres. En suivant la voie SELEX standard (95), l'ARN retenu a été converti en ADNc et soumis à (huit) cycles de réamplification et de sélection supplémentaires, qui ont finalement abouti à un pool d'ARN qui se sont liés à Hfq avec K valeurs de 5 à 50 nM. Par la suite, l'interaction spécifique Hfq des ARN ainsi enrichis a été déterminée in vivo en utilisant un tamis à trois hybrides de levure (96). Les résultats préliminaires suggèrent que ces expériences ont identifié un certain nombre de nouveaux ARN de liaison à Hfq, y compris des ARN antisens et des ARNnc candidats de régions intergéniques.

Obstacles et avantages de la méthode

Genomic SELEX aurait clairement sa force pour trouver des ARNnc qui sont négligés par des méthodes qui nécessitent qu'un gène d'ARNnc soit exprimé à un certain niveau. Avec leur petite taille de génome, les procaryotes devraient être particulièrement sensibles à ce type d'approche. Étant donné que dans les bactéries, les ARNnc fonctionnels sont principalement codés par des régions intergéniques, le pool original de fragments d'ADN pourrait être chargé en amplifiant spécifiquement cette partie du génome, qui, chez les bactéries, constitue généralement <10 % de l'ensemble du génome. Comme autre avantage de SELEX génomique, l'association étroite d'un ARNnc avec une protéine donnée qui est une condition préalable à sa sélection réussie pourrait également indiquer un rôle biologique de cet ARNnc, par ex. sa fonction d'antagoniste ou de cofacteur de l'activité de la protéine.

À l'heure actuelle, très peu de protéines générales de liaison à l'ARN sont connues qui forment spécifiquement des complexes avec des ARNnc. Deux des protéines discutées ci-dessus, Hfq et La (Lhp1p), s'associent également aux ARNm [références dans (78, 87)]. Ainsi, à l'instar du clonage d'ADNc et de l'analyse de puces à ADN, une approche SELEX génomique avec de telles protéines générales de liaison à l'ARN devrait produire de nombreux candidats ARN supplémentaires que l'on ne considérerait pas facilement comme des ARNnc. De plus, cette méthode indique seulement qu'un certain locus génomique pourrait avoir une fonction lorsqu'il est transcrit en ARN. Cependant, la condition exacte dans laquelle un tel ARN est exprimé - le cas échéant - devra encore être déterminée.

Un avantage majeur de la méthode SELEX génomique, par rapport à la stratégie de clonage d'ADNc (voir ci-dessus), est cependant que cette dernière nécessite l'isolement des ARNnc d'un organisme ou d'une cellule dans toutes les conditions de développement et de croissance possibles, ce qui peut ne pas être toujours faisable. . En revanche, SELEX génomique génère des espèces d'ARN à partir de toutes les régions d'un génome et ne dépend donc pas de l'isolement des ARN de tous ces différents états.

Approches RNomiques fonctionnelles : techniques suite à l'identification d'ARN

L'identification des ARNnc ne peut être considérée que comme une première étape vers l'élucidation de leurs fonctions. Le terme « candidat » doit être utilisé comme suffixe de l'ARNnc, tant que la fonction d'un ARNnc n'a pas été élucidée. Ce n'est qu'alors que l'espèce d'ARN doit être désignée comme un véritable ARNnc.

Pour obtenir des indications sur la fonction d'un candidat ARNnc, plusieurs approches peuvent être effectuées :

Étant donné que la plupart des ARNnc fonctionnels font partie d'une particule de ribonucléoprotéine (RNP), les composants protéiques des ARNnc peuvent être recherchés. Ceci est réalisé, par exemple, en utilisant l'ARN comme « appât » pour pêcher ces protéines de liaison à l'ARN dans des extraits cellulaires. Les ARN peuvent être synthétisés avec une «étiquette d'affinité» telle que la biotine par l'ARN polymérase T7 in vitro transcription en présence de biotine-UTP. Les ARN biotinylés sont ensuite couplés à une colonne de streptavidine. Alternativement, une séquence d'ARN se liant à une protéine connue peut être clonée en 5'- ou 3'- sur le gène d'ARNnc. En attachant la protéine de liaison à l'ARN connue à un support solide, le ncRNP peut être isolé en utilisant l'étiquette d'ARN connue comme appât (97). L'élucidation des composants protéiques d'une RNP peut suggérer ses fonctions, car les protéines pourraient présenter des domaines avec une activité catalytique connue. Pour in vivo analyse, le système de levure à deux hybrides a été étendu à un système à trois hybrides, où l'ARNnc est utilisé comme appât in vivo de pêcher des protéines qui s'y lient (98).

De nombreux ARNnc trouvés jusqu'à présent présentent des cibles d'ARN spécifiques, qu'ils reconnaissent par un mécanisme antisens, par ex. Appariement de bases Watson-Crick ( 99 ). Les ARN cibles comprennent les ARNm ou d'autres ARNnc tels que les ARN ribosomiques, les ARNsn ou les ARNt. Pour élucider les cibles d'ARNnc, des méthodes bioinformatiques ou expérimentales peuvent être utilisées. Pour les méthodes bioinformatiques, une recherche de complémentarité peut être effectuée. Cela a été réalisé avec succès, par exemple, dans le cas des cibles miARN (100, 101). Les méthodes expérimentales pourraient inclure qu'en pêchant l'ARNnc d'intérêt à travers une protéine de liaison à l'ARN (voir ci-dessus), l'ARN cible, complémentaire de l'ARNnc, pourrait également être co-isolé. Cela peut nécessiter une réticulation avant l'isolement de l'hétéroduplex d'ARN, en fonction de la stabilité de l'interaction ARN-ARN. Alternativement, par expression/surexpression d'un ARNnc d'intérêt et analyse ultérieure des microréseaux, des cibles d'ARNm potentielles peuvent être identifiées, si les ARNnc influencent l'abondance de sa ou ses cibles d'ARNm respectives dans la cellule (102).

Analyse des profils d'expression à partir d'un ARNnc d'intérêt : par exemple, la localisation cellulaire/subcellulaire de la particule d'ARN/RNP pourrait apporter un éclairage supplémentaire sur sa fonction, par ex. la localisation dans le nucléole, le noyau ou le cytoplasme pourrait suggérer une implication des ARNnc dans les fonctions exercées dans ces compartiments cellulaires. A cet effet, fluorescent in situ des techniques d'hybridation peuvent être utilisées pour localiser l'ARN d'intérêt (103). En plus de la localisation sous-cellulaire des ARNnc, l'expression tissu-spécifique ou développementale des ARNnc peut être analysée par Northern blot, en utilisant l'ARN total de différents tissus ou états de développement. Ainsi, si un ARNnc n'est exprimé que dans le cerveau, à un certain stade de développement, par exemple, la fonction de l'ARNnc peut être recherchée dans cette fenêtre d'expression temporelle et spatiale de l'organisme respectif.

En fin de compte, pour répondre à la fonction des ARNnc, leurs gènes doivent être éliminés dans les génomes des organismes respectifs. Dans d'autres cas, la surexpression de gènes d'ARNnc a été utile pour obtenir un phénotype plus important [voir la discussion sur les approches plasmidiques multicopies dans (36)].

Pour certaines bactéries modèles telles que E. coli , les délétions de gènes sont généralement accomplies en quelques jours (104, 105).Pour la plupart des autres organismes, seule la technologie traditionnelle de knock-out, longue et fastidieuse, est disponible à cet effet. Très récemment, les stratégies de knock-down plus élégantes par interférence ARN, jusqu'à présent appliquées uniquement aux ARNm codant pour des protéines, se sont révélées - dans certains cas - également adaptées à l'épuisement rapide des ARNnc ( 106 , 107 ), cependant, le mécanisme par quel ARNi cible les ARNnc est complètement inconnu. En outre, une étude très élégante a également démontré très récemment le potentiel des miARN antisens chimiquement modifiés (appelés «antagomirs») pour le knock-down de certaines espèces de miARN (108).


Cils, partie B

Lis Jakobsen , . Jens S. Andersen , dans Methods in Enzymology , 2013

2.2 Marquage métabolique

Pour le marquage des isotopes stables par les acides aminés en culture cellulaire (SILAC) (Ong et al., 2002), cultiver des cellules dans un milieu de culture personnalisé RPMI sans arginine ni lysine supplémenté avec 10 % de sérum bovin fœtal dialysé, 100 U de pénicilline/ml, 100 g streptomycine/ml, et 2 mM l -glutamine en incubateur humidifié à 37°C, 5% CO2. Compléter en outre le milieu avec de la l -lysine 1 H normale (Lys0) et de la l -arginine 12 C6, 14 N4 (Arg0) ou acides aminés « moyens » marqués par un isotope stable l -lysine 2 H4 (Lys4) et l-arginine 13 C6, 14 N4 (Arg6) pour des expériences basées sur deux populations cellulaires. Culture des cellules pour au moins six divisions cellulaires pour incorporer pleinement les acides aminés SILAC. Le milieu peut également être complété par de la l-lysine 13 C « lourde » marquée par un isotope stable6, 15 N2 (Lys8) et l-arginine 13 C6, 15 N4 (Arg10) pour une expérience basée sur trois populations cellulaires telles que l'expérience double PCP-SILAC (Fig. 18.2). Pour réduire la quantité d'acides aminés marqués par des isotopes coûteux, l'arginine peut être omise ou ajoutée à 1/3 de la concentration normale dans le milieu RPMI. Si l'arginine est omise, digérer les protéines en peptides en utilisant uniquement l'endoprotéase Lys-C et non la trypsine.

Graphique 18.2 . Isolement des centrosomes et identification des protéines centrosomales par PCP-SILAC. (A) Aperçu schématique des protocoles d'isolement des centrosomes et de préparation d'échantillons pour la protéomique basée sur la spectrométrie de masse. Les centrosomes sont détachés du réseau du cytosquelette, des noyaux et des filaments intermédiaires par traitement de la cellule avec du nocodazole et de la cytochalasine-D et par lyse cellulaire dans un tampon de faible force ionique. La chromatine est éliminée par agrégation et centrifugation. Les centrosomes sont sédimentés sur un coussin de saccharose et enrichis par centrifugation en gradient de saccharose. Les protéines de chacune des fractions collectées sont digérées avec de la trypsine et les peptides résultants sont analysés par LC-MS. (B) Profil de corrélation protéique (PCP) des protéines centrosomiques. Les profils d'abondance des protéines sont obtenus à partir des données LC-MS en intégrant le signal d'intensité des ions peptidiques pour chaque protéine dans chaque fraction. Le tableau le plus à gauche affiche le profil d'abondance des protéines marqueurs centrosomiques sélectionnées et le tableau de droite montre les valeurs relatives après normalisation. Le graphique révèle des fractions contenant des centrosomes et peut être utilisé pour différencier les véritables protéines centrosomiques des protéines copurifiantes non spécifiques en comparant les profils de toutes les protéines avec les profils des protéines centrosomiques connues. (A, C) PCP de protéines centrosomiques de cellules marquées SILAC (PCP-SILAC). Les centrosomes isolés à partir de différentes populations cellulaires marquées par des isotopes peuvent être utilisés pour profiler les protéines avec plus de précision et ainsi augmenter la confiance dans l'attribution des protéines centrosomiques. Les fractions contenant des centrosomes provenant de cellules marquées à la lumière sont combinées pour générer un étalon interne, qui sont ensuite distribués aux fractions correspondantes préparées à partir de cellules à marquage moyen et lourd. Les peptides sont préparés à partir des échantillons mélangés et analysés par LC-MS. (C) Les profils d'enrichissement relatif pour chaque protéine dans les préparations à marquage moyen et lourd sont dérivés des données de LC-MS en calculant les ratios de protéines moyennes/légères et lourdes/légères pour toutes les protéines de chaque fraction. Les profils présentés représentent des protéines centrosomiques connues et candidates et une seule protéine non spécifique (RPL6).


Que sont les vaccins à ARNm et pourraient-ils agir contre le COVID-19 ?

Plus tôt dans la journée, le fabricant de médicaments Moderna a annoncé que le vaccin contre le coronavirus qu'il avait créé était efficace à 94,5% dans un essai majeur. La nouvelle est arrivée une semaine après que Pfizer et bioNTech ont annoncé que leur vaccin contre le coronavirus était efficace à plus de 90 %. Les résultats des deux sociétés, qui ont dépassé les attentes, provenaient d'études approfondies et continues et n'ont pas été publiés dans des revues à comité de lecture. Pourtant, les résultats sont un signe d'espoir - les entreprises peuvent demander l'autorisation d'une utilisation d'urgence aux États-Unis dans quelques semaines - bien que les experts avertissent que les vaccins ne seront probablement pas largement disponibles avant plusieurs mois.

En juillet, le gouvernement américain a stimulé la course au développement d'un vaccin lorsqu'il a accepté de payer 4 milliards de dollars à six sociétés pharmaceutiques en échange de la promesse de livrer 100 millions de doses d'un nouveau vaccin contre le nouveau coronavirus d'ici début 2021. Ce calendrier est à une vitesse à couper le souffle, car le développement de nouveaux vaccins nécessite généralement plusieurs années, mais cela a démontré l'urgence avec laquelle les scientifiques du monde entier tentent de ralentir Covid-19.

Le sprint pour un vaccin fait émerger une nouvelle technique : l'utilisation d'ARN messager (ARNm). En cas de succès, les créations de Moderna et de Pfizer®/bioNTech® seraient les premiers vaccins à ARNm disponibles dans le commerce pour n'importe quel virus.

Qu'est-ce qu'un vaccin à ARNm ?

À l'intérieur du corps humain, l'ARN messager fournit les informations que l'ADN utilise pour fabriquer des protéines, qui régulent nos cellules et nos tissus. Les virus utilisent l'ARN dans un but beaucoup plus diabolique. Ils n'ont pas la machinerie cellulaire pour se répliquer, alors ils envahissent les cellules saines et se propagent en leur sein, provoquant parfois la maladie ou la mort. Par exemple, l'ARNm du nouveau coronavirus à l'origine de Covid-19 active une "protéine de pointe" qui perce les cellules dans tout le corps. Ceci est particulièrement dommageable chaque fois que le virus envahit les poumons, rendant le simple fait de respirer difficile.

Un vaccin à ARNm contient une version synthétique de l'ARN qu'un virus utilise pour former des protéines. Le vaccin ne contient pas suffisamment d'informations génétiques pour produire des protéines virales juste assez pour faire croire au système immunitaire qu'un virus est présent afin qu'il entre en action pour fabriquer des anticorps, qui sont des protéines spécifiquement conçues pour combattre un virus.

Les vaccins traditionnels, comme contre la grippe ou la rougeole, activent le système immunitaire en injectant aux personnes de petites quantités de virus. Les vaccins peuvent inclure des formes plus faibles du virus « atténuées » ou un virus que les scientifiques ont tué mais dont les protéines virales peuvent toujours stimuler l'immunité. Drew Weissman, immunologiste à l'Université de Pennsylvanie et expert des vaccins à ARNm, affirme que dans de très rares cas, le virus n'est pas mort malgré tous les efforts pour le tuer, ou que la dose atténuée est si forte qu'elle en rend certains malades. Les vaccins à ARNm éliminent ce problème car ils ne contiennent aucun virus.

"Vous ne pouvez jamais créer un virus infectieux avec de l'ARNm", dit-il.

Une autre faiblesse des vaccins traditionnels, dit-il, est qu'ils peuvent prendre beaucoup de temps à se développer. Pour fabriquer un vaccin, les scientifiques cultivent généralement une forme affaiblie du virus dans des œufs de poule et testent quelles parties du virus produisent avec succès des anticorps. Cela peut prendre de quatre à six mois dans le cas du vaccin annuel contre la grippe, même si les scientifiques savent déjà comment fabriquer ces vaccins et quelles souches de grippe sont susceptibles de prédominer une année donnée. Avec un tout nouveau virus, le processus de fabrication du vaccin peut s'étendre sur des années, voire des décennies. Les tests à grande échelle d'un nouveau vaccin, bien que nécessaires pour garantir l'innocuité, prennent également du temps.

« Disons que vous voulez créer un virus tué », dit Weissman. « Vous devez d'abord trouver comment le développer et comment le développer à grande échelle. ne pas le changer pour qu'il ne produise plus de réponse immunitaire qui protège l'hôte. Ensuite, après avoir fait cela, vous devez montrer qu'en fait, le virus est mort.

Avec une pandémie en cours, la vitesse est essentielle, et les chercheurs sur les vaccins tentent donc d'accélérer ce calendrier. "L'avantage de l'ARN est qu'il vous faut littéralement des jours pour fabriquer un nouveau vaccin", explique Weissman.

Une fois que les chercheurs ont déterminé l'ARNm qui permet au virus en question de produire ses protéines, les scientifiques peuvent fabriquer de l'ARN synthétique qui deviendra la base d'un nouveau vaccin. Dans un scénario idéal, les scientifiques utiliseraient des enzymes spécialement sélectionnées pour stimuler la production de cet ARNm synthétique, puis envelopperaient l'ARNm dans un emballage protecteur pour l'empêcher de se dégrader.

Alors, où sont nos vaccins à ARNm ?

La possibilité de vaccins à ARNm existe depuis 1990, lorsque les chercheurs ont injecté pour la première fois de l'ARNm à des souris et provoqué la production d'anticorps. Au cours de ces premières années, l'administration d'ARNm était dangereuse. Les souris mouraient parfois en raison d'une inflammation excessive après avoir reçu l'ARN. Ces malheureuses souris avaient activé ce qu'on appelle la réponse immunitaire innée, une stratégie aveugle que les mammifères utilisent pour résister à tout ce qui pourrait être nocif. C'était un obstacle sérieux, car les chercheurs ne pouvaient pas fabriquer un vaccin à ARNm utilisable sans trouver comment supprimer cette réponse, dit Weissman.

L'histoire a commencé à changer au milieu des années 2000 lorsque Weissman et sa collègue Katalin Karikó ont découvert comment réduire ou éliminer le risque d'inflammation. La réponse s'est avérée être des substances supplémentaires telles que des atomes de carbone à l'ARNm sans changer sa fonction. "Lorsque vous modifiez la structure de certaines de ces bases d'ARN, vous vous débarrassez du potentiel inflammatoire de l'ARN", explique Weissman.

Ces ajouts empêchent les capteurs des cellules de réagir de manière excessive à l'ARNm nouvellement injecté. Cette compréhension a été intégrée dans les vaccins que Moderna et Pfizer/bioNTech testent. (Karikó est le vice-président senior de bioNTech Weissman est un conseiller de bioNTech.)

En juillet, Moderna et Pfizer/bioNTech ont commencé des études sur leurs vaccins à ARNm chez environ 30 000 personnes chacun, dans l'espoir de montrer que leurs vaccins sont sûrs pour de grands groupes de personnes et efficaces pour renforcer une certaine immunité contre le coronavirus. Avec les résultats de novembre, le monde fait un pas de plus vers son premier vaccin à ARNm et un moyen de ralentir la pandémie de Covid-19.

Sara Suliman, immunologiste à Harvard, affirme que l'ampleur de la pandémie de COVID-19 signifie que plusieurs types de vaccins seront nécessaires (ARNm et autres). "Dans le cas de COVID, nous ne pouvons pas mettre tous nos œufs dans le même panier", explique Suliman. « Idéalement, vous voulez offrir ce vaccin au monde entier. » arguant du fait qu'aucune entreprise ne peut à elle seule répondre à une demande mondiale de vaccins.

Dans des moments moins extrêmes, dit Suliman, les entreprises ne fabriqueraient pas des millions de doses de vaccin sans preuve solide qu'un vaccin permettra une immunité durable. Avec COVID-19, cependant, les entreprises peuvent commencer à produire des millions de doses sur la base de preuves moins solides afin qu'elles puissent être prêtes à être distribuées dès que des groupes gouvernementaux comme la FDA les approuveront.

Drew Weissman voit également un grand avenir pour les vaccins à ARNm après la pandémie. Peut-être, dit-il, un jour, un seul vaccin à ARNm (parfois complété par des injections de rappel) pourrait remplacer la vingtaine de vaccins que les enfants reçoivent aujourd'hui. Suliman, cependant, est plus prudent, soulignant que le vaccin contre la rougeole fonctionne déjà bien tel quel et n'a pas besoin d'être reconfiguré. Elle dit que nous devrions conserver l'ARNm des nouveaux vaccins pour faire face aux nouvelles menaces et ne pas réinventer la roue.


Résultats

Les adénocarcinomes gastriques diffus et de type intestinal présentent de fortes différences dans les profils d'expression de l'ARNm

Des échantillons d'adénocarcinome gastrique qui pouvaient clairement être attribués au type intestinal ou diffus et qui contenaient au moins 75 % de tissu tumoral ont été utilisés pour former les deux groupes histologiques (diffus m=19, intestinale m=24). Les gènes différentiellement exprimés entre ces groupes ont été identifiés par le test de Welch. L'importance de l'expression différentielle a été acceptée lors de plusieurs tests corrigés P<0,05 et une différence significative dans l'expression à un FC ≥2. Chaque méthode de test multiple a donné un nombre différent de gènes avec des différences significatives d'expression. L'application du Bonferroni FWER, la technique de test multiple la plus conservatrice et la plus stricte disponible, a produit 207 transcrits annotés uniques et 44 non annotés uniques (322 ensembles de sondes). La technique plus modérée de Benjamini et Hochberg FDR a identifié 1280 transcrits annotés uniques et 253 non annotés uniques (2071 ensembles de sondes). Dans les deux systèmes de test, la majorité des gènes différentiellement exprimés (par exemple ∼ 73 % pour le FDR) étaient régulés à la hausse dans les tumeurs de type diffus, alors qu'un plus petit nombre de gènes (par exemple ∼ 27 % pour le FDR) étaient régulés à la hausse dans le type intestinal (Figure 1 ). Des listes annotées des 50 gènes qui ont montré la régulation positive la plus significative dans l'un ou l'autre type histologique peuvent être trouvées dans les tableaux supplémentaires S1 et S2. Le regroupement hiérarchique bidirectionnel utilisant les listes de gènes obtenues a donné lieu à des dendrogrammes comprenant deux principaux groupes d'échantillons représentant les deux types histologiques et deux principaux groupes de gènes indiquant la direction de la régulation. Cependant, l'utilisation de la liste de gènes obtenue par FDR a entraîné le regroupement de 95,3 % (41 sur 43) des échantillons dans le groupe respectif (figure 1a), tandis que la liste plus rigoureusement sélectionnée de FWER a produit un dendrogramme d'échantillon dans lequel 97,7 % (42 sur 43) ont été regroupés « correctement » (Figure 1b). Le seul échantillon mal groupé (figure 1b) était une tumeur de type diffus regroupée dans le type de tumeur intestinale. Il possédait une population de cellules tumorales très dense avec presque aucun stroma présent, une caractéristique plutôt rare des adénocarcinomes gastriques de type diffus.

Cartes thermiques de regroupement hiérarchique bidirectionnel de gènes exprimés de manière différentielle entre les adénocarcinomes gastriques humains diffus et de type intestinal. Les gènes dont l'expression était significativement différente entre les échantillons de type diffus et intestinal ont été identifiés par le test de Welch. Différentes techniques de tests multiples ont été appliquées pour corriger les faux positifs et ont abouti à différents nombres d'ensembles de sondes significatifs réussissant le test (corrigé P<0,05 fois le changement ≥2). Différentes listes ont ensuite été utilisées pour un regroupement hiérarchique bidirectionnel. Les intensités d'expression normalisées des ensembles de sondes sont représentées sous forme de carte thermique. La « distance euclidienne » et la « liaison complète » ont été utilisées comme métrique de distance et algorithme de liaison pour tous les regroupements. (une) Carte thermique de clustering hiérarchique obtenue pour la signature de 1533 gènes (2071 ensembles de sondes) identifiés par application de Benjamini et Hochberg False Discovery Rate (FDR). (b) Carte thermique de clustering hiérarchique obtenue pour la signature de 251 gènes (322 ensembles de sondes) identifiés par application de Bonferroni Family Wise Error Rate (FWER). (c) Carte thermique de clustering hiérarchique obtenue lors de l'utilisation de l'ensemble de sondes pour THBS4, le gène le plus significatif dans ce système de test, seul.

Les gènes régulés à la hausse dans les adénocarcinomes gastriques diffus et de type intestinal appartiennent à différents processus biologiques

Des corrections de tests multiples très strictes, telles que le Bonferroni FWER, conduisent à un compromis en ce sens qu'elles peuvent générer un nombre élevé de faux négatifs. Par conséquent, les gènes significatifs identifiés par Benjamini et Hochberg FDR ont été utilisés pour l'interprétation biologique. L'analyse GO a révélé que les gènes surexprimés dans les adénocarcinomes gastriques de type intestinal sont principalement associés à la prolifération et aux processus liés à la croissance, tels que le cycle cellulaire et la mitose (tableau 1). En revanche, la plupart des gènes régulés positivement dans les adénocarcinomes gastriques de type diffus codent pour des protéines de la matrice extracellulaire ou pour des protéines qui jouent un rôle important dans les processus d'adhésion ou de développement (tableau 2). Aucun des termes GO significativement enrichis n'était partagé entre les deux types.

Thrombospondine 4 - le marqueur le plus puissant pour l'adénocarcinome gastrique de type diffus dans cet ensemble de données

La sonde réglée avec le FC le plus élevé et le plus bas P-valeur dans ce système de test représentait la thrombospondine 4 (THBS4) transcription. Il était 40,8 fois régulé à la hausse dans les tumeurs diffuses et tenait un FDR corrigé P-valeur de 1,65E−7. Regroupement hiérarchique bidirectionnel basé sur le THBS4 L'ensemble de sondes seul a donné la même « exactitude » dans le regroupement des échantillons que lors de l'utilisation de l'ensemble de la signature génique générée par le FDR (Figure 1c). Seules deux tumeurs de type diffus ont été mal groupées dans le groupe de tumeurs intestinales. Il n'y avait aucune caractéristique histologique inhabituelle commune à ces échantillons. L'un était un adénocarcinome mucineux (G3) avec une faible densité cellulaire tumorale. L'autre, en revanche, était un adénocarcinome (G3) avec des cellules tumorales très denses et presque pas de stroma.

Une PCR quantitative en temps réel a été réalisée pour valider la THBS4 données de microarray (sur les 43 échantillons). L'analyse a clairement confirmé la forte importance de l'expression différentielle de l'ARNm (P<0.0001, Mann–Whitney U-test) et a démontré que THBS4 L'ARNm est principalement absent de la majorité des adénocarcinomes gastriques de type intestinal de cette cohorte, alors que des quantités accrues sont présentes dans la population de type diffus (Figure 2). Une réévaluation pathologique a révélé que les quelques tumeurs de type intestinal qui présentaient une expression faible étaient toutes contaminées par de petites quantités de muscle lisse, principalement parce que la partie de la tumeur qui avait été analysée provenait d'une région où des couches musculaires avaient été infiltrées. L'analyse PCR a en outre montré que les deux échantillons d'adénocarcinome gastrique diffus qui avaient été mal regroupés dans la population intestinale selon le regroupement (voir la figure 1c) présentaient des quantités légèrement plus élevées de THBS4 ARNm que la majorité des échantillons intestinaux, mais des quantités inférieures à celles trouvées dans le reste des adénocarcinomes gastriques de type diffus. La détection immunohistochimique de la protéine THBS4 dans des échantillons tumoraux sélectionnés au hasard a confirmé que les différences transcriptionnelles se reflètent au niveau de la protéine. Toutes les tumeurs diffuses qui ont été examinées (m=10) a montré une positivité spécifique pour THBS4, alors qu'aucune positivité notable n'a pu être observée dans la population de type intestinal (m=5) (Figure 3).

THBS4 Expression de l'ARNm dans les adénocarcinomes gastriques humains diffus et de type intestinal. L'abondance de l'ARNm de THBS4 a été examiné au moyen d'une PCR quantitative en temps réel. La quantification a été faite par rapport au transcrit de l'actine, ?? (ACTB). L'importance de l'expression différentielle entre les groupes a été calculée à l'aide de Mann-Whitney U-test. La distribution des valeurs d'expression au sein des groupes est affichée par des diagrammes à moustaches et à moustaches.

Expression de THBS4 dans les adénocarcinomes gastriques humains diffus et de type intestinal et la muqueuse gastrique non néoplasique. La détection immunohistochimique du THBS4 (rouge) a été réalisée sur 10 ??m cryosections minces. Les noyaux cellulaires ont été contre-colorés à l'aide d'hématoxyline (bleu). Dans les tumeurs diffuses, l'expression de THBS4 a été principalement observée sous forme de structures matricielles extracellulaires fibrillaires du stroma tumoral (une).Occasionnellement, la positivité cytosolique de cellules ressemblant à des fibroblastes a été détectée (c, ). L'expression était particulièrement forte dans les nids de cellules tumorales (une, c) et dans les régions d'invasion de l'épithélium sain (ligne pointillée en b). Les exemples de cellules de chevalière sont indiqués par des pointes de flèche. Aucune expression spécifique de THBS4 n'a pu être identifiée dans les tumeurs de type intestinal et l'épithélium et le stroma de la muqueuse gastrique non néoplasique (la région représentée était sur la même lame d'échantillon que l'échantillon de type diffus une). Des sections représentatives sont montrées, respectivement. Des témoins négatifs ont été obtenus par omission d'anticorps primaire (données non présentées). Les images sont agrandies × 400 avec des barres d'échelle représentant 50 ??m chacun.

La thrombospondine 4 est un stroma tumoral très abondant constitutif des adénocarcinomes gastriques de type diffus

La localisation de THBS4 dans les adénocarcinomes gastriques de type diffus a été attribuée au stroma tumoral. Tous les échantillons étudiés étaient positifs pour le THBS4 dans les structures fibrillaires extracellulaires entourant les cellules tumorales (Figure 3a et b). Dans certains cas, une positivité intracellulaire supplémentaire pourrait être détectée dans le stroma (Figure 3c et d). Les cellules montrant cette expression cytosolique de THBS4 étaient de taille plutôt petite et avaient une forme fusiforme ou fusiforme, parfois accompagnée de processus cellulaires étendus. Toutes ces caractéristiques suggèrent un phénotype de fibroblaste potentiel. L'expression de THBS4 était particulièrement forte dans les régions à forte densité de cellules tumorales, appelées nids de cellules tumorales (figure 3c), et au niveau des sites d'infiltration dans les tissus adjacents « sains » (figure 3b). Ni l'épithélium ni le stroma des homologues non néoplasiques appariés (m= 5) présentait une quelconque expression de THBS4 détectable (figure 3). Les seuls aspects de la paroi gastrique non néoplasique, qui ont clairement montré une expression de THBS4, étaient les couches musculaires lisses (cellules interstitielles et périmysium) de la musculeuse muqueuse et de la musculeuse ainsi que les parois des vaisseaux (Figure supplémentaire S1).

Dans les adénocarcinomes gastriques de type diffus, la thrombospondine 4 est exprimée et sécrétée par les fibroblastes associés au cancer

Des études de colocalisation immunohistochimique utilisant des marqueurs pour diverses entités cellulaires ont été menées pour identifier les cellules présentant une positivité cytosolique pour THBS4, à savoir celles qui expriment et sécrètent la protéine. Les cytokératines ont servi de marqueurs pour les cellules d'origine épithéliale (en l'occurrence les cellules de carcinome). La vimentine a été utilisée pour identifier les fibroblastes et les cellules mésenchymateuses en général. ??- L'actine musculaire lisse a été utilisée pour marquer les myofibroblastes, 35 qui représentent une sous-population de fibroblastes associés au cancer en transformation maligne. Aucune des cellules THBS4-positives n'a montré de positivité pour les cytokératines, alors qu'elles étaient toutes positives pour la vimentine et ??-actine musculaire lisse (Figure 4). Ainsi, les fibroblastes associés au cancer du phénotype myofibroblaste sont les cellules exprimant THBS4 dans les adénocarcinomes gastriques de type diffus.

Colocalisation du THBS4 et de la cytokératine, de la vimentine et ??-actine musculaire lisse dans les adénocarcinomes gastriques humains de type diffus. Détection immunohistochimique fluorescente simultanée de THBS4 dans le rouge et la pancytokératine (KRT), la vimentine (VIM) ou ??-actine musculaire lisse (??SMA) en vert a été réalisée le 10 ??m cryosections minces. Les signaux ont été balayés à l'aide d'un microscope confocal à balayage laser. Des images représentatives de sections confocales simples sont présentées, respectivement. Des contrôles négatifs ont été obtenus par omission d'anticorps primaires et scannés avec des paramètres identiques (trou d'épingle, excitation, moyenne de trame, etc.) aux colorations positives, respectivement (données non présentées).

En outre, in vitro des systèmes de lignées cellulaires de fibroblastes associés au cancer dérivés d'adénocarcinomes gastriques de type diffus et de fibroblastes sains dérivés de contreparties saines ont été examinés pour THBS4 expression de l'ARNm. Dans les deux paires de lignées cellulaires examinées, les fibroblastes associés au cancer contenaient des niveaux d'expression significativement plus élevés (P<0.01, t-test) que les fibroblastes normaux avec une surexpression de ≈2 et ≈3,3 fois, respectivement (Figure 5).

THBS4 Expression de l'ARNm dans les fibroblastes associés au cancer dérivés de l'adénocarcinome gastrique humain de type diffus et dans les fibroblastes normaux dérivés de la contrepartie saine. Deux lignées cellulaires de fibroblastes associés au cancer dérivés d'adénocarcinomes gastriques de type diffus (CAF-32, CAF-33) et de fibroblastes normaux dérivés de contreparties saines (NF-32, NF-33) ont été analysées. L'abondance de l'ARNm a été examinée au moyen d'une PCR quantitative en temps réel. La quantification a été faite par rapport au transcrit de l'actine, ?? (ACTB) et les niveaux d'expression dans les lignées NF ont été fixés à 100 %, respectivement. L'importance de l'expression différentielle a été évaluée en utilisant t-test ( ** P<0.01 *** P<0.001). Les barres d'erreur représentent les erreurs standard intégrées de la moyenne.

Afin d'obtenir une vue plus globale des cellules exprimant THBS4, un panel de lignées cellulaires humaines provenant de différentes entités a été examiné pour THBS4 expression de l'ARNm. Cette analyse a confirmé que les cellules de carcinome, quelle que soit leur dérivation, n'expriment généralement pas THBS4. Un modèle d'expression très restreint a été trouvé dans les lignées cellulaires d'autres tumeurs malignes. Seuls SH-SY5Y, Daudi et HL-60 présentaient des niveaux d'expression mesurables. L'expression la plus élevée de loin a été découverte dans HEK-293, une lignée cellulaire dérivée d'un rein embryonnaire normal. Aucune expression pertinente n'a été trouvée dans la seule lignée cellulaire de fibroblastes dans cette étude, dérivée de la peau normale du front et désignée 142BR (Figure supplémentaire S2).

La surexpression de la thrombospondine 4 dans les fibroblastes gastriques est stimulée par les cellules tumorales

Pour évaluer si l'expression de THBS4 dans les fibroblastes est déclenchée par les cellules tumorales, un in vitro modèle de coculture indirecte a été établi. Deux paires de fibroblastes normaux et associés au cancer ont été analysées pour les changements de THBS4 Expression de l'ARNm lors d'une provocation avec différents milieux conditionnés par des cellules tumorales. Le traitement avec le milieu conditionné d'OCUM-2M et OCUM-8, deux lignées cellulaires dérivées de carcinomes gastriques squirrheux (une sous-population d'adénocarcinomes gastriques de type diffus marqués par une fibrose excessive), a entraîné des niveaux d'expression significativement élevés dans les deux lignées de fibroblastes normales (P<0.05, t-test). Dans les fibroblastes associés au cancer, seul le milieu conditionné OCUM-8 a donné des augmentations significatives (P<0.05, t-test). Le milieu conditionné OCUM-2M a montré des tendances à la signification, cependant (P<0.1, t-test). Le milieu conditionné de la lignée cellulaire MKN-45 dérivée d'un adénocarcinome gastrique non scirrheux de type diffus n'a pas été en mesure de modifier de manière significative THBS4 expression dans tous les fibroblastes (Figure 6).

Changements dans THBS4 Expression de l'ARNm dans les fibroblastes associés au cancer dérivés de l'adénocarcinome gastrique humain de type diffus et dans les fibroblastes normaux dérivés de la contrepartie saine lors d'une stimulation avec des milieux conditionnés par des cellules tumorales. Deux lignées cellulaires de fibroblastes associés au cancer dérivés d'adénocarcinomes gastriques de type diffus (CAF-32, CAF-33) et de fibroblastes normaux dérivés de contreparties saines (NF-32, NF-33) ont été analysées. Les fibroblastes ont été incubés pendant 48 h avec un milieu conditionné dérivé de la lignée cellulaire de cancer gastrique diffus humain OCUM-2M, OCUM-8 ou MKN-45. Du milieu frais spécifique aux cellules tumorales a été utilisé comme milieu témoin, respectivement. Toutes les expériences ont été réalisées en triple avec des expériences de contrôle réalisées sur la même plaque. THBS4 L'abondance de l'ARNm a été examinée au moyen d'une PCR quantitative en temps réel. La quantification a été faite par rapport au transcrit de GAPDH et les niveaux d'expression dans les fibroblastes traités par le milieu témoin ont été fixés à 100 %, respectivement. L'importance de l'expression différentielle a été évaluée en utilisant t-test (°P<0.1 * P<0.05 ** P<0.01). Les barres d'erreur représentent les erreurs standard intégrées de la moyenne. Les résultats d'expériences représentatives sont présentés.


Discussion

Les avancées récentes dans les technologies unicellulaires, telles que les méthodes basées sur les gouttelettes 2 , rendent facile et peu coûteux la collecte de centaines de milliers de profils scRNA-seq, permettant aux chercheurs d'étudier des systèmes biologiques très complexes à haute résolution. Les bibliothèques résultantes sont souvent séquencées à une profondeur extrêmement faible (des dizaines de milliers de lectures par cellule uniquement), ce qui rend les données de nombre de lectures correspondantes vraiment éparses. Par conséquent, il existe un besoin croissant de développer des méthodes statistiques fiables, évolutives et capables de tenir compte d'une inflation nulle.

ZINB-WaVE est une approche générale et flexible pour extraire un signal de faible dimension à partir de données bruyantes et gonflées à zéro, telles que celles provenant d'expériences scRNA-seq. Nous avons montré avec des analyses de données simulées et réelles que ZINB-WaVE conduit à des estimateurs robustes et non biaisés des signaux biologiques sous-jacents. Les meilleures performances de ZINB-WaVE par rapport à l'ACP ont un coût de calcul, car nous devons optimiser numériquement une fonction de vraisemblance non convexe. Cependant, nous avons constaté empiriquement que le temps de calcul était approximativement linéaire à la fois pour le nombre de cellules et le nombre de gènes, et approximativement quadratique pour le nombre de facteurs latents (Fig. 30). L'algorithme bénéficie de la parallélisation sur les machines multicœurs et prend quelques minutes sur un ordinateur portable moderne pour converger vers des milliers de cellules.

Une différence majeure entre ZINB-WaVE et les modèles d'analyse factorielle précédemment proposés (tels que PCA et ZIFA) est la possibilité d'inclure des covariables au niveau de l'échantillon et au niveau des gènes. En particulier, en incluant une colonne de uns dans la matrice de covariables au niveau du gène, l'interception au niveau de la cellule correspondante agit comme un facteur de normalisation d'échelle globale, permettant la modélisation des données de comptage brutes, sans avoir besoin de normalisation préalable.

Cependant, il n'y a aucune garantie que le signal de faible dimension extrait par ZINB-WaVE soit biologiquement pertinent : Si une variation technique indésirable affecte les données et n'est pas prise en compte dans le modèle (ou dans la normalisation préalable), la matrice de bas rang W inférée par ZINB-WaVE capturera ces effets de confusion. Il est donc important d'explorer la corrélation entre les facteurs latents estimés par notre procédure et les mesures connues de contrôle de qualité qui peuvent être calculées pour les bibliothèques scRNA-seq, en utilisant, par exemple, le scater de package Bioconductor R 43 (voir Fig. 2f). Si l'on observe une forte corrélation entre un ou plusieurs facteurs latents et certaines mesures de CQ, il peut être avantageux d'inclure ces mesures de CQ en tant que covariables dans le modèle.

Plusieurs auteurs ont reconnu que les données génomiques de grande dimension sont affectées par une variété d'effets techniques indésirables (p. ou voie non surveillée 27,44 . Récemment, Lin et al. 45 ont proposé un modèle qui peut étendre l'ACP pour ajuster les facteurs de confusion. Ce modèle, cependant, ne semble pas être idéal pour les données de comptage gonflées à zéro. Dans la littérature scRNA-seq, MAST 23 utilise le taux de détection cellulaire inféré pour ajuster la principale source de confusion, dans un cadre d'expression différentielle, mais n'est pas conçu pour déduire un signal de faible dimension.

La suppression des effets de lot est un exemple important de la façon dont l'inclusion de covariables supplémentaires dans le modèle ZINB-WaVE peut conduire à de meilleures représentations de faible dimension des données. Cependant, ZINB-WaVE ne se limite pas à inclure des effets de lot, car d'autres covariables au niveau de l'échantillon (par exemple, les mesures de CQ) et/ou au niveau du gène (par exemple, le contenu GC) peuvent être incluses dans le modèle. Bien que nous n'ayons trouvé aucun exemple convaincant dans lequel l'ajout d'une covariable au niveau du gène conduit à améliorer l'extraction du signal, il est intéressant de noter la relation entre le contenu en GC et les effets de lot 46 . Avec de grands efforts de collaboration, tels que l'Atlas des cellules humaines 47, à l'horizon, nous prévoyons que la capacité de notre modèle à inclure des covariables au niveau des gènes qui peuvent potentiellement aider à expliquer les différences dans les protocoles s'avérera importante.

Bien que le signal de faible dimension déduit par ZINB-WaVE puisse être utilisé pour inspecter visuellement la structure cachée dans les données, la visualisation n'est pas le point principal de notre méthode proposée. Les facteurs de faible dimension sont destinés à être l'approximation la plus proche possible du vrai signal, qui est supposé être intrinsèquement de faible dimension. Une telle représentation de faible dimension peut être utilisée dans des analyses en aval, telles que le regroupement ou l'ordre pseudo-temporel des cellules 15 .

La visualisation d'ensembles de données de grande dimension est un domaine de recherche tout aussi important et de nombreux algorithmes sont disponibles, parmi lesquels le t-SNE 25 est devenu le plus populaire pour les données scRNA-seq. Récemment, Wang et al. 48 ont proposé un nouvel algorithme de visualisation qui peut tenir compte d'une inflation nulle et a montré une amélioration par rapport au t-SNE. Comme t-SNE prend en entrée une matrice de distances par paires de cellules, qui peuvent être bruitées dans des dimensions élevées, un pipeline typique consiste à calculer de telles distances dans l'espace PCA, en sélectionnant, par exemple, les 50 premiers PC. Une approche alternative consiste à dériver ces distances de l'espace de faible dimension défini par les facteurs inférés par ZINB-WaVE. Cette stratégie a été utilisée efficacement dans la figure 3c pour visualiser l'ensemble de données PBMC.

Dans cet article, nous nous sommes concentrés sur un environnement non supervisé, où l'objectif est d'extraire un signal de faible dimension à partir de données bruitées et gonflées à zéro. Cependant, notre modèle ZINB proposé est plus général et peut être utilisé, en principe, pour l'analyse d'expression différentielle supervisée, où les paramètres d'intérêt sont des coefficients de régression ?? correspondant aux covariables connues au niveau de l'échantillon dans la matrice X (par exemple, type de cellule, statut de traitement/témoin). Les gènes différentiellement exprimés peuvent être identifiés via des tests de rapport de vraisemblance ou des tests de Wald, avec des erreurs types des estimateurs de ?? obtenu à partir de la matrice hessienne de la fonction de vraisemblance. En outre, les probabilités d'abandon a posteriori peuvent être facilement dérivées du modèle et utilisées comme poids pour déverrouiller les méthodes standard de RNA-seq en vrac 49 , telles que edgeR 41 . Nous envisageons une future version du package zinbwave avec cette capacité supplémentaire.


Pourquoi utilisons-nous de l'ARNc au lieu de l'ARN extrait initial dans la technique des puces à ADN ? - La biologie

Un aperçu de l'utilisation de Xenopus laevis comme système modèle.

L'utilisation d'organismes traitables (systèmes modèles) pour répondre à des questions fondamentales en médecine et en biologie est une pratique courante depuis les années anciennes. L'un des systèmes modèles avec des contributions importantes est Xenopus laevis, la grenouille africaine à griffes, un vertébré pseudotétraploïde qui vit en eau douce. Les raisons de son utilisation mondiale dans la recherche résident dans le degré élevé de conservation de la plupart des mécanismes cellulaires et moléculaires essentiels, il est peu coûteux, facilement manipulé et de grandes quantités de matériel peuvent être facilement obtenues pour une variété de procédures expérimentales. Dans cette revue, le matériel qui est systématiquement obtenu à partir de Xenopus laevis, les procédures expérimentales les plus importantes, la façon dont le système Xenopus est utilisé dans la recherche ainsi que les types de questions qui ne peuvent être résolues qu'en utilisant Xenopus vont être discutés.

L'élevage peut être manipulé de manière à ce que chaque grenouille puisse donner des œufs jusqu'à 3 à 4 fois par an et le matériel utilisé dans les études de recherche peut varier des ovocytes aux extraits acellulaires. La production d'œufs est contrôlée par des injections sous-cutanées de 50 à 100 unités de sérum de jument gravide (PMS) dans leurs sacs lymphatiques dorsaux plusieurs jours avant la deuxième injection avec 600 à 800 unités de gonadotrophine chorionique humaine (hCG) 12 à 16 heures avant la date souhaitable. la ponte. Juste après la deuxième injection, ils sont placés dans des réservoirs individuels et le lendemain, les œufs sont collectés.

Les ovocytes sont de grandes cellules de > 1 mm de diamètre. Ils contiennent un énorme noyau (ou vésicule germinale), 100 000 fois plus gros qu'un noyau de cellule somatique, qui occupe environ le tiers du volume de l'ovocyte et ils se développent rapidement. La vésicule est entourée d'une enveloppe nucléaire avec de grands pores qui facilitent le transport depuis et vers le cytoplasme. Admirablement, les ovocytes ont un cycle cellulaire synchrone et ils s'arrêtent à la première prophase méiotique jusqu'à l'activation par la progestérone. L'activation de la progestérone entraîne la maturation méiotique des ovocytes. Le stade de maturation est contrôlé par l'activité du facteur de promotion de la maturation (MPF) [2], également connu sous le nom de p34cdc2 kinase et d'histone H1 kinase associée à la croissance. Lors de l'activation de la progestérone et d'une augmentation de l'activité MPF, la structure nucléaire s'effondre, le fuseau se forme et la première division méiotique est terminée. Mais le cycle est à nouveau arrêté au stade métaphasique du deuxième cycle méiotique par l'action du facteur cytostatique (CSF) et cela signale l'ovocyte mature en attente de fécondation [3, 4]. Après la fécondation, c'est-à-dire la fusion du sperme avec l'ovule, le pool cytoplasmique de calcium est augmenté, ce qui entraîne l'inactivation du MPF et du LCR et la libération du cycle cellulaire (Figure 1) (voir les vidéos qui montrent le développement du Xenopus sur l'ovule fertilisation)

Le matériel que Xenopus peut offrir en biologie est excellent en termes de qualité et de quantité. Par exemple, un ovaire de grenouille correspond à 1000 ovaires de souris [5] et les western blots peuvent être réalisés avec des échantillons de protéines provenant d'un seul ovocyte (ou 1 uL d'extrait – voir ci-dessous). Les ovocytes sont très riches en tous les ARN et protéines nécessaires aux premiers stades de développement jusqu'au début de l'embryogenèse, c'est-à-dire le stade têtard. Ils peuvent contenir jusqu'à 4 ug d'ARN ribosomique, donc chaque ovocyte est capable de synthétiser jusqu'à 400 ng de protéines par jour. L'expérimentation monocellulaire dans les ovocytes de Xenopus laevis est une routine pour les biologistes expérimentaux. De plus, ils manquent d'activité transcriptionnelle jusqu'au stade blastula moyen-tardif. On estime que la teneur en protéines est d'environ 500 ug dans chaque ovocyte et d'environ 10-50 mg/mL dans l'extrait.

Les ovaires de Xenopus laevis sont gros et transparents et peuvent contenir plusieurs centaines d'ovocytes, également gros, qui peuvent être facilement obtenus. Malgré la différence de taille, les processus d'ovogenèse et de maturation sont conservés chez les mammifères. Par conséquent, ils sont largement utilisés par les chercheurs qui étudient le cycle cellulaire.

Les ovocytes peuvent être disséqués manuellement à l'aide de pinces des ovaires ou ils peuvent être extraits par digestion à la collagénase (défolliculation enzymatique) des quatre couches de tissu conjonctif extracellulaire qui les entourent. Les avantages et les inconvénients de l'une ou l'autre méthode ont été discutés en détail dans [6]. Ensuite, à partir des ovocytes, le noyau peut être retiré manuellement. Une paire de pinces à bouts pointus est utilisée pour percer une petite ouverture sur la cellule et en pressant la force appliquée par une autre paire de pinces à bouts émoussés, le noyau est extrait [6, 7]. Il en résulte des ovocytes sans noyau (ovocyte énucléé) et des noyaux isolés.Le protocole expérimental avec lequel s'effectue l'énucléation est choisi en fonction de l'application en aval, qui peut être l'immunotransfert [8], l'injection d'un noyau somatique et la synthèse d'ARN pour l'analyse de la transcription [9], l'expression de protéines exogènes par injection d'ARN complémentaire ( ARNc) dans le cytoplasme ou d'ADN complémentaire (ADNc) dans le noyau [10], injection de peptides ou de protéines recombinantes [11] et autres. Des noyaux entièrement fonctionnels peuvent être isolés et être utilisés pour étudier tous les processus nucléaires, y compris l'expression des gènes, la dynamique de la chromatine, l'importation et l'exportation nucléaires de protéines marquées par fluorescence ou la fonction des complexes de pores nucléaires [12, 13].

Le volume d'un ovocyte de Xenopus laevis est d'environ 1 ul. Ils peuvent tolérer une injection jusqu'à 50 nL à l'aide de nano-injecteurs automatiques, sans aucun effet néfaste sur le fonctionnement. Plusieurs ovocytes sont disposés sur des lames spéciales et injectés séquentiellement avec un nano-injecteur, comme le montre cette vidéo.

Les injections peuvent être utilisées pour des expériences de gain de fonction (GOF) ou de perte de fonction (LOF) ou des expériences impliquant les deux. Par des injections contenant tout type d'ADN, d'ARN, d'ADN plasmidique [14], d'oligonucléotides morpholino [15] ou de molécules protéiques, la fonction des gènes peut être facilement manipulée. Plusieurs exemples peuvent être trouvés dans la littérature par exemple, les premières expériences qui ont conduit au clonage d'interféron [16], ou le développement de la technologie morpholino [17] ont été réalisées sur des ovocytes de Xenopus. Morpholino a été noté pour générer des faux positifs élevés [18]. La génération d'embryons transgéniques de Xenopus laevis a également été décrite et a été utilisée pour évaluer l'expression des gènes impliqués dans les maladies pathologiques [19, 20]. L'assemblage de la chromatine peut être étudié in vivo dans des ovocytes après injection d'ADN dans la vésicule germinale. La synthèse ou la réplication de brins complémentaires peut être surveillée par co-injection de dNTP radiomarqués tandis que l'assemblage des nucléosomes peut être évalué avec un test de superenroulement et un test de nucléase micrococcale (MNase). La réplication virale est également possible après microinjection d'ARN viral, qui produit des virus infectieux [21]. Des ondes de déclenchement apoptotiques ont également été identifiées par injection [22]. Li L et al ont injecté des oligos morpholino, de l'ARNm de TALEN et des ARNm de pleine longueur pour étudier la fonction de Etv6 [23]. Clairfeuille T et al ont injecté de l'ARNc pour l'humain et Blattella germanica Nav (synthétisés via un kit mMessage mMachine de Thermo Fisher) dans des ovocytes de Xenopus laevis, provenant de Xenopus one ou d'Ecocyte, pour étudier l'inactivation des canaux sodiques voltage-dépendants [24].

Comme dans d'autres systèmes modèles utilisés en biologie du développement, les transplantations peuvent être facilement réalisées dans des ovocytes de Xenopus. Comme expliqué ci-dessus, en raison de la grande taille des ovocytes, l'énucléation est une procédure de routine avec Xenopus. Un ovocyte peut être injecté avec des nucléotides, tels que morpholino ou siRNA, ce qui entraîne la perte de fonction d'une cible d'intérêt. Ensuite, le noyau de cet ovocyte ou têtard mutant peut être transféré dans un ovocyte « sauvage », dont le noyau a été retiré ou détruit, et le noyau sain peut être transplanté dans un ovocyte mutant et comparé (Figure 2). Ces procédures expérimentales pourraient remplacer des stratégies, telles que la génération de clones transgéniques, qui ne sont pas encore très réalisables chez les grenouilles. Pour plus d'informations, lisez ci-dessous l'expérience de Gurdon.

De plus, des canaux ioniques et des récepteurs membranaires de cerveaux post-mortem d'humains atteints de la maladie d'Alzheimer ont été microtransplantés et étaient fonctionnels dans les ovocytes de Xenopus et ont des applications dans l'étude de l'activité des canaux liée aux maladies humaines [25-27]. De même, les ovocytes de Xenopus sont un excellent système pour l'expression et l'étude des neurotransmetteurs du cerveau humain ou des cellules en culture et de ses ligands (médicaments, pesticides, etc.) après injection d'ARNm ou d'ADNc ou de vésicules membranaires de tissus natifs. Les courants générés dans de telles expériences dans les ovocytes sont facilement mesurés en raison de la grande taille de l'ovocyte, d'où le système Xenopus a des contributions significatives dans l'étude des troubles neurologiques, tels que l'épilepsie [28].

L'assemblage de la chromatine peut être simplement contrôlé après injection de protéines exogènes ou après des expériences GOF ou LOF [29]. De même, les protéines peuvent être extraites pour une analyse par transfert Western. Fait intéressant, l'immunoprécipitation de la chromatine (ChIP) est une technique largement utilisée avec les lignées cellulaires pour identifier l'interaction entre les facteurs de transcription ou les marqueurs épigénétiques avec des éléments d'ADN spécifiques, tels que les promoteurs. Les puces peuvent également être appliquées dans les ovocytes de Xenopus en utilisant les mêmes principes mais avec beaucoup moins de matériel de départ (10-15 ovocytes) [30, 31]. Il existe des cas où, bien que Xenopus ne soit pas utilisé, ses composants de la chromatine, tels que les histones, sont examinés [32].

En raison du grand matériel offert par les ovocytes et les extraits de Xenopus, ils ont été utilisés pour réaliser des criblages initiaux de petites molécules qui pourraient être utilisées dans les thérapies de maladies humaines, telles que les métastases cancéreuses et la génération de nouveaux vaisseaux sanguins [33], la dégradation des protéines et Dommages à l'ADN et réparation [34, 35].

La grande taille de l'ovocyte s'oppose à certains problèmes dans les expériences de microscopie (difficulté pour les anticorps à pénétrer, signal de fond du pigment cortical et des plaquettes vitellines) les rendant moins simples et nécessite une optimisation. Malgré les difficultés, plusieurs protocoles ont été développés pour étudier la localisation et l'organisation du cytosquelette et des protéines du cytosquelette (eg, actine, tubuline, kératine) par immunofluorescence et microscopie confocale (pour une discussion complète voir Becker et Gard, 2006 [36] ). Les ovocytes de Xenopus sont également les cellules préférées pour étudier la signalisation Ca 2+.

L'extrait obtenu à partir d'œufs de Xénope non fécondés est un système acellulaire qui complète et dépasse parfois l'utilisation d'autres systèmes modèles. Il récapitule toutes les fonctions biologiques de l'ovocyte et il a été démontré qu'il s'auto-organise en structures de type cellulaire et subit de multiples cycles de division dans les bonnes conditions [37]. L'extrait est un système largement utilisé pour étudier le cycle cellulaire in vitro, en particulier les processus de réplication de l'ADN et de formation du noyau. Ce sont des processus très importants pour la stabilité du génome et tout défaut peut contribuer à de nombreuses pathologies, telles que le cancer. La plupart, sinon la totalité, des caractéristiques sont conservées des vertébrés à l'homme. Par conséquent, les extraits d'œufs de Xenopus offrent la simplicité d'étudier les processus cellulaires vitaux sans avoir à compenser quoi que ce soit.

Les premiers extraits ont été préparés par Lohka et Masui [38] et ont été largement utilisés après Blow et Laskey et Hutchison et al au milieu des années 80. Ces extraits pourraient compléter un cycle cellulaire in vitro et pourraient être conservés congelés dans de l'azote liquide et, lorsqu'ils sont frais, pourraient présenter plusieurs cycles cellulaires [39, 40]. Ce cycle comprenait la décondensation des chromosomes, la formation de l'enveloppe nucléaire, la réplication complète de l'ADN de manière semi-conservatrice comme chez l'homme, la recondensation des chromosomes, la rupture de l'enveloppe nucléaire, la formation du fuseau mitotique et la séparation des les chromatides sœurs.

Depuis lors, plusieurs variantes des protocoles originaux de préparation des extraits existent d'un laboratoire à l'autre en fonction des équipements disponibles et de l'expérience personnelle [1, 3, 41]. Les différences sont cependant minimes et fournissent toutes des extraits d'œufs de haute qualité qui peuvent être stockés dans de l'azote liquide pendant des années.

Généralement, l'enrobage gélatineux des œufs est retiré (dégelée) et les œufs sont broyés par centrifugations séquentielles (Figure 3). Lorsque cela est préféré, les œufs non fécondés sont traités avec un ionophore de calcium avant d'être écrasés, ce qui inactive le facteur cytostatique (CSF) et libère le cycle cellulaire de la prophase à l'interphase suivante en quelques minutes seulement. Les extraits obtenus à partir de ces œufs induits par le Ca 2+ sont interphasiques. Alternativement, l'ajout direct de calcium dans l'extrait d'ovules non induits (extrait mitotique arrêté par le LCR) a le même effet et entraîne la réplication de l'ADN du sperme. Après élimination des débris, granules pigmentaires, lipides et protéines du jaune, plusieurs types d'extraits peuvent être obtenus en fonction de la question scientifique à étudier (Figure 3).

Des extraits plus détaillés à basse vitesse (LSE) contiennent le cytoplasme, y compris les membranes légères, les ribosomes et l'enveloppe nucléaire, et sont préparés par centrifugation à vitesse moyenne (2+ œufs induits comme expliqué ci-dessus) ou mitotique (à partir d'œufs non induits). Les extraits interphasiques de LSE démontrent l'assemblage de la chromatine, la formation de complexe de pré-réplication (pré-RC) et le chargement sur la chromatine, la cuisson d'origine et la réplication de l'ADN, l'assemblage nucléaire tandis que les extraits mitotiques de LSE démontrent la condensation des chromosomes, la formation de fuseau mitotique et ne répliquent pas l'ADN à moins d'être activés par Ca 2+ .

Des extraits à grande vitesse (HSE) sont préparés à partir de LSE après centrifugation supplémentaire à grande vitesse (100 000 g) qui sépare le cytoplasme des membranes et des ribosomes. Ainsi, HSE ne peut pas former de noyaux, l'ADN est assemblé en chromatine et le pré-RC est chargé, mais l'ADN double brin ne peut pas être répliqué. Cependant, il synthétisera le brin complémentaire lorsqu'une molécule d'ADN simple brin est ajoutée.

La transfection de molécules d'ADN dans des cellules eucaryotes n'entraîne pas une réplication suffisante. D'autre part, les extraits d'œufs de Xenopus sont un système puissant, avec la levure, pour étudier toutes les étapes de la réplication de l'ADN, en particulier la licence des origines de réplication et d'initiation, car ils reproduisent des événements dans un mécanisme semi-conservateur, comme les cellules in vivo [42, 43]. En principe, un extrait interphasique de bonne qualité commencera à licencier les origines de la réplication de l'ADN dans les premières minutes après l'ajout d'un mélange régénérant d'ATP et d'ADN matrice (sperme démembrané ou ADN plasmidique). La synthèse de l'ADN commencera après 20 à 30 minutes et achèvera un cycle de réplication de l'ADN, elle décondensera complètement la chromatine et formera des noyaux entièrement fonctionnels en 60 à 80 minutes à 23 °C (figure 4C). Ensuite, ils entrent en mitose, à moins que du cycloheximide n'ait été ajouté pour inhiber la synthèse des protéines. Ainsi, la cycline B n'est pas synthétisée pour entraîner la mitose et l'extrait est arrêté dans un état de type G2.

En règle générale, la progression du cycle cellulaire peut être surveillée par : l'immunofluorescence après l'ajout de dUTP marqués à la biotine (figure 4E-F) ou le test de réplication de l'ADN après l'ajout de dNTP radiomarqués et la précipitation du TCA (figure 4D) [1].

Étant donné que les extraits d'œufs interphasiques n'ont pas de noyau assemblé mais contiennent tous les composants nécessaires pour construire un noyau à partir de zéro, ils constituent un système avantageux pour étudier l'assemblage nucléaire, la formation de pores nucléaires et d'enveloppes nucléaires. En utilisant cela à notre avantage, en ajoutant une molécule marquée par fluorescence dans l'extrait, son transport depuis et vers le noyau peut être facilement étudié. De même, l'élimination d'un composant structurel de l'enveloppe nucléaire ou du pore nucléaire pourrait être utilisée dans de telles études.

Le grand avantage des extraits de Xenopus est la facilité qu'ils apportent à l'immunodéplétion de composants particuliers ou à l'ajout de protéines, d'inhibiteurs ou d'autres molécules. Ce sont des procédures standard et il n'y a pas besoin de transfection ou de manipulations similaires qui sont nécessaires, par exemple, avec des lignées cellulaires cultivées. C'est un simple ajout dans le tube. En outre, l'extrait cytosolique n'a pas de compartiments cellulaires distincts formés et contient toutes les protéines (par exemple, cytosoliques, nucléoplasmiques, liées à la chromatine) dans un seul pool. Ainsi, l'ajout/l'épuisement/l'inhibition de protéines est facilement efficace et le résultat de cette manipulation facilement mesurable [44]. Par exemple, l'ajout de fortes concentrations d'acide okadaïque, un inhibiteur des protéines phosphatases et en particulier de la protéine phosphatase 2A (PP2A), incite l'extrait à contourner la réplication et à passer directement à la mitose (Figure 5, panneau inférieur). Ou l'immunodéplétion de la kinase 2 dépendante de la cycline, la kinase principale à tous les stades de la réplication de l'ADN, entraîne une altération de la réplication, comme le montre une forte réduction du nombre de foyers de réplication (Figure 5, panneau du milieu).

Les extraits d'œufs de xénope (ainsi que les ovocytes) fournissent un excellent environnement pour étudier les modifications post-traductionnelles (PTM) des protéines recombinantes. Les protéines et les voies de signalisation chez Xenopus montrent un haut degré de conservation chez l'homme [45]. Par conséquent, une protéine recombinante peut trouver ses partenaires naturels dans un extrait d'œuf et ainsi conserver toutes ses fonctionnalités. Ce n'est pas toujours le cas chez les bactéries ou les levures, qui ne présentent pas toutes les modifications post-traductionnelles trouvées chez les mammifères supérieurs. Les extraits d'œufs sont très concentrés par rapport aux extraits de lignées cellulaires cultivées (c'est-à-dire que peu de matériel est nécessaire). Le plus grand avantage est qu'ils offrent un contexte quelque peu physiologique dans les extraits d'œufs interphasiques ou mitotiques. Par conséquent, lors de l'ajout d'un partenaire de liaison comme « appât » ou d'un substrat d'une enzyme dans l'extrait de Xénope, la probabilité de trouver les interacteurs physiologiquement pertinents et les effecteurs en amont ou en aval au stade approprié du cycle cellulaire est très élevée.

L'épigénétique et les modifications des histones sont considérées comme importantes pour le développement embryonnaire et la voie de plusieurs pathologies, dont le cancer. La chromatine des extraits d'œufs de Xenopus interphasiques ou mitotiques peut être facilement purifiée à différentes étapes (par exemple, pré-licence des origines de réplication, cuisson de la réplication de l'ADN, phase S tardive, etc.) à travers un gradient de saccharose et comparée. La chromatine purifiée peut être évaluée par immunoblot, immunofluorescence, etc. Xenopus offre la possibilité d'identifier de nouveaux PTM difficiles à trouver dans des échantillons plus complexes, tels que des lignées cellulaires. Plusieurs autres ressources pour les études génétiques, génomiques et protéomiques peuvent être trouvées ici [46].

Le système modèle Xenopus a de nombreuses autres applications, telles que la compréhension de la régénération [47], la nucléation des microtubules [48], la séparation de phases [49], le développement du cerveau [15] et bien d'autres. D'autres domaines de recherche dans lesquels les embryons de Xenopus ont une contribution significative sont la recherche sur l'œil et la vision, le développement cardiaque, l'immunologie. Sur la base d'une analyse embryologique de l'œil de Xenopus après manipulation de l'expression génique spécifiquement dans l'œil par des microinjections de blastomères, plusieurs gènes et voies de signalisation ont été découverts cruciaux pour le développement de l'œil et le devenir de la rétine (Xenopus White Paper 2009). En termes d'expression génique, Mughal BB et al ont identifié des gènes de référence tels que clta.L, sub1.L etc. pour des études PCR quantitatives en temps réel dans le développement de Xenopus laevis [50]. DeLay BD et al ont établi la procédure de knock-out spécifique au rein du gène lhx1 avec CRISPR/Cas9 chez la grenouille allotétraploïde [51].

En conclusion, les principaux avantages du système Xenopus sont les gros ovocytes et les extraits acellulaires, qui offrent beaucoup de matériel (protéines, ADN, ARN, etc.) pour les études biochimiques et la facilité de la micro-injection, la synchronisation du cycle cellulaire et les mécanismes moléculaires conservés. . Étant donné que le développement embryonnaire partage de nombreuses caractéristiques avec les cancers humains, Xenopus laevis et X. tropicalis sont d'excellents outils non seulement pour étudier la tumorigenèse, mais aussi pour répondre à des questions fondamentales générales en biologie et en médecine [45, 52].

Xenopus laevis est devenu l'un des modèles les plus prometteurs pour étudier les mécanismes de régénération. Les tissus humains n'ont pas la capacité de régénération de la peau des amphibiens et développent une fibrose après une lésion cutanée. Par conséquent, l'analyse des cellules blastémiques régénératives de Xenopus et la comparaison avec la cicatrisation induite par les myofibroblastes chez l'homme aideraient à comprendre les processus de régénération chez l'homme. Aztekin C et al ont identifié une cellule organisatrice de la régénération dans la queue de Xenopus en utilisant un RNA-seq à cellule unique [53]. Par exemple, une étude récente a utilisé des cellules de Xenopus marquées avec un opérateur génique évoqué par laser infrarouge (IR-LEGO) dans l'étude de la régénération cutanée [54, 55]. De plus, le séquençage du génome chez Xenopus laevis a déjà été finalisé et peut être appliqué au profilage de l'expression génique dans les cellules régénératives des amphibiens [56]. De plus, une autre publication récente a présenté plusieurs tests pour étudier les mécanismes de cicatrisation cellulaire et moléculaire chez les embryons de Xénope [57]. Les méthodes décrites comprenaient la génération de constructions knockdown et de surexpression et l'incorporation d'ARNm codant pour des marqueurs fluorescents.

La régénération des structures centrales et périphériques du système nerveux est un autre domaine de recherche, où Xenopus laevis s'est avéré être un modèle d'étude efficace. L'utilisation de Xenopus transgénique pour les études de régénération axonale comprend l'introduction d'une ou deux molécules de marquage, telles que les amines de dextrane, pour suivre la repousse des axones endommagés expérimentalement [58]. Un autre protocole, qui utilise Xenopus pour étudier la régénération de la moelle épinière, a récemment été publié [59]. L'étude est basée sur la capacité de ces espèces d'amphibiens à régénérer la moelle épinière au stade larvaire de développement. De plus, une étude récente a appliqué la protéomique quantitative pour analyser la variété de protéines exprimées dans la moelle épinière de Xenopus aux stades régénératifs et non régénératifs [60]. En ce qui concerne le système sensoriel visuel, Xenopus a été utilisé pour étudier la régénération des structures oculaires, telles que le cristallin et la rétine [61, 62].

Xenbase, la base de données d'organismes modèles Xenopus, est une ressource vitale pour tous les chercheurs [63-65]. Il contient des annotations génomiques, ARNm, protéomiques et fonctionnelles et est directement lié à plusieurs bases de données, telles que NCBI ou Uniprot. Le génome de Xenopus laevis n'a été entièrement séquencé que récemment. Initialement, au début des années 2000, on pensait que le génome tétraploïde posait des problèmes qui ne seraient pas observés si le diploïde Xenopus tropicalis était choisi pour le séquençage. En effet, les connaissances obtenues à partir du génome de X. tropicalis ainsi que les avancées récentes dans le séquençage de l'ADN ont permis d'assembler et de séquencer entièrement le génome de Xenopus laevis. Par conséquent, des études protéomiques peuvent être effectuées en routine [66-70]. Les gènes peuvent également être obtenus auprès de Source Biosciences [49].

Le zoologiste et biologiste de l'environnement Thomas H. Morgan (prix Nobel de physiologie ou médecine en 1933) a été l'un des premiers à utiliser Xenopus, avant de se lancer dans l'étude de la drosophile. Mais ce sont les travaux de l'endocrinologue Lancelot Hogben qui ont établi Xenopus comme système modèle. Jusque-là, l'élevage ne pouvait pas être manipulé et donc les expérimentations ne pouvaient être réalisées qu'à la fin de l'hiver jusqu'au printemps au cours duquel se produit l'élevage naturel des grenouilles. Son travail a conduit au développement du test de grossesse le plus fiable et le plus rapide jusqu'aux années 1960, lorsqu'il a découvert que lorsque l'urine de femmes enceintes était injectée à une femelle Xenopus laevis, la grenouille pondait des œufs indiquant la présence de gonadotrophine chorionique humaine (hCG) dans le urine [5, 71] (voir aussi http://www.columbia.edu/cu/biology/faculty/kelley/webessay/histories.html). Par conséquent, après une simple injection d'hCG, Xenopus laevis pond un grand nombre d'œufs tous les 3-4 mois à n'importe quel moment de l'année, qui peuvent être exploités par des biochimistes, des biologistes moléculaires ou du développement. Les œufs peuvent être utilisés directement comme ovocytes monocellulaires ou, après une simple procédure expérimentale, des extraits d'œufs peuvent être préparés.

Plus tard, Michaïl Fischberg et ses collègues ont trouvé une grenouille dans leurs colonies produisant des embryons diploïdes avec un nucléole (au lieu de deux), et ils ont généré la grenouille homozygote qui a jeté les bases de la transplantation nucléaire, car cette mutation O-nu pourrait être utilisée comme un marqueur génétique de la transplantation nucléaire [72]. Quelques années plus tard, le biologiste expérimental John Gurdon (étudiant de M. Fischberg) a découvert que la mutation O-nu était le résultat d'une délétion complète de plusieurs gènes ribosomiques [73]. Par exemple, le concept selon lequel les cellules différenciées peuvent être reprogrammées pour devenir pluripotentes a été initialement introduit en 1962 par Gurdon, qui a pris le noyau d'une cellule intestinale mature d'un têtard et l'a placé dans un ovule, dont le noyau avait été retiré. Il a ensuite vu que cet œuf s'est développé en un têtard sain [74]. Pour ses travaux révolutionnaires sur la reprogrammation cellulaire, Gurdon a reçu le prix Nobel de physiologie ou médecine en 2012, conjointement avec S. Yamanaka.

Depuis lors (les années 1960), même si l'environnement naturel de Xenopus est limité à l'Afrique du Sud, il est devenu un système modèle très populaire pour une variété d'études et est maintenant un habitant commun des laboratoires de recherche dans le monde entier. Xenopus est un système modèle remarquable et largement utilisé pour la biologie et la médecine. Dans l'environnement du laboratoire, les grenouilles sont généralement logées dans des réservoirs en plastique avec de l'eau du robinet par groupes de 6 à 15 avec un tuyau en plastique à l'intérieur du réservoir qui fournirait une cachette aux grenouilles. La température devrait être d'environ 16-20 °C et bien que les grenouilles sauvages vivent dans des environnements quelque peu sombres, un cercle de 12-14 heures de lumière avec 10-12 heures d'obscurité est vital pour une bonne santé (Figure 6).


Voir la vidéo: Quest-ce que lADN? (Février 2023).