Informations

Concernant la différence entre la bibliothèque d'ADNc et le séquençage d'ARN (technique Biochem.)

Concernant la différence entre la bibliothèque d'ADNc et le séquençage d'ARN (technique Biochem.)


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je me demandais pourquoi la création d'une bibliothèque d'ADNc nécessitait l'étape de transcription inverse (c'est-à-dire la transformation de la séquence en ADN) pourquoi ne pas utiliser directement l'ARN extrait pour le séquençage et la conversion de la base U en T ? Pourquoi s'embêter à faire un pas de plus ? super super déroutant


La construction d'une banque d'ADNc implique de faire une « copie » d'ADN de l'ARNm car le but est de synthétiser un grand nombre de molécules plasmidiques recombinantes, chacune contenant un ADNc différent et chacune propagée dans E. coli.

L'apogée de la construction de bibliothèques d'ADNc est antérieure à l'invention de la PCR.

La principale différence entre les deux approches que vous comparez est que l'une (bibliothèque d'ADNc) implique la création d'une représentation physique du génome exprimé tandis que l'autre est une représentation informationnelle.


Bibliothèques génomiques

L'avenir des bibliothèques génomiques

La construction de bibliothèques génomiques reste une technique importante en biologie moléculaire. Ces ressources sont essentielles pour l'analyse de la fonction des gènes et pour la détection de gènes apparentés provenant de différentes sources. Les bibliothèques génomiques sont actuellement utilisées pour trouver de nouveaux produits naturels, tels que les antimicrobiens. Ils sont également utilisés pour découvrir et optimiser de nouvelles voies biochimiques, telles que celles nécessaires à la production de biocarburants et d'autres produits chimiques complexes. De plus, les bibliothèques génomiques restent un outil essentiel pour assembler la grande quantité d'informations sur les séquences produites à partir de NGS.

Avec l'avènement de la biologie synthétique, il est possible de manipuler des fragments contenant des millions de paires de bases, permettant l'ingénierie de voies et de génomes entiers. Le point culminant actuel de cette technologie est l'assemblage d'un génome bactérien entier (Laboratoire Mycoplasma) à partir d'un sous-ensemble de ses gènes parentaux qui ont été synthétisés en laboratoire. Néanmoins, les outils disponibles n'en sont qu'à leurs balbutiements et la technologie est coûteuse et prend du temps. L'avenir des bibliothèques génomiques pourrait résider dans des méthodes permettant de construire facilement des chromosomes artificiels contenant tous les éléments génétiques souhaités en utilisant des « blocs de construction » facilement accessibles. De telles méthodes peuvent conduire à des génomes entièrement synthétiques et préprogrammés et sont déjà en cours de développement.


L'analyse RNA-seq révèle une réponse adaptative divergente à l'hyper- et hypo-salinité chez le cobia, Rachycentron canadum

La salinité est un stress abiotique important qui affecte les activités métaboliques et physiologiques, la race, le développement et la croissance des poissons marins. Des études ont montré que le cobia (Rachycentron canadum), un poisson téléostéen marin euryhaline, possède la capacité d'hyper/hypo iono- et osmorégulation rapide et efficace. Cependant, les études génomiques sur cette espèce font défaut et elle n'a pas été étudiée au niveau du transcriptome pour identifier les gènes responsables de la régulation de la salinité, ce qui affecte la compréhension du mécanisme fondamental sous-jacent à l'adaptation aux fluctuations de la salinité. Pour décrire la réponse moléculaire du cobia à différents niveaux de salinité, nous avons utilisé l'analyse RNA-seq pour identifier les gènes et les processus biologiques impliqués dans la réponse aux changements de salinité. Dans la présente étude, 395 080 114 lectures propres ont été générées puis assemblées en 65 318 unigènes avec une taille N50 de 2758 pb. Il y avait 20 671 gènes significativement exprimés de manière différentielle (DEG) dont 8805 gènes adaptés à l'hypo-salinité et 11 866 gènes adaptés à l'hyper-salinité. Ces DEG étaient fortement représentés dans la biosynthèse des stéroïdes, le métabolisme des acides gras insaturés, le métabolisme du glutathion, le métabolisme énergétique, l'osmorégulation et la réponse immunitaire. Les gènes candidats identifiés chez le cobia fournissent des informations précieuses pour l'étude du mécanisme moléculaire de l'adaptation à la salinité chez les poissons marins. En outre, les données de séquençage transcriptomique agissent non seulement comme une ressource importante pour l'identification de nouveaux gènes, mais également pour d'autres investigations concernant la biologie du cobia.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Kit de préparation de bibliothèque Trio RNA-Seq™

La préparation unique de la bibliothèque RNA-Seq combine trois technologies exclusives pour fournir une solution rationalisée pour l'ARN-Seq du transcriptome entier à partir d'échantillons à faible entrée et de mauvaise qualité pour la détection de transcrits rares et la découverte impartiale de pathogènes.

Nouvelles sur les produits : recherche COVID-19

Solutions NGS pour la détection virale sensible.

Avec l'évolution rapide de la situation entourant COVID-19, Tecan travaille avec diligence pour fournir des outils qui vous aideront à mieux comprendre l'évolution du nouveau coronavirus.

Notre solution de préparation de bibliothèque Trio RNA-Seq NGS a permis aux chercheurs d'étudier avec succès des virus dans des échantillons limités et dégradés. Des publications récentes évaluées par des pairs ont démontré l'utilité de Trio RNA-Seq dans la détection d'un nouveau coronavirus à partir d'échantillons de patients et ont donné un aperçu de l'histoire évolutive et de la virulence du SRAS-CoV-2.

Cliquez ici pour découvrir comment Trio et nos autres solutions NGS contribuent à la recherche COVID-19.

Détection sensible de transcrits rares à partir d'échantillons difficiles

La préparation d'une bibliothèque de séquençage d'ARN à partir d'échantillons difficiles ou mixtes, où la détection d'une faible abondance ou de transcrits rares est essentielle, est un défi sérieux pour de nombreux chercheurs. Les méthodes RNA-Seq standard ne sont pas adéquates pour la génération de modèles adaptés au séquençage de transcrits rares dans des échantillons mixtes. Les kits RNA-Seq standard sont incapables de détecter des agents pathogènes viraux tels que le SRAS-CoV-2 ou d'identifier des gènes exprimant de manière unique dans des types de cellules spécifiques à partir de tissus difficiles tels que des échantillons neurobiologiques.

La technologie d'amplification unique de Trio (amplification isotherme à amorce unique, SPIA) permet la détection de faibles quantités d'intrants et la faible abondance d'agents pathogènes comme les virus. Cette technique d'amplification impartiale génère plus de molécules pour la préparation de la bibliothèque par rapport aux flux de travail RNA-Seq standard et préserve les informations biologiques des échantillons. SPIA peut tolérer des inhibiteurs provenant de sources d'échantillons difficiles, ce qui permet une meilleure amplification de votre transcrit d'intérêt.

Trio RNA-Seq offre un système de préparation de bibliothèque NGS de premier ordre et hautement publié qui combine SPIA avec la ligature d'adaptateur DimerFree et l'épuisement ciblé du transcrit AnyDeplete, offrant une solution rationalisée pour le transcriptome entier RNA-Seq à partir d'échantillons à faible entrée et de mauvaise qualité pour les rares détection de transcrits et découverte impartiale d'agents pathogènes.

Avantages du kit de préparation de bibliothèque Trio RNA-Seq :

  • Solution de séquençage d'ARN pour biopsie liquide, FFPE, écouvillon nasal et autres échantillons difficiles à faible entrée.
  • Personnalisez l'épuisement de l'ARNr après la construction de la bibliothèque en maximisant les lectures de séquençage informatives à partir des données entières du transcriptome.
  • Fragmentation enzymatique et construction de bibliothèque DimerFree permettant une préparation de bibliothèque efficace et robuste.
  • Détectez les sauts d'index avec UDI.
  • Plage d'entrée 500 pg - 50 ng d'ARN total.
  • Idéal pour la détection et la caractérisation du COVID-19 et des agents de maladies infectieuses.

Trio low input RNA-Seq est proposé avec les sondes AnyDeplete ciblant l'ARNr humain (référence 0506) et les sondes AnyDeplete ciblant l'ARNr de souris (référence 0507). Les ensembles de sondes AnyDeplete peuvent être personnalisés pour n'importe quel transcrit de n'importe quel organisme. Pour des ensembles de sondes personnalisés, contactez votre responsable de compte ou demandez un devis sur notre site Web.


Les références

Jenner, R. G. & Young, R. A. Aperçu des réponses de l'hôte contre les agents pathogènes à partir du profilage transcriptionnel. Nature Rev. Microbiol. 3, 281–294 (2005).

Hossain, H., Tchatalbachev, S. & Chakraborty, T. Profil de l'expression des gènes de l'hôte dans les interactions agent pathogène-hôte. Cour. Avis. Immunol. 18, 422–429 (2006).

Rappuoli, R. Repousser les limites de la microbiologie cellulaire: puces à ADN pour étudier les contacts intimes bactéries-cellules hôtes. Proc. Natl Acad. Sci. Etats-Unis 97, 13467–13469 (2000).

Fodor, S.P. et al. Dosages biochimiques multiplexés avec puces biologiques. La nature 364, 555–556 (1993).

Schena, M., Shalon, D., Davis, R. W. & Brown, P. O. Suivi quantitatif des modèles d'expression génique avec une puce à ADN complémentaire. Science 270, 467–470 (1995).

Selinger, D. W., Saxena, R. M., Cheung, K. J., Church, G. M. & Rosenow, C. Analyse globale de la demi-vie de l'ARN dans Escherichia coli révèle des modèles de position de dégradation de la transcription. Génome Res. 13, 216–223 (2003).

Yamada, K. et al. Analyse empirique de l'activité transcriptionnelle dans le Arabidopsis génome. Science 302, 842–846 (2003).

Bertone, P. et al. Identification globale de séquences transcrites humaines avec des puces à génome. Science 306, 2242–2246 (2004).

Merrell, D.S. et al. Propagation épidémique induite par l'hôte de la bactérie du choléra. La nature 417, 642–645 (2002).

Revel, A. T., Talaat, A. M. & Norgard, M. V. Analyse par puces à ADN de l'expression différentielle des gènes dans Borrelia burgdorferi, le spirochète de la maladie de Lyme. Proc. Natl Acad. Sci. Etats-Unis 99, 1562–1567 (2002).

Belland, R.J. et al. Profilage transcriptionnel génomique du cycle de développement de Chlamydia trachomatis. Proc. Natl Acad. Sci. Etats-Unis 100, 8478–8483 (2003).

Maurer, A. P., Mehlitz, A., Mollenkopf, H. J. & Meyer, T. F. Profils d'expression génique de Chlamydophila pneumoniae pendant le cycle de développement et la persistance induite par la déplétion en fer. Pathog PLoS. 3, e83 (2007).

Eriksson, S., Lucchini, S., Thompson, A., Rhen, M. & Hinton, J. C. Démêler la biologie de l'infection des macrophages par le profilage de l'expression génique de l'intracellulaire Salmonella enterica. Mol. Microbiole. 47, 103–118 (2003).

Hautefort, I. et al. Au cours de l'infection des cellules épithéliales Salmonella enterica Le sérovar Typhimurium subit une adaptation transcriptionnelle dépendante du temps qui se traduit par l'expression simultanée de trois systèmes de sécrétion de type 3. Cellule. Microbiole. 10, 958–984 (2008).

Toledo-Arana, A. et al. Les Listeria paysage transcriptionnel du saprophytisme à la virulence. La nature 459, 950–956 (2009).

Perez, N. et al. Une analyse à l'échelle du génome de petits ARN régulateurs dans le groupe pathogène humain A Streptocoque. PLoS UN 4, e7668 (2009).

Kumar, R. et al. Identification de nouveaux petits ARN non codants de Streptococcus pneumoniae TIGR4 utilisant des matrices de tuilage de génomes à haute résolution. BMC Génomique 11, 350 (2010).

Zheng, X. et al. Identification de gènes et d'îlots génomiques corrélés à une forte pathogénicité chez Streptocoque suis en utilisant des puces à ADN de tuilage de génome entier. PLoS UN 6, e17987 (2011).

Der, S.D., Zhou, A., Williams, B.R. & Silverman, R.H. Identification de gènes régulés de manière différentielle par l'interféron , ou à l'aide de puces à oligonucléotides. Proc. Natl Acad. Sci. Etats-Unis 95, 15623–15628 (1998).

Zhu, H., Cong, J. P., Mamtora, G., Gingeras, T. & Shenk, T. Expression des gènes cellulaires altérée par le cytomégalovirus humain : surveillance globale avec des puces à oligonucléotides. Proc. Natl Acad. Sci. Etats-Unis 95, 14470–14475 (1998).

Hedges, J. F., Lubick, K. J. & Jutila, M. A. γδ Les cellules T répondent directement aux modèles moléculaires associés aux agents pathogènes. J. Immunol. 174, 6045–6053 (2005).

Kerns, H. M., Jutila, M. A. & Hedges, J. F. La réponse distincte des cellules T à l'agoniste Nod2 muramyl dipeptide. Cellule. Immunol. 257, 38–43 (2009).

Tross, D., Petrenko, L., Klaschik, S., Zhu, Q. & Klinman, D. M. Changements globaux dans l'expression des gènes et les interactions synergiques induites par TLR9 et TLR3. Mol. Immunol. 46, 2557–2564 (2009).

Motley, S.T. et al. Analyse simultanée des interactions hôte-pathogène au cours d'une in vivo l'infection révèle l'induction locale de protéines de réponse de phase aiguë de l'hôte, une nouvelle réponse au stress bactérien et la preuve d'un environnement limité en ions métalliques imposé par l'hôte. Cellule. Microbiole. 6, 849–865 (2004).

Velculescu, V. E., Zhang, L., Vogelstein, B. & Kinzler, K. W. Analyse en série de l'expression des gènes. Science 270, 484–487 (1995).

Shiraki, T. et al. Expression génique d'analyse de cap pour l'analyse à haut débit du point de départ de la transcription et l'identification de l'utilisation du promoteur. Proc. Natl Acad. Sci. Etats-Unis 100, 15776–15781 (2003).

Matsumura, H., Kruger, D. H., Kahl, G. & Terauchi, R. SuperSAGE : une plate-forme moderne pour le profilage quantitatif des transcrits à l'échelle du génome. Cour. Pharmacie. Biotechnologie. 9, 368–374 (2008).

Kronstad, J. W. Analyse en série de l'expression des gènes chez les agents pathogènes eucaryotes. Infecter. Désordre. Cibles médicamenteuses 6, 281–297 (2006).

Canales, R.D. et al. Évaluation des résultats des puces à ADN avec des plateformes d'expression génique quantitative. Nature Biotech. 24, 1115–1122 (2006).

Wang, Z., Gerstein, M. & Snyder, M. RNA-Seq : un outil révolutionnaire pour la transcriptomique. Nature Rév. Genet. 10, 57–63 (2009).

Sultan, M. et al. Une vue globale de l'activité des gènes et de l'épissage alternatif par séquençage profond du transcriptome humain. Science 321, 956–960 (2008).

Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M. & Gilad, Y. RNA-seq : une évaluation de la reproductibilité technique et une comparaison avec les puces d'expression génique. Génome Res. 18, 1509–1517 (2008).

Mortazavi, A., Williams, B. A., McCue, K., Schaeffer, L. & Wold, B. Cartographie et quantification des transcriptomes de mammifères par RNA-Seq. Méthodes naturelles 5, 621–628 (2008).

Morin, R. et al. Profilage du transcriptome HeLa S3 à l'aide d'ADNc amorcé de manière aléatoire et d'un séquençage à lecture courte massivement parallèle. Biotechnique 45, 81–94 (2008).

Perkins, T.T. et al. Une analyse RNA-seq spécifique au brin du transcriptome du bacille typhoïde Salmonelle Typhi. PLoS Genet. 5, e1000569 (2009).

Yoder-Himes, D.R. et al. Cartographier le Burkholderia cenocepacia réponse de niche via un séquençage à haut débit. Proc. Natl Acad. Sci. Etats-Unis 106, 3976–3981 (2009).

Oliver, H.F. et al. Séquençage profond d'ARN de L. monocytogenes révèle une phase stationnaire étendue et chevauchante et des transcriptomes dépendants de sigma B, y compris plusieurs ARN non codants hautement transcrits. BMC Génomique 10, 641 (2009).

Sharma, C.M. et al. Le transcriptome primaire du principal agent pathogène humain Helicobacter pylori. La nature 464, 250–255 (2010). Un bon exemple de la façon d'utiliser l'ARN-seq spécifique au brin de l'ARN total pour analyser l'expression génique et annoter un transcriptome bactérien en ce qui concerne à la fois les informations codantes et non codantes et la structure de l'opéron.

Toung, J. M., Morley, M., Li, M. & Cheung, V. G. Analyse de séquence d'ARN de cellules B humaines. Génome Res. 21, 991–998 (2011). Une étude transcriptomique approfondie sur les cellules B humaines qui définit les exigences de couverture pour différentes applications biologiques telles que la découverte de gènes et la quantification de l'expression.

Wilhelm, B.T. & Landry, J.R. RNA-Seq—mesure quantitative de l'expression par séquençage d'ARN massivement parallèle. Méthodes 48, 249–257 (2009).

Xiong, J. et al. Analyse du transcriptome du protozoaire modèle, Tetrahymena thermophila, en utilisant le séquençage profond de l'ARN. PLoS UN 7, e30630 (2012).

Holland, M. J. L'abondance des transcriptions dans la levure varie sur six ordres de grandeur. J. Biol. Chem. 277, 14363–14366 (2002).

Trapnell, C. et al. L'assemblage et la quantification des transcrits par RNA-Seq révèlent des transcrits non annotés et une commutation d'isoformes au cours de la différenciation cellulaire. Nature Biotech. 28, 511–515 (2010).

Croucher, N. J. & Thomson, N. R. Étudier les transcriptomes bactériens à l'aide de RNA-seq. Cour. Avis. Microbiole. 13, 619–624 (2010).

Filiatrault, M. J. Progrès en transcriptomique procaryote. Cour. Avis. Microbiole. 14, 579–586 (2011).

Bruno, V.M. et al. Annotation complète du transcriptome du champignon pathogène humain Candida albicans en utilisant RNA-seq. Génome Res. 20, 1451–1458 (2010).

Siegel, T. N., Hekstra, D. R., Wang, X., Dewell, S. & Cross, G. A. Analyse à l'échelle du génome de l'abondance de l'ARNm dans deux étapes du cycle de vie de Trypanosoma brucei et l'identification des sites d'épissage et de polyadénylation. Acides nucléiques Res. 38, 4946–4957 (2010).

Kolev, N.G. et al. Le transcriptome du pathogène humain Trypanosoma brucei à une résolution d'un seul nucléotide. Pathog PLoS. 6, e1001090 (2010).

Sorber, K., Dimon, M. T. & DeRisi, J. L. Analyse RNA-Seq de l'épissage dans Plasmodium falciparum découvre de nouvelles jonctions d'épissage, l'épissage alternatif et l'épissage de transcrits antisens. Acides nucléiques Res. 39, 3820–3835 (2011).

Wurtzel, O. et al. Transcriptomique comparative des pathogènes et non pathogènes Listeria espèce. Mol. Syst. Biol. 8, 583 (2012). Une étude pionnière qui utilise RNA-seq pour explorer les différences et les similitudes entre les transcriptomes bactériens apparentés.

Albrecht, M., Sharma, C. M., Reinhardt, R., Vogel, J. & Rudel, T. Deep sequencing-based discovery of the Chlamydia trachomatis transcriptome. Acides nucléiques Res. 38, 868–877 (2010).

Albrecht, M. et al. Le paysage transcriptionnel de Chlamydia pneumoniae. Génome Biol. 12, R98 (2011).

Mandlik, A. et al. Surveillance basée sur l'ARN-seq des changements liés à l'infection dans Vibrio cholerae l'expression du gène. Microbe hôte cellulaire 10, 165–174 (2011). Une description des transcriptomes pathogènes de bactéries isolées d'hôtes lapins ou souris.

Cloonan, N. et al. Profilage du transcriptome des cellules souches via un séquençage d'ARNm à grande échelle. Méthodes naturelles 5, 613–619 (2008).

Wang, E.T. et al. Régulation alternative des isoformes dans les transcriptomes des tissus humains. La nature 456, 470–476 (2008).

Pan, Q., Shai, O., Lee, L. J., Frey, B. J. & Blencowe, B. J. Étude approfondie de la complexité de l'épissage alternatif dans le transcriptome humain par séquençage à haut débit. Genêt nature. 40, 1413–1415 (2008).

Peng, Z. et al. Une analyse complète des données RNA-Seq révèle une édition étendue de l'ARN dans un transcriptome humain. Nature Biotech. 30, 253–260 (2012).

Schulte, L. N., Eulalio, A., Mollenkopf, H. J., Reinhardt, R. & Vogel, J. Analyse de la réponse du microARN de l'hôte à Salmonelle découvre le contrôle des cytokines majeures par le laisser-7 famille. EMBO J. 30, 1977–1989 (2011).

Oosthuizen, J.L. et al. Transcriptomique à double organisme des cellules épithéliales des voies respiratoires interagissant avec les conidies de Aspergillus fumigatus. PLoS UN 6, e20527 (2011).

Lovegrove, F.E. et al. Le profilage simultané de l'expression de l'hôte et du parasite identifie les programmes transcriptionnels spécifiques aux tissus associés à la sensibilité ou à la résistance au paludisme cérébral expérimental. BMC Génomique 7, 295 (2006).

Guerfali, F.Z. et al. Profilage d'expression génique simultanée dans des macrophages humains infectés par Leishmania majeure parasites à l'aide de SAGE. BMC Génomique 9, 238 (2008).

Matsumura, H. et al. Analyse de l'expression génique des interactions plante-hôte-pathogène par SuperSAGE. Proc. Natl Acad. Sci. Etats-Unis 100, 15718–15723 (2003).

Tierney, L. et al. Un réseau de régulation interspécifique déduit de l'ARN-seq simultané de Candida albicans envahir les cellules immunitaires innées. Devant. Microbiole. 3, 85 (2012). La première étude à décrire l'analyse parallèle d'un hôte eucaryote et d'un agent pathogène eucaryote via RNA-seq.

Cox, M.L. et al. Enquêter sur les changements induits par les fixateurs dans la qualité et l'utilité de l'ARN par analyse de puces à ADN. Exp. Mol. Pathol. 84, 156–172 (2008).

Eulalio, A., Schulte, L. & Vogel, J. La réponse des microARN des mammifères aux infections bactériennes. ARN biol 9, 742–750 (2012).

Wang, K. C. & Chang, H. Y. Mécanismes moléculaires des ARN longs non codants. Mol. Cellule 43, 904–914 (2011).

Chen, J. & Wagner, E. J. snRNA 3' fin formation: l'aube du complexe intégrateur. Biochimie. Soc. Trans. 38, 1082–1087 (2010).

Bratkovic, T. & Rogelj, B. Biologie et applications des petits ARN nucléolaires. Cellule. Mol. Science de la vie. 68, 3843–3851 (2011).

Papenfort, K. & Vogel, J. ARN régulateur dans les agents pathogènes bactériens. Microbe hôte cellulaire 8, 116–127 (2010).

Clark, M.B. et al. Analyse à l'échelle du génome de la stabilité des ARN longs non codants. Génome Res. 22, 885–898 (2012).

Yang, E. et al. Taux de désintégration des ARNm humains : corrélation avec les caractéristiques fonctionnelles et les attributs de séquence. Génome Res. 13, 1863–1872 (2003).

Armour, C.D. et al. Profilage numérique du transcriptome à l'aide d'un amorçage sélectif d'hexamères pour la synthèse d'ADNc. Méthodes naturelles 6, 647–649 (2009).

Chen, Z. & Duan, X. Déplétion d'ARN ribosomique pour des applications de séquençage d'ARN bactérien massivement parallèles. Méthodes Mol. Biol. 733, 93–103 (2011).

Huang, R. et al. Une stratégie RNA-Seq pour détecter le transcriptome complet codant et non codant, y compris les macro-ARNnc imprimés de pleine longueur. PLoS UN 6, e27288 (2011).

Giannoukos, G. et al. Processus RNA-seq efficace et robuste pour les bactéries cultivées et les transcriptomes communautaires complexes. Génome Biol. 13, R23 (2012).

Knoop, V. Quand vous ne pouvez pas faire confiance à l'ADN : la modification de l'ARN modifie les séquences de transcription. Cellule. Mol. Science de la vie. 68, 567–586 (2011).

Cantara, W.A. et al. La base de données de modification de l'ARN, RNAMDB : 2011 mise à jour. Acides nucléiques Res. 39, D195–D201 (2011).

Ishitani, R., Yokoyama, S. & Nureki, O. Structure, dynamique et fonction des enzymes de modification de l'ARN. Cour. Avis. Structurer. Biol. 18, 330–339 (2008).

Motorin, Y., Muller, S., Behm-Ansmant, I. & Branlant, C. Identification des résidus modifiés dans les ARN par des méthodes basées sur la transcription inverse. Méthodes Enzymol. 425, 21–53 (2007).

Findeiss, S., Langenberger, D., Stadler, P. F. & Hoffmann, S. Traces of post-transcriptional RNA modifications in deep séquençage data. Biol. Chem. 392, 305–313 (2011).

Iida, K., Jin, H. & Zhu, J. K. L'analyse bioinformatique suggère des modifications de base des ARNt et des miARN dans Arabidopsis thaliana. BMC Génomique 10, 155 (2009).

Ebhardt, H.A. et al. Une méta-analyse de petites erreurs de séquençage d'ARN révèle des modifications post-transcriptionnelles omniprésentes de l'ARN. Acides nucléiques Res. 37, 2461–2470 (2009).

Levin, J.Z. et al. Analyse comparative complète des méthodes de séquençage d'ARN spécifiques à un brin. Méthodes naturelles 7, 709–715 (2010). Un aperçu détaillé des approches actuelles utilisées pour assurer le maintien des informations spécifiques au brin dans les expériences RNA-seq.

Parkhomchuk, D. et al. Analyse du transcriptome par séquençage spécifique de brin d'ADN complémentaire. Acides nucléiques Res. 37, e123 (2009).

Borodina, T., Adjaye, J. & Sultan, M. Un protocole de préparation de bibliothèque spécifique à un brin pour le séquençage d'ARN. Méthodes Enzymol. 500, 79–98 (2011).

Croucher, N.J. et al. Une méthode simple pour le séquençage directionnel du transcriptome utilisant la technologie Illumina. Acides nucléiques Res. 37, e148 (2009).

Munafo, D. B. & amp Robb, G. B. Optimisation des conditions de réaction enzymatique pour générer des pools représentatifs d'ADNc à partir de petits ARN. ARN 16, 2537–2552 (2010).

Tarazona, S., Garcia-Alcalde, F., Dopazo, J., Ferrer, A. & Conesa, A. Expression différentielle dans RNA-seq : une question de profondeur. Génome Res. 21, 2213–2223 (2011). Une exploration des profondeurs de séquençage requises pour un profilage précis de l'expression génique chez les mammifères.

McIntyre, L.M. et al. RNA-seq : variabilité technique et échantillonnage. BMC Génomique 12, 293 (2011).

Jiang, L. et al. Normes de pointe synthétiques pour les expériences RNA-seq. Génome Res. 21, 1543–1551 (2011).

Garber, M., Grabherr, M. G., Guttman, M. & Trapnell, C. Méthodes de calcul pour l'annotation et la quantification du transcriptome à l'aide de RNA-seq. Méthodes naturelles 8, 469–477 (2011).

Malone, J. H. & Oliver, B. Microarrays, le séquençage profond et la véritable mesure du transcriptome. BMC Biol. 9, 34 (2011).

Metzker, M. L. Technologies de séquençage — la prochaine génération. Nature Rév. Genet. 11, 31–46 (2010). Une revue des principes de fonctionnement, des performances et des coûts des plates-formes NGS populaires, avec un aperçu des techniques de séquençage de troisième génération.

Zhang, J., Chiodini, R., Badr, A. & Zhang, G. L'impact du séquençage de nouvelle génération sur la génomique. J. Genet. Génomique 38, 95–109 (2011).

Rothberg, J.M. et al. Un dispositif semi-conducteur intégré permettant le séquençage non optique du génome. La nature 475, 348–352 (2011).

Sam, L.T. et al. Une comparaison du séquençage basé sur une seule molécule et sur l'amplification des transcriptomes du cancer. PLoS UN 6, e17305 (2011).

Koren, S. et al. Correction d'erreur hybride et de novo assemblage de lectures de séquençage de molécule unique. Nature Biotech. 30, 693–700 (2012).

Clarke, J. et al. Identification continue des bases pour le séquençage d'ADN nanopore à molécule unique. Nature Nanotechnol. 4, 265–270 (2009).

Blencowe, B. J., Ahmad, S. & Lee, L. J. Séquençage à haut débit de génération actuelle : approfondissement des connaissances sur les transcriptomes de mammifères. Gènes Dev. 23, 1379–1386 (2009).

Antoniou, E. & Taft, R. Expression génique dans les ovocytes de souris par RNA-Seq. Méthodes Mol. Biol. 825, 237–251 (2012).

Lao, K.Q. et al. Analyse du transcriptome entier par séquençage d'ARNm d'une seule cellule sur le système SOLiD. J. Biomol. Technologie. 20, 266–271 (2009). La première étude à combiner avec succès l'analyse monocellulaire avec l'ARN-seq.

Tang, F. et al. Analyse RNA-Seq pour capturer le paysage du transcriptome d'une seule cellule. Protoc Nature. 5, 516–535 (2010).

Tang, F., Lao, K. & Surani, M. A. Développement et applications de l'analyse du transcriptome unicellulaire. Méthodes naturelles 8, S6–S11 (2011). Un aperçu des exigences pour l'ARN-seq unicellulaire.

Tang, F. et al. Traçage de la dérivation des cellules souches embryonnaires à partir de la masse cellulaire interne par analyse RNA-Seq unicellulaire. Cellule souche 6, 468–478 (2010).

Tang, F. et al. Expression génétique déterministe et stochastique d'allèles spécifiques dans des blastomères de souris uniques. PLoS UN 6, e21208 (2011).

Islam, S. et al. Caractérisation du paysage transcriptionnel unicellulaire par ARN-seq hautement multiplex. Génome Res. 21, 1160–1167 (2011).

Ramsköld, D. et al. ARNm-Seq pleine longueur à partir de niveaux d'ARN monocellulaires et de cellules tumorales circulantes individuelles. Nature Biotech. 22 juillet 2012 (doi : 10.1038/nbt.2282).

Kang, Y. et al. Amplification de transcription à partir d'une seule bactérie pour l'analyse du transcriptome. Génome Res. 21, 925–935 (2011). La première étude pour surveiller l'expression différentielle des gènes dans une seule cellule bactérienne par séquençage Sanger.

Brouzes, E. Microfluidique de gouttelettes pour l'analyse unicellulaire. Méthodes Mol. Biol. 853, 105–139 (2012).

Connell, J.L. et al. Sonder les comportements sociaux procaryotes avec des « pièges à homard » bactériens. mBio 1, e00202-10 (2010).

Decarlo, K., Emley, A., Dadzie, O. E. & Mahalingam, M. Microdissection par capture laser : méthodes et applications. Méthodes Mol. Biol. 755, 1–15 (2011).

Ozsolak, F. et al. Profilage d'expression génique numérique sans amplification à partir de quantités de cellules infimes. Méthodes naturelles 7, 619–621 (2010).

Linnarsson, S. Progrès récents dans les méthodes de séquençage de l'ADN - principes généraux de la préparation des échantillons. Exp. Rés. 316, 1339–1343 (2010).


Résumé

L'utilisation du séquençage d'ARN unicellulaire (scRNA-seq) dans la recherche sur la microglie augmente rapidement. Le flux de travail de base de cette approche consiste à isoler des cellules individuelles, suivi d'un séquençage. scRNA-seq est capable d'examiner l'hétérogénéité microgliale au niveau cellulaire. Cependant, les résultats obtenus en appliquant cette technique souffrent de divergences dues aux différences entre les caractéristiques des méthodes appliquées telles que le nombre de cellules séquencées et la profondeur de séquençage. Cette revue vise à faire la lumière sur les développements récents qui se sont produits dans ce domaine et comment ils sont liés aux méthodes utilisées. Pour ce faire, nous suivons les progrès et les limites des différentes méthodes scRNA-seq actuellement disponibles. La revue résume ensuite les connaissances actuelles acquises à l'aide de scRNA-seq dans le domaine de la microglie, y compris de nouvelles sous-populations associées à la fonction et au développement sous homéostasie ainsi que dans plusieurs conditions pathologiques telles que la maladie d'Alzheimer, la réponse lipopolysaccharidique et le VIH en relation avec les méthodes utilisées. Notre revue souligne que malgré les développements majeurs trouvés à l'aide de cette technique, les méthodes actuelles de scRNA-seq souffrent d'un coût élevé, de faibles rendements et de la non-standardisation des données générées. Le développement supplémentaire de méthodes scRNA-seq augmentera notre prise de conscience de l'hétérogénéité et de la plasticité de la microglie dans des conditions saines et pathologiques.


Matériaux et méthodes

Culture de cellules

Les cellules HeLa, HCT116 et HEK293T ont été incubées dans du milieu Eagle modifié de Dulbecco (DMEM) avec 10 % de sérum bovin nouveau-né plus 100 U de pénicilline/streptomycine (Hyclone) à 37 °C dans 5 % de CO2. La lignée cellulaire PTBP1 siRNA HeLa a été décrite dans [27].

Génération et séquençage de la bibliothèque Poly(A)-seq

L'ARN total a été extrait avec du Trizol et traité avec la RQ1 DNase (Promega) pour éliminer l'ADN. La qualité et la quantité de l'ARN purifié ont été déterminées en mesurant l'absorbance à 260 nm/280 nm (A260/A280) en utilisant Smartspec Plus (BioRad). L'intégrité de l'ARN a été en outre vérifiée par électrophorèse sur gel d'agarose à 1,5 %. L'ARN total a ensuite été fragmenté avec la RNase T1 à 37°C pendant 3 minutes. Pour chaque échantillon, 5,1 ug d'ARN total fragmenté ont été utilisés pour la préparation de la banque Poly(A)-seq. Les ARNm polyadénylés ont été capturés avec des billes magnétiques conjuguées à des oligo(dT) (Invitrogen). De plus, les adaptateurs 3' ont été ligaturés à l'extrémité 3' des ARNm capturés à l'aide du kit de préparation de bibliothèque GnomeGen sRNA-seq. Ensuite, la transcription inverse a été réalisée avec une amorce RT complétée par un adaptateur 3', suivie de la synthèse d'ADN avec un oligo Terminal-Tagging à l'aide du kit de préparation de bibliothèque ScriptSeq™ v2 RNA-Seq (épicentre). Les ADNc ont été purifiés et amplifiés par PCR par 18 cycles. Les produits de PCR correspondant à deux gammes de tailles, 250-350 bps et 300-500 bps, ont été purifiés, quantifiés et stockés à -80°C jusqu'à leur utilisation. Pour le séquençage à haut débit, les bibliothèques ont été préparées en suivant les instructions du fabricant et appliquées au système Illumina NextSeq 500 pour un séquençage à extrémité unique de 300 nt. Les données de séquençage d'origine sont accessibles sur GSE84287.

PA-finder : traitement des données Poly(A)-seq

Le pipeline de traitement de données Poly(A)-seq est décrit sur la figure 2A. Les appels de base ont été acquis auprès de NextSeq 500 à l'aide du logiciel de contrôle NextSeq 1.4. Après avoir coupé les séquences d'adaptateur poly(G) et 5', 3' des lectures brutes Poly(A)-seq, nous avons d'abord recherché les régions poly(A) dans les lectures. Nous avons commencé la recherche en scannant les lectures complètes et en trouvant la première séquence 9A (permettant un taux d'erreur de 0,1) la plus proche de l'extrémité 5' et 6A (permettant un taux d'erreur de 0,2) la plus proche de l'extrémité 3'. La séquence intermédiaire a été extraite en tant que région poly(A) préliminaire, et les lectures sans région poly(A) préliminaire ou avec poly(A) préliminaire < 10 nt ont été rejetées. Après avoir extrait la région poly(A) préliminaire, la séquence restante vers l'extrémité 5' des lectures a été utilisée pour la cartographie du génome humain de référence (GRCH38). Dans l'étape de mappage, au moins 20 nt étaient nécessaires et Tophat2 a été utilisé, permettant jusqu'à 2 mésappariements. Les lectures mappées de manière unique sur le génome humain ont été conservées pour l'analyse de la longueur poly(A). Ensuite, nous avons scanné la région poly(A) préliminaire pour étiqueter toutes les séquences non-A consécutives > = 5 nt de longueur. La séquence la plus longue dans la région ne contenant pas de non-As consécutifs a été déterminée comme la région poly(A) et la longueur a été comptée. Pour déterminer si une étiquette contenant du poly (A) était entièrement séquencée, nous avons recherché la séquence de l'adaptateur 3 'en aval de la région poly (A) dans les lectures brutes.

Pour éliminer le bruit du saignement du signal homopolymère dans les régions adaptatrices 3 'comme mentionné précédemment [14], nous avons ajouté un filtre supplémentaire. Nous avons identifié la position finale poly(A) montrant une forte diminution du score de qualité où trois As consécutifs montrant un score de qualité de base moyen inférieur à 25.

Pour comparer les résultats du profilage poly(A) entre Poly(A)-seq et les méthodes publiées, nous avons téléchargé des données pour PAL-seq [8], TAIL-seq [14] et PAT-seq à partir de la base de données GEO et appliqué notre Poly(A) )-seq pipeline d'analyse de données vers ces données avec des modifications mineures pour tenir compte de la différence dans les propriétés des données. Lectures à partir de souris et S. cerevisiae les échantillons ont été cartographiés sur les génomes de référence correspondants GRCm38.p3 et S228C. Étant donné que les données PAL-seq ne contiennent pas d'informations poly(A) pour chaque étiquette, nous n'avons pas pu analyser le ratio de lectures contenant poly(A) dans ces échantillons.

Préparation d'ARN de pointe

Des oligos d'ADN contenant une séquence poly(A) de 40 nt (Tianyi Huiyuan Inc., Wuhan) et une séquence poly(A) de 120 nt (IDT, Singapour) ont été synthétisés chimiquement pour générer des standards de longueur de queue poly(A).

La séquence poly(A) de 40 nt est située entre la séquence d'adaptateur d'extrémité 5' (5'-TAATACGACTCACTATAGGGTTTAACGCGAATTAATTCTGTGGAATGTGTGTCAGTTAGG-3') et la séquence d'adaptateur d'extrémité 3' (5'-CATTGCCTAGAGTCGGACTGA-3'). La séquence d'adaptateur d'extrémité 5' contenait la séquence de promoteur T7 et un segment de séquence plasmidique PcDNA3.1, et la séquence d'adaptateur d'extrémité 3' contenait la séquence de sites de coupure BsrD1. La séquence poly(A) de 120 nt est située entre la séquence d'adaptateur d'extrémité 5' (5'-TAATACGACTCACTATAGGGTCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTA-3') et la séquence d'adaptateur d'extrémité 3' (5'-CATTGCCTAGAGTCGGACTGA-3'). La séquence d'adaptateur d'extrémité 5' contenait une séquence de promoteur T7 de 20 nt qui était suivie d'une séquence plasmidique PcDNA3.1 de 40 nt ou 39 nt, et la séquence d'adaptateur d'extrémité 3' contenait un site de coupure BsrD1 permettant l'élimination complète du séquence adaptateur 3' avant in vitro transcription.

Les modèles d'ADN pour in vitro la synthèse de l'ARN de queue poly(A) à pointes a été amplifiée en utilisant l'amorce directe contenant la séquence du promoteur T7 (5'-TAATACGACTCACTATAGGG-3') et l'amorce inverse ciblant la séquence adaptatrice d'extrémité 3' (5'- TCAGTCCGACTCTAGGCA -3' ). Les produits de PCR ont été purifiés par VAHTS DNA Clean Beads (Vazyme, N411-03) puis coupés avec BsrD1 (NEB, R0574S) pour éliminer les séquences d'adaptateur d'extrémité 3', laissant la séquence de queue 3' poly(A) à la toute fin. du modèle. Le produit digéré par l'enzyme a été purifié sur gel en utilisant un kit de colonne Qiagen après électrophorèse sur un gel d'agarose à 4,0%. Les in vitro la transcription a été réalisée à l'aide du kit TranscriptAid T7 High Yield Transcription (Thermo, K0441). L'ARN de pointe de 80 nt obtenu (adaptateur de 40 nt suivi d'une queue poly(A) de 40 nt) et l'ARN de pointe de 160 nt (adaptateur de 40 nt suivi d'une queue poly(A) de 120 nt) ont été purifié sur un gel de polyacrylamide d'urée dénaturante à 12%.

Poly(A)-seq sur HiSeq X Ten et NovaSeq 6000 avec ARN total de cellules HeLa et ARN Spike-in

Pour chaque échantillon, 5 µg d'ARN total préparé à partir de cellules HeLa ont été utilisés. L'ARN total a été fragmenté par la RNase T1 (Thermo, EN0541), puis les fragments d'ARN contenant du poly(A) ont été capturés avec des billes magnétiques conjuguées à l'oligo(dT) (Invitrogen, 61005). Les ARN de pointe purifiés ont ensuite été ajoutés pour poursuivre la préparation de la bibliothèque, qui comprenait la ligature de l'adaptateur 3' (gnomegen, K02420-L) et la transcription inverse avec l'amorce RT complétée par l'adaptateur 3'. Le 2ème brin d'ADN a ensuite été synthétisé en utilisant le kit SMARTer® Stranded RNA-Seq (TAKARA, 634837). Les bibliothèques ont été séquencées à l'aide du kit à extrémités appariées de 150 nt sur Illumina HiSeq X Ten ou à l'aide du kit à extrémités appariées de 250 nt sur Illumina NovaSeq 6000 (Novogene, Pékin). Les données de séquençage d'origine sont accessibles sur GSE84287.

Au cours de l'analyse des données, les lectures poly(A) de pointe ont été récupérées en les alignant avec la séquence d'adaptateur 5' unique à l'aide de Tophat2. La longueur de la queue poly(A) a été calculée à l'aide de pA-finder. Pour l'ARN de pointe de 160 nt contenant la séquence de queue poly(A) de 120 nt, ses lectures de séquençage de 150 nt à partir de l'extrémité 1 étaient composées de 6 nt de la séquence de la banque, 39 nt de la séquence adaptateur 5' ( unique à chaque spike-in) et une séquence poly(A) de 104 nt.

Pour l'analyse des lectures NovaSeq Poly(A)-seq, nous avons exécuté pA-finder une fois en utilisant les paramètres par défaut, et une autre fois en utilisant le filtre supplémentaire en identifiant la position finale de poly(A) montrant une forte diminution comme décrit ci-dessus.

Mesure de la longueur de la queue poly(A) à l'aide d'une méthode basée sur la PCR

To validate the alteration of poly(A) length of individual genes, we used Poly(A) Tail-Length Assay Kit (Affymetrix, 76455) that is based on high resolution poly(A) tail (Hire-PAT) assay [14] as described in the manufacture’s instruction to measure poly(A) length in HeLa cell and HCT116 cell. In brief, total RNA was isolated and guanosine and inosine (G/I) residues were tailed to the 3’ end. The tailed-RNAs are reverse-transcribed using the newly added G/I tails as the priming sites. PCR amplification was performed using two primer sets: (1) a gene-specific forward and reverse primer set designed upstream of the polyadenylation site as a control and (2) a gene-specific forward primer and the universal reverse primer which is provided with the kit to generate a product including poly(A) length. Used gene-specific primers are as follows: NPM1 (forward, 5’-GTTGTCCAAAATGCCTGT-3’ reverse, 5’- ATACTGAGTTTTATTTCACATG-3’ ), ACTB (forward, 5’- AGAATGGCCCAGTCCTCTC-3’ reverse, 5’-AACTGGTCTCAAGTCAGTGTAC-3’ ), and GAPDH (forward, 5’-GCAAGAGCACAAGAGGAAGAG-3’ reverse, 5’- AACTGGTTGAGCACAGGGTA-3’ ). PCR products were detected by polyacrylamide gel electrophoresis.

The poly(A) lengths of the in vitro transcribed 40-nt poly(A)-tail spike-in RNAs were also confirmed by the same method using the spike-in backbone sequence-specific forward primer 5’- GTGGAATGTGTGTCAGTTAGG-3’ .


Overview of RNA-seq

RNA-seq, also known as whole transcriptome shotgun sequencing (WTSS), employs the NGS technologies to sequence cDNA directly from a RNA sample of interest (Morozova et al., 2009 Wilhelm et al., 2008). Transcriptome analysis by RNA-seq is a three-step method, including library construction, sequencing on a specific NGS platform, and bioinformatic analysis (Fig. 1). In the remainder of this section, we will explain each step of a typical RNA-seq experiment and discuss the accompanying challenges and the possible solutions.

FIGUE. 1. Illustration of RNA-Seq data analysis pipeline.

Library construction

The library preparation is a key step for RNA-seq as it determines to a large extent how accurately the final sequencing data reflects the original transcriptome. The first procedure in this step is to collect appropriate samples, usually tissues, to be analyzed. One key concern here is the invariably heterogeneous nature of tissues. This is because tissues typically contain tens or hundreds of unique cell types, and thus, transcriptomic analysis of a tissue confounds the real transcriptomic profiles of its constituent cell types (Islam et al., 2011 Shapiro et al., 2013). One solution to this problem is to analyze single cells rather than cell populations. In fact, various single-cell isolation methods have been developed and already coupled with RNA-seq technology in practice (Shapiro et al., 2013). This single-cell RNA-seq lets many previously impossible applications in both basic and clinical research become possible, such as characterization of the initial differentiation events in embryogenesis (Tang et al., 2009 2010), the investigation of tumor heterogeneity (Dalerba et al., 2011), transcriptomic analysis of rare, transiently existing adult stem cells (Lister et al., 2011), and others.

Following sample collection, total RNA is usually prepared via organic extraction and/or absorption onto silica-membranes of spin columns. Next, RNA is converted to a library of cDNA fragments. Although total RNA can be directly used, total RNA has to be fractionated in most cases. This is because the rRNA, making up more than 80% of total cellular RNA (Lindberg and Lundeberg, 2010), is usually not the research focus, and its presence greatly reduces the useful transcript coverage in the following sequencing step. Total RNA samples are therefore processed either by direct selection of poly(A) RNA or by selective removal of rRNA (ribo-depletion) (Costa et al., 2010). Oligo(dT)-based mRNA purification procedure, widely used in eukaryotes, takes advantage of the presence of a poly(A) tail at the 3′ of eukaryotic mRNA. A large fraction of non-ribosomal RNAs (both coding and noncoding) in eukaryotes, however, lacks the poly(A) tail and is therefore missed (Jacquier, 2009). When compared to the poly(A) RNA selection, the ribo-depletion method is preferred since it enriches all nonribosomal RNA species, including nonpoly(A) mRNA, preprocessed RNA, tRNA, and other ncRNAs with known or unknown functions (Lindberg and Lundeberg, 2010). Although many different rRNA depletion methods have been developed, the two most popular ones are (He et al., 2010 Wilhelm and Landry, 2009): (1) hybridization capture of rRNA by the biotin-labeled anti-rRNA probes, followed by removal with streptavidin-coated magnetic beads and (2) selective degradation of rRNA by a 5′-3′ exonuclease that specifically recognizes rRNA with a 5′ phosphate.

A double-stranded cDNA library is then prepared via either RNA fragmentation (RNA hydrolysis or nebulization) prior to the reverse transcription or reverse transcription first followed by cDNA fragmentation (DNase I treatment or sonication) (Roberts et al., 2011 Wang et al., 2009). The purpose of fragmentation is to reach the desired length for NGS technologies (Metzker, 2009). Each of these two fragmentation methods causes a different bias in final results. Particularly, cDNA fragmentation usually generates an under-representation of the 5′ of the transcripts in the data, while RNA fragmentation allows a good representation of the transcript body but causes depleted transcript ends (Mortazavi et al., 2008 Nagalakshmi et al., 2008). Additionally, the process of reverse transcription can also complicate final RNA-seq data due to the tendency of reverse transcriptase to generate spurious second-strand cDNA and the artificial chimeric transcripts introduced by template switching (Ozsolak and Milos, 2011b).

After the generation of fragmented cDNA, sequencing adapters are ligated to both ends of the fragments. During this process, information about the orientation of transcripts is completely lost. Fortunately, strand-directionality information can be maintained by converting cytidine into uridine with sodium bisulfate (He et al., 2008) the resulting C–T transition position then labels the coding strand of each transcript. Other approaches that maintain the strand specificity are involved with how the adaptors are ligated to the cDNA fragments, and these methods are well reviewed elsewhere (Costa et al., 2010 Marguerat and Bähler, 2010). Like the process of fragmentation, adaptor ligation may also introduce coverage non-uniformity since the fidelities of DNA ligases cannot be guaranteed (Faulhammer et al., 2000).

Séquençage

The sequencing step relies on the NGS technologies. The three most popular, massively parallel NGS platforms, are currently dominating the NGS market and widely used in RNA-seq, including the 454 pyrosequencing system (a subsidiary of Roche), the AB SOLiD system (Life Technologies), and the Illummina Genome Analyzer (Illumina) (Liu et al., 2012a Marguerat and Bähler, 2010). All these three NGS platforms rely on an in vitro cloning step (clonal amplification) to amplify each fragmented cDNA molecule in a cell-free system, because their sensitivities are not high enough for the single molecule sequencing (Metzker, 2009). Specifically, both the 454 and the SOLiD systems employ an innovative emulsion PCR. In the emulsion PCR, the cDNA fragments from a library are attached to beads and subsequently compartmentalized in the aqueous droplets of a water-in-oil emulsion such that each droplet contains a single DNA molecule the segregated template fragments are then amplified in the tiny aqueous droplets of the emulsion (Dressman et al., 2003). Different from the 454 and the SOLiD systems, the Illummina Genome Analyzer performs a so-called bridge PCR amplification, in which the adapter-linked, single-stranded cDNA fragments are first immobilized on a glass slide by oligonucleotide hybridization in a bridging way, followed by clonal PCR amplification (Adessi et al., 2000 Fedurco et al., 2006). Clonal amplification results in a population of identical templates, each of which is subjected to the following sequencing reaction. Due to PCR artifacts, clonal amplication may introduce bias in the RNA-seq results as well. One way to discriminate PCR artifacts is to perform different biological replicates and determine whether same short reads are concurrently present in different replicates (Wang et al., 2009).

NGS platforms use different sequencing strategies (Metzker, 2009). The sequencing mechanism employed by Roche 454 is pyrosequencing, which is a nonelectrophoretic, bioluminescence-based method (Metzker, 2009 Ronaghi et al., 1998). In brief, every bead, containing the clonally amplified template originating from a single cDNA molecule, is transferred to a ∼29 μm well on a Picotiter Plate (a fiberoptic chip). A mixture of enzymes, such as DNA polymerase, ATP sulfurylase, and luciferase, are also packed into each well. The four DNA nucleotides are added sequentially in a fixed order across the Picotiter Plate during a sequencing run. When one or more complementary nucleotides are added, it generates a light signal that is recorded by the camera in the instrument. The signal strength is proportional to the number of nucleotide added. For the SOLiD system, a mechanism, known as sequencing by ligation (SBL), is used (Landegren et al., 1988 Metzker, 2009 Shendure and Ji, 2008). In its simplest form, after clonal amplification, a sequencing primer is hybridized to template with 3′ at position ‘n’. A set of four fluorescently labeled di-base-encoded probes (8 bp oligonucleotides) then compete for ligation to the sequencing primer. The best-matching probe is linked to the primer by DNA ligase, followed by removal of nonligated probes by wash. Fluorescence imaging is then done to determine the identity of the ligated probe. Following a series of ligation cycles, the extension product is removed and the template is reset with the second sequencing primer with 3′ at the ‘n-1′ position for a second round of ligation cycles. After five rounds of primer reset, each base is examined twice by two different primers, although SOLiD is hence not running as fast as other methods. Last, the method of cyclic reversible termination (CRT) is used by IIIumina (Bentley et al., 2008). CRT is a cyclic sequencing-by-synthesis method that differs from SBL in its use of nucleotide monomer and DNA polymerase. In particular, four types of reversible terminator bases are added in the presence of DNA polymerase and template, and after incubation non-incorporated nucleotides are washed away. Imaging is then performed to determine the identity of the incorporated nucleotide, and, then the dye and the terminal 3′ blocker are chemically removed, allowing for the next cycle to begin. In addition to CRT, ion semiconductor sequencing (Life Technologies) uses a method of “sequencing by synthesis” as well, which is based on the detection of hydrogen ions released during the polymerization of DNA. The major benefits of this method are rapid sequencing speed and low operating costs (Rothberg et al., 2011). Several reviews describing the mechanisms and comparing the advantages and disadvantages of these NGS technologies were published elsewhere (Ansorge, 2009 Liu et al., 2012a Metzker, 2009 Shendure and Ji, 2008).

Despite the popularization of the NGS technologies, the so-called third generation sequencing methods, also known as single-molecule sequencing methods, are on their way. These methods, such as Heliscope sequencing and single-molecule real-time (SMRT) (Pacific Biosciences), are featured by omission of template clonal amplification and real-time signal capture (Liu et al., 2012a). Heliscope sequencing has already been used for a published RNA-seq study (Ozsolak et al., 2010). Additionally, the single-molecule direct RNA sequencing (DRS) technology, developed by Heliscope, is emerging. DRS sequences RNA molecules directly in a massively-parallel manner without biasing sample manipulations such as RNA reverse transcription, ligation, and clonal amplification (Ozsolak and Milos, 2011a). However, these technologies are at varying stages of development and suffer from many drawbacks, such as low single-pass accuracy (81%∼83%), low sequencing efficiency, and low throughput (Niedringhaus et al., 2011 Schadt et al., 2010).

Bioinformatic analysis

After the signal processing, NGS platforms generate millions of short sequences, termed reads, associated with their base-call quality scores that indicate the reliability of each base call. The lengths of these short reads are within a range of 25–450 bp, depending on the type of NGS platform. The resulting reads are categorized into three types: exonic reads, exon–intron junction reads, and poly(A) reads (Fig. 2) (Wang et al., 2009). Although the application of NGS technologies in RNA-seq makes transcriptomic sequences handy, the analysis of the huge amount of RNA-seq data are still the bottleneck for understanding the transcriptome. Fortunately, during the past few years, various bioinformatic tools (software) for RNA-seq data analysis have been developed. Especially, the significance of Bioconductor should be emphasized here. Bioconductor is a free, open source, and open development software project, mainly based on the R programming language, for the analysis and annotation of RNA-seq data and other types of high-throughput genomic data (Gentleman et al., 2004). Most Bioconductor components are organized as R packages. These Bioconductor packages and other software for RNA-seq data analysis have been well reviewed elsewhere (Chen et al., 2011 Febrer et al., 2011 Oshlack et al., 2010). Nowadays, researchers can routinely combine these tools to form the best analysis pipeline per their research interests.

FIGUE. 2. Short reads mapping and quantification of the digital signal (modified from Wang et al., 2009). The resulting reads are aligned against a reference genome and fall into three groups, including exonic reads (vert), junction reads (red-brown), and poly(A) end reads (bleu) (Wang et al., 2009). These reads are used to generate an expression profile with a single-base resolution.

A typical analysis pipeline of RNA-seq data is outline in Figure 1. Quality assessment is the first step for the RNA-seq data analysis. To ensure a coherent final result, low-quality sequences, over-represented sequences, and adapter sequences have to be filtered out, and this step can be accomplished with Bioconductor packages, such as ShortRead (Morgan et al., 2009) and Biostrings (Pages et al., 2009). Once high-quality reads have been obtained, these short reads are subsequently aligned to a reference genome or transcriptome. Alignment is usually done with software outside Bioconductor. In contrast to conventional alignment algorithms, these software are based on the indexing strategies that are able to align millions of short reads in a reasonable period of time (Langmead et al., 2009). Basically, these aligners fall into two categories: one is based on the Burrows-Wheeler transform algorithm, such as Bowtie (Langmead et al., 2009) and BWA (Li and Durbin, 2010), and the other based on Needleman-Wunsch or Smith-Waterman algorithm, such as GNUMAP (Clement et al., 2010), BFAST (Homer et al., 2009), and SHRiMP (Rumble et al., 2009). The aligners in the first category is much faster, the aligners in the second category, however, despite more time needed, are usually more sensitive and generate more reads correctly aligned (Garber et al., 2011). Since many reads span exon–exon junctions and therefore cannot be directly aligned, specialized aligners (spliced aligners), such as Erange (Trapnell et al., 2009) and IsoformEx (Kim et al., 2011), are developed to split the junction reads and then independently align the split read fragments. The methods available to study RNA splicing from short RNA-Seq data have been well reviewed elsewhere (Alamancos et al., 2013). When the reference genome or transcriptome is unavailable, de novo transcriptome assembly can be performed (Robertson et al., 2010). De novo assembly is used for most fish studies using RNA-seq because only limited fish species have the whole genome information. De novo assembly software, for instance, ABySS (Simpson et al., 2009), Velvet (Zerbino and Birney, 2008), and Trinity (Grabherr et al., 2011), use a de Bruijn graph approach, which aligns the user-defined sequence overlap (referred as k-mer) between two reads to create contigs (Grabherr et al., 2011). Transcriptome de novo assembly is impeded by the repeats within huge amounts of short reads, alternatively spliced transcripts, as well as biased transcriptome sequencing coverage (Liu et al., 2012b). Therefore, different improvements for the de Bruijn graph approach, such as using various k-mer lengths instead of a single one, have been made to optimize transcriptome assembly (Surget-Groba and Montoya-Burgos, 2010). Besides, a reference proteome or genome from an evolutionarily linked species can be used to aid de novo Assemblée.

Once all reads have been appropriately filtered and mapped or assembled, they can then be counted, and gene expression levels can thus be inferred from the total counts of reads belonging to the exons of a particular gene. In this way, an expression score can be assigned to every base, leading to a genome-scale transcriptome map in terms of quality and quantity (Fig. 2). The single-base (digital) resolution of RNA-seq allows for detection of gene expression at the isoformic and allelic levels and discovery of previously unannotated genes (Jiang and Wong, 2009 Levin et al., 2009 Oshlack et al., 2010 Trapnell et al., 2010). RNA-seq analysis allows not only quantifying gene expression levels within a single RNA sample but also detecting differential expression (DE) across treatments or conditions (Kvam et al., 2012 Oshlack et al., 2010) the latter is usually the real interest of most studies. However, for the DE analysis of RNA-seq data, normalization has to be performed to adjust for between-sample differences such as library size and within-sample gene-specific features regarding GC content and gene length (Dillies et al., 2012 Kvam et al., 2012). There is no standard method to detect DE due to the short history of RNA-seq technology. The currently popular tools for DE analysis in Bioconductor include edger (Robinson et al., 2010), DESeq (Anders and Huber, 2010), baySeq (Hardcastle and Kelly, 2010), and tweeDEseq (Esnaola et al., 2013), and methods, not included in Bioconductor, also exist, such as ShrinkBayes (Van De Wiel et al., 2013) and TSPM (Auer and Doerge, 2011). These DE analysis tools have already been reviewed in detail and well compared in their gene ranking performances (Dillies et al., 2012 Kvam et al., 2012 Soneson et al., 2013). In addition, RNA-Seq analysis can also enable us to detect SNPs, fusion genes, and post-transcriptional gene regulation, such as RNA editing, RNA degradation, and RNA translation (Marguerat and Bähler, 2010).


Remerciements

Le financement

HD was funded by a National Science Foundation Graduate Research Fellowship RHC and JAK by the NIH (1U01MH098937) JE and JK by the NIH (5U01MH098953-04) KZ by the NIH (U01MH098977).

Availability of data and material

The dataset supporting the conclusions of this article is available in the NCBI’s Gene Expression Omnibus repository, [GEO: GSE88850]. Code used is available upon request to the corresponding author. Correspondence and material requests should be addressed to Junhyong Kim.

Contributions des auteurs

RHC, JE, JAK, KZ and JK designed the study. HD and JK designed and performed computational analysis. RA, AC, BD, RD, OVE, JF, SAF, JSH, TKK, JMK, MYL, RL, WJM, SM, JN, JS, NS, TS, JMS, CPW, JW, KW, AW, WW and LZ prepared and quality controlled RNA-seq samples, and performed preliminary processing of the sequence data. HD and JK wrote the manuscript. Tous les auteurs ont lu et approuvé le manuscrit final.

Intérêts concurrents

Jian-Bing Fan and Neeraj Salathia work for Illumina Inc. This company manufactures the Fluidigm C1 Smart system, one of the protocols tested in this paper. Illumina provided materials and technical support for Fluidigm C1 data used in this paper. Remaining authors have no competing interests.

Consentement à la publication

Approbation éthique et consentement à participer


Sequencing by Synthesis (SBS) Technology

Illumina sequencing technology, sequencing by synthesis (SBS), is a widely adopted next-generation sequencing (NGS) technology worldwide, responsible for generating more than 90% of the world's sequencing data. 1 Illumina sequencing instruments and reagents support massively parallel sequencing using a proprietary method that detects single bases as they are incorporated into growing DNA strands.

A fluorescently labeled reversible terminator is imaged as each dNTP is added, and then cleaved to allow incorporation of the next base. Since all 4 reversible terminator-bound dNTPs are present during each sequencing cycle, natural competition minimizes incorporation bias. 2

The end result is true base-by-base sequencing that enables accurate data for a broad range of applications. The method virtually eliminates errors and missed calls associated with strings of repeated nucleotides (homopolymers).

Vidéo sur la technologie de séquençage

Further Advantages of SBS Technology

Illumina sequencing by synthesis technology supports both single-read and paired-end libraries. SBS technology offers a short-insert paired-end capability for high-resolution genome sequencing, as well as long-insert paired-end reads for efficient sequence assembly, de novo sequencing, and more.

The combination of short inserts and longer reads increases the ability to fully characterize any genome.

Illumina Sequencing Introduction

This overview describes major sequencing technology advances, key methods, the basics of Illumina sequencing chemistry, and more.


Voir la vidéo: DNA libraries u0026 generating cDNA. Biomolecules. MCAT. Khan Academy (Décembre 2022).