Informations

Base de données des cellules cancéreuses

Base de données des cellules cancéreuses


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je recherche une base de données (ou tout type de source d'information) de cellules cancéreuses, qui contient des informations sur la vitesse de reproduction de ces cellules, leur vitesse de croissance, etc.

Je pourrais donc rendre ma simulation aussi précise que possible, aussi proche de la réalité que possible (je travaille sur le développement d'un logiciel qui simule la propagation des cellules cancéreuses).

Éditer

Êtes-vous intéressé par les taux de croissance en culture ou in vivo (par exemple les tumeurs)

D'accord, je suis un Noob en biologie, alors laissez-moi l'expliquer comme ça. J'utilise des graphiques de Voronoï pour la simulation, je pense donc que je m'intéresse au niveau de la tumeur, à la façon dont chaque cellule interagit les unes avec les autres, et donc à quelle vitesse les cellules cancéreuses peuvent-elles surpeupler les cellules saines (ou d'autres cellules cancéreuses).


Le National Cancer Institute (NCI) a une liste de temps de doublement pour une variété de lignées cellulaires couramment utilisées, voir https://dtp.cancer.gov/discovery_development/nci-60/cell_list.htm

D'après mon expérience, ces temps de doublement sont assez stables/reproductibles, à condition que les cellules soient maintenues dans des conditions de culture standard. Bien que les temps de doublement diffèrent beaucoup entre les lignées cellulaires, leur taille est également très différente et les cellules plus grandes ont tendance à avoir des temps de doublement plus longs, de sorte que le biomasse le taux de croissance est en fait assez similaire entre les lignes.

Noter: ces temps de doublement se réfèrent aux conditions de culture cellulaire. Tumeurs réelles in vivo croître beaucoup plus lentement, en raison du manque de nutriments, de la suppression par les cellules immunitaires, etc. L'estimation des taux de croissance cellulaire dans les tumeurs est une affaire beaucoup plus compliquée, et je ne connais aucune base de données pour cela.


Caractéristiques des cellules cancéreuses

Les cellules cancéreuses se développent et se divisent à une vitesse anormalement rapide, sont peu différenciées et ont des membranes, des protéines du cytosquelette et une morphologie anormales. L'anomalie dans les cellules peut être progressive avec une transition lente des cellules normales aux tumeurs bénignes et aux tumeurs malignes.

En 2000, les biologistes du cancer Robert Weinberg et Douglas Hanahan ont publié un article intitulé « Les caractéristiques du cancer ». Malgré cela, ils ont répertorié six altérations essentielles de la physiologie cellulaire qui caractérisent la malignité.

  1. Autosuffisance en signaux de croissance : les cellules cancéreuses acquièrent une pulsion autonome de prolifération - mitose pathologique - grâce à l'activation d'oncogènes tels que ras ou myc.
  2. Insensibilité aux signaux inhibiteurs de croissance (anti-croissance) : les cellules cancéreuses inactivent les gènes suppresseurs de tumeurs, tels que Rb, qui inhibent normalement la croissance.
  3. Évasion de la mort cellulaire programmée (apoptose) : les cellules cancéreuses suppriment et inactivent les gènes et les voies qui permettent normalement aux cellules de mourir.
  4. Potentiel de réplication illimité : les cellules cancéreuses activent des voies génétiques spécifiques qui les rendent immortelles même après des générations de croissance.
  5. Angiogenèse soutenue : les cellules cancéreuses acquièrent la capacité de puiser leur propre apport de sang et de vaisseaux sanguins - angiogenèse tumorale.
  6. Invasion tissulaire et métastase : les cellules cancéreuses acquièrent la capacité de migrer vers d'autres organes, d'envahir d'autres tissus et de coloniser ces organes, entraînant leur propagation dans tout le corps.

Contenu �. Tous les droits sont réservés.
Date de dernière modification : 4 mai 2016.
Créé par Wayne W. LaMorte, MD, PhD, MPH,


Ressources interactives pour les écoles

Des globules rouges

Transporter de l'oxygène dans le sang. Ils sont également appelés érythrocytes.

Vaisseaux sanguins

Les tubes à travers lesquels le sang est transporté dans le corps, par exemple les artères, les veines et les capillaires

Chimiothérapie

Traitement de la maladie à l'aide de médicaments qui détruisent les cellules cancéreuses

Radiothérapie

Traitement de la maladie à l'aide de rayons X ou de substances radioactives qui tuent les cellules

Moelle

Présent au centre des os, il contient des cellules souches adultes qui se divisent et se différencient pour produire des globules rouges et blancs.

Neurones

Cellules adaptées pour véhiculer des informations sous forme d'impulsions électriques

Hormone

Messager chimique produit par une glande ou des cellules particulières du système endocrinien. Les hormones sont transportées dans tout le corps dans la circulation sanguine, mais elles ne produisent une réponse que dans des cellules cibles spécifiques

Tissu

Un groupe de cellules dans un organisme qui sont spécialisées pour travailler ensemble pour remplir une fonction particulière.

Le foie

Un grand organe dans la partie supérieure de l'abdomen qui fabrique, stocke et décompose les substances requises par le corps

Division cellulaire, mitose et cancer

Les organismes multicellulaires, comme les humains, sont constitués de milliards de cellules. Ces cellules ont besoin de se diviser et de se copier pour diverses raisons. Par exemple:

  • les cellules s'usent et doivent être remplacées
  • de nouvelles cellules permettent au corps de réparer les tissus endommagés
  • de nouvelles cellules permettent au corps de se développer

Mitose

La forme la plus courante de division cellulaire est appelée mitose. Il est utilisé pour la croissance et la réparation. Au cours de la mitose, une cellule fait une copie exacte d'elle-même et se divise en deux nouvelles cellules. Chaque cellule contient une copie exacte des chromosomes de la cellule d'origine dans leurs 23 paires. C'est la raison pour laquelle toutes les cellules d'un organisme sont génétiquement identiques.

Pour en savoir plus sur la mitose, consultez la ressource sur les gènes et l'héritage de l'ABPI.

Cancer : une mitose hors de contrôle

La mitose est étroitement contrôlée par les gènes à l'intérieur de chaque cellule. Parfois, ce contrôle peut mal tourner. Si cela se produit dans une seule cellule, il peut se répliquer pour créer de nouvelles cellules également incontrôlables. Ce sont des cellules cancéreuses. Ils continuent à se répliquer rapidement sans les systèmes de contrôle dont disposent les cellules normales. Les cellules cancéreuses formeront des grumeaux, ou tumeurs, qui endommageront les tissus environnants. Parfois, les cellules cancéreuses se détachent de la tumeur d'origine et se propagent dans le sang à d'autres parties du corps. Lorsqu'une tumeur se propage à une autre partie du corps, on dit qu'elle s'est métastasée. Ils continuent de se répliquer et de faire plus de tumeurs. Celles-ci sont appelées tumeurs secondaires.

Les médicaments utilisés pour traiter le cancer visent parfois à tuer les cellules qui se divisent rapidement par mitose. Ils inhibent la synthèse ou la fonction de l'ADN - ce type de traitement est appelé chimiothérapie. Les médicaments plus modernes ciblent des cancers spécifiques de différentes manières. Beaucoup inhibent les signaux de croissance pour ce type de cellule.

Combattre le cancer : empêcher les cellules tumorales de croître

Il existe de nombreux types de cancer. Ils dépendent du type de cellule d'origine qui a commencé à se répliquer de manière incontrôlable. Cela signifie qu'il n'y a pas qu'un seul traitement contre le cancer. Les traitements peuvent comprendre une combinaison de chirurgie, de médicaments et de radiothérapie (radiothérapie).

Alors que les chercheurs en sont venus à mieux comprendre les cancers, de nouvelles thérapies ciblées sont constamment développées. Par exemple, un type de cancer du sein qui est influencé par l'hormone œstrogène peut être traité avec une hormonothérapie qui bloque l'action ou la synthèse de l'œstrogène. D'autres médicaments peuvent bloquer les signaux de croissance de la cellule cancéreuse et ainsi ralentir le développement d'une tumeur ou bloquer la croissance de nouveaux vaisseaux sanguins en tumeurs. Cela « affame » efficacement les cellules cancéreuses des nutriments dont elles ont besoin pour se développer.

Question 3

La mitose est impliquée dans la croissance, la réparation et le remplacement des cellules. Toutes les cellules ne traversent pas la mitose à la même vitesse.

Regardez les types de cellules ci-dessous et décidez à quelle fréquence elles sont remplacées par la mitose. Dans chaque cas, choisissez une réponse à l'aide des boutons radio.


Les méta-bases de données sont des bases de données de bases de données qui collectent des données sur les données pour générer de nouvelles données. Ils sont capables de fusionner des informations provenant de différentes sources et de les rendre disponibles sous une forme nouvelle et plus pratique, ou en mettant l'accent sur une maladie ou un organisme particulier. traitement de l'information. Le mot metadatabase est un ajout au dictionnaire]. à l'origine, les métadonnées n'étaient qu'un terme courant se référant simplement à données sur les données telles que les balises, les mots-clés et les en-têtes de balisage.

    : une base de données d'interactions fonctionnelles moléculaires, intégrant des informations de 12 autres (National Center for Biotechnology Information) (Université de Californie, San Diego) : intègre des centaines de ressources pertinentes en neurosciences dont beaucoup sont énumérées ci-dessous

Les bases de données d'organismes modèles fournissent des données biologiques approfondies pour des études intensives.

Bases de données ADN Modifier

Bases de données primaires
La base de données internationale de séquences nucléotidiques (INSD) se compose des bases de données suivantes.

DDBJ (Japon), GenBank (États-Unis) et European Nucleotide Archive (Europe) sont des référentiels pour les données de séquences nucléotidiques de tous les organismes. Tous les trois acceptent les soumissions de séquences nucléotidiques, puis échangent quotidiennement des données nouvelles et mises à jour pour obtenir une synchronisation optimale entre eux. Ces trois bases de données sont des bases de données primaires, car elles contiennent des données de séquence originales. Ils collaborent avec Sequence Read Archive (SRA), qui archive les lectures brutes à partir d'instruments de séquençage à haut débit.

    base de données (Online Mendelian Inheritance in Man) : maladies héréditaires : lancée en janvier 2008. Les génomes de plus d'un millier de participants anonymes de plusieurs groupes ethniques différents ont été analysés et rendus publics. une ressource orthologique hiérarchique, fonctionnellement et phylogénétiquement annotée, basée sur 5090 organismes et 2502 virus. Il fournit des alignements de séquences multiples et des arbres de probabilité maximale, ainsi qu'une large annotation fonctionnelle. [4][5]

Bases de données d'expression génique (principalement des données de microarray) Modifier

Ces bases de données collectent les séquences du génome, les annotent et les analysent, et sont accessibles au public. Certains ajoutent la conservation de la littérature expérimentale pour améliorer les annotations calculées. Ces bases de données peuvent contenir de nombreux génomes d'espèces ou un seul génome d'organisme modèle.

  • ArrayExpress : [6] archive de données de génomique fonctionnelle stocke les données d'expériences de génomique fonctionnelle à haut débit de l'EMBL : fournit des bases de données d'annotation automatique pour les génomes humains, souris, autres vertébrés et eucaryotes : fournit des données à l'échelle du génome pour les bactéries, les protistes, les champignons, les plantes et des métazoaires d'invertébrés, à travers un ensemble unifié d'interfaces interactives et programmatiques (utilisant la plateforme logicielle Ensembl) : génome de l'organisme modèleDrosophila melanogaster
  • Gene Expression Omnibus (GEO [7] ) : un référentiel public de données génomiques fonctionnelles du National Cancer Institute (NCI) des États-Unis, qui prend en charge les données basées sur les puces et les séquences. Des outils pour interroger et télécharger des profils d'expression génique sont fournis. (HPA [8] ) : une base de données publique avec des profils d'expression de gènes codant pour des protéines humaines à la fois au niveau de l'ARNm et des protéines dans les tissus, les cellules, les compartiments subcellulaires et les tumeurs cancéreuses. (LIS) : base de données génomique de la famille des légumineuses [9] : génomes humains de 100 000 volontaires du monde entier
  • RGD (Rat Genome Database) : données génomiques et phénotypiques pour Rattus norvegicus : [10] génome de l'organisme modèle de levure [11] (SoyBase) : USDA soybean Genetics and Genomic Database (Soybean) : génome des espèces causant le paludisme (Plasmodium falciparum et autres) : génome de l'organisme modèle Caenorhabditis elegans et WormBase ParaSite pour les espèces parasitaires : génome de l'organisme modèleXenopus tropicalis et Xenopus laevis : génome de cet organisme modèle poisson

Bases de données phénotypiques Modifier

    : base de données d'interaction pathogène-hôte. Il relie les informations génétiques aux informations phénotypiques des agents pathogènes microbiens sur leurs hôtes. Les informations sont sélectionnées manuellement à partir de la littérature évaluée par les pairs.
  • RGD Rat Genome Database : données génomiques et phénotypiques pour Rattus norvegicus base de données : données phénotypiques sélectionnées manuellement pour la levure Schizosaccharomyces pombe

Bases de données d'ARN Modifier

Bases de données de séquences de protéines Modifier

    : base de données des preuves expérimentales de désordre dans les protéines (Indiana University School of Medicine, Temple University, University of Padua) : classe les protéines en familles et prédit la présence de domaines et de sites : base de données d'annotation intrinsèque de trouble de protéine (Université de Padoue) : a human protein-centric knowledge resource : protein Families Database of Alignments and HMMs (Sanger Institute) : a compendium of protein fingerprints from (Manchester University) : database of protein families and domains (Georgetown University Medical Center [GUMC]) : bibliothèque de HMMs représentant superfamilles et base de données d'annotations (superfamille et famille) pour tous les organismes complètement séquencés : base de connaissances sur les protéines (Swiss Institute of Bioinformatics) : séquences de protéines et base de connaissances (National Center for Biotechnology Information)

Bases de données sur la structure des protéines Modifier

    (PDB), comprenant :
    • Banque de données de protéines en Europe (PDBe) [12]
    • ProteinDatabank au Japon (PDBj) [13]
    • Collaboratoire de recherche en bioinformatique structurale (RCSB) [14]

    Pour plus de bases de données sur la structure des protéines, voir également Base de données sur la structure des protéines.


    Biologie du cancer

    Bienvenue au département de biologie du cancer de MD Anderson. Notre département est depuis longtemps un leader dans le domaine de la recherche fondamentale et translationnelle en biologie du cancer. Le département met l'accent sur la formation des étudiants, des stagiaires postdoctoraux et des stagiaires cliniques aux principes fondamentaux de la biologie des tumeurs afin d'améliorer les résultats des patients atteints de tumeurs malignes. Le département a construit un programme avec des liens étroits avec de nombreux départements cliniques pour faciliter l'échange d'informations entre le laboratoire et la clinique. En tant que tels, les professeurs du département sont des chercheurs sur les subventions de recherche collaborative en biologie du cancer financées par les NIH [« programmes spécialisés d'excellence en recherche » (SPORE)]. De plus, plusieurs médecins-chercheurs ont des nominations conjointes en biologie du cancer, facilitant l'échange d'informations cliniquement pertinentes entre le laboratoire et la clinique.

    Le département de biologie du cancer sert également de département « d'ancrage » pour le centre de recherche sur les métastases, un programme intégré impliquant des chercheurs de l'ensemble du MD Anderson. L'un de nos membres du corps professoral dispose d'un laboratoire dans le Smith Research Building, où de nombreuses installations de base (vivarium, microscopie électronique, etc.) sont à la disposition du chercheur. En collaboration avec le Metastasis Research Center, le département de recherche en biologie du cancer organise une série de séminaires hebdomadaires où des chercheurs de renommée nationale et internationale donnent des conférences formelles, et les professeurs et les stagiaires présentent les données en cours. Le département parraine également sciChat, une conférence « tableau » présentant des histoires sur la trajectoire de carrière et la poursuite scientifique de nos éminents conférenciers. Le « Smith Lectureship », parrainé par le département et le Metastasis Research Center, est une conférence annuelle dotée qui met en lumière le travail de leaders de renommée internationale dans le domaine de la recherche en biologie du cancer.

    En plus de leurs recherches sur la biologie du cancer, la faculté se consacre à l'éducation et à la formation de la prochaine génération de chercheurs de haut niveau sur le cancer et à faire une différence dans la vie des patients atteints de cancer. Les étudiants diplômés et les boursiers postdoctoraux jouent un rôle essentiel dans les activités du département et de nombreux membres du corps professoral ont remporté des prix d'enseignement de la Graduate School of Biomedical Sciences.

    Les chercheurs du département de biologie du cancer se concentrent sur plusieurs domaines de recherche et sites d'organes touchés par le cancer.


    Revue annuelle de biologie du cancer

    Publication 2020 des rapports de citations de revues

    L'édition 2020 du Journal Citation Reports® (JCR) publiée par Clarivate Analytics fournit une combinaison de métriques d'impact et d'influence à partir des données source Web of Science 2019. Cette mesure fournit un rapport entre les citations d'une revue au cours d'une année donnée et les articles pouvant être cités au cours des deux années précédentes.

    Téléchargez les classements JCR de l'édition 2020 des revues annuelles au format Excel.

    Bilan annuel de : Rang Nom de catégorie Revues classées dans la catégorie Facteur d'impact Half-Life cité Indice d'immédiateté
    Chimie analytique 6 Chimie, Analytique 86 7.023 7.1 2.042
    Chimie analytique3Spectroscopie427.0237.12.042
    Biosciences animales2Zoologie1686.0914.13.125
    Biosciences animales17Biotechnologie et microbiologie appliquée1566.0914.13.125
    Biosciences animales1Agriculture, produits laitiers et sciences animales636.0914.13.125
    Biosciences animales2Science vétérinaire1426.0914.13.125
    Anthropologie6Anthropologie903.17515.60.240
    Astronomie et astrophysique1Astronomie et astrophysique6832.96310.85.133
    Biochimie3Biochimie et biologie moléculaire29725.78712.34.933
    Génie biomédical2Génie biomédical8715.5419.01.524
    Biophysique3Biophysique7111.6856.63.130
    Biologie du cancer53Oncologie2445.4132.02.826
    Biologie cellulaire et du développement13Biologie cellulaire19514.66710.50.552
    Biologie cellulaire et du développement1Biologie du développement4114.66710.50.552
    Génie chimique et biomoléculaire1Chimie appliquée719.5615.60.941
    Génie chimique et biomoléculaire5Ingénierie, Chimie1439.5615.60.941
    Psychologie clinique1Psychologie, Clinique (Sciences sociales)13113.6927.93.304
    Psychologie clinique4Psychologie (Sciences)7713.6927.93.304
    La physique de la matière condensée6Physique, Matière Condensée6914.8334.97.273
    Criminologie1Criminologie et Pénologie696.3481.40.955
    Sciences de la Terre et des planètes4Géosciences, Multidisciplinaire2009.08914.22.727
    Sciences de la Terre et des planètes5Astronomie et astrophysique689.08914.22.727
    Écologie, évolution et systématique2Biologie de l'évolution5014.04117.40.440
    Écologie, évolution et systématique2Écologie16814.04117.40.440
    Économie39Économie3713.5916.40.686
    Entomologie1Entomologie10113.79614.34.762
    Environnement et ressources5Études environnementales (sciences sociales)1238.0659.60.563
    Environnement et ressources14Sciences de l'environnement (Sciences)2658.0659.60.563
    Économie financière36Affaires, Finances1082.0577.00.167
    Économie financière107Économie3712.0577.00.167
    Mécanique des fluides1Physique, Fluides et Plasmas3416.30615.49.190
    Mécanique des fluides1Mécanique13616.30615.49.190
    Science et technologie alimentaires3Science alimentaire et technologie1398.9605.22.615
    La génétique5Génétique et hérédité17711.14610.80.500
    Génomique et génétique humaine15Génétique et hérédité1777.2439.10.955
    Immunologie4Immunologie15819.90010.75.875
    Droit et sciences sociales18Loi1542.5887.70.233
    Droit et sciences sociales20Sociologie1502.5887.70.233
    Linguistique23Linguistique1872.0263.31.000
    science maritime2Géochimie et géophysique8516.3596.67.050
    science maritime1Biologie marine et d'eau douce10616.3596.67.050
    science maritime1Océanographie6616.3596.67.050
    Recherche de matériaux19Science des matériaux, Multidisciplinaire31412.53110.62.267
    Médicament6Médecine, recherche et expérimental1389.7168.63.829
    Microbiologie9Microbiologie13511.00013.70.967
    Neurosciences9Neurosciences27112.54713.62.130
    Science nucléaire et des particules2Physique, Nucléaire198.7789.81.000
    Science nucléaire et des particules3Physique, Particules et Champs298.7789.81.000
    Nutrition2Nutrition et diététique8910.89714.20.714
    Psychologie organisationnelle et comportement organisationnel2Psychologie, Appliquée8410.9234.41.222
    Psychologie organisationnelle et comportement organisationnel2La gestion22610.9234.41.222
    Pathologie : mécanismes de la maladie1Pathologie7816.7507.26.500
    Pharmacologie et toxicologie1Toxicologie9211.25011.45.793
    Pharmacologie et toxicologie5Pharmacologie & Pharmacie27011.25011.45.793
    Chimie physique19Chimie, Physique15910.63812.13.667
    Physiologie2Physiologie8119.55611.14.769
    Phytopathologie4Sciences végétales23412.62312.70.478
    Biologie végétale1Sciences végétales23419.54013.04.586
    Science politique8Science politique1804.00011.30.750
    Psychologie2Psychologie (Sciences)7718.15612.36.367
    Psychologie3Psychologie, Multidisciplinaire (Sciences sociales)13818.15612.36.367
    Santé publique2Public, Environnement & Occup. Santé (sciences sociales)17016.4639.53.880
    Santé publique3Public, Environnement & Occup. Sciences de la santé)19316.4639.53.880
    Économie des ressources70Économie3712.7455.80.167
    Économie des ressources48Études environnementales (sciences sociales)1162.7455.80.167
    Économie des ressources4Économie et politique agricoles (sciences)212.7455.80.167
    Sociologie 1Sociologie1506.40017.70.767
    Statistiques et son application4Mathématiques, applications interdisciplinaires1065.0953.21.350
    Statistiques et son application2Statistiques et probabilités1245.0953.21.350
    Virologie2Virologie378.0213.61.172
    Sciences de la vision34Neurosciences2715.8973.40.391
    Sciences de la vision5Ophtalmologie605.8973.40.391

    OBJECTIFS ET PORTÉE DE LA REVUE : Les Revue annuelle de biologie du cancer passe en revue une gamme de sujets dans la recherche sur le cancer qui représentent des domaines importants et émergents dans le domaine. Avec les progrès récents dans notre compréhension des mécanismes de base du développement du cancer et la traduction d'un nombre croissant de ces découvertes dans la clinique sous la forme de traitements ciblés pour la maladie, le Revue annuelle de biologie du cancer est divisé en trois grands thèmes : la biologie des cellules cancéreuses, la tumorigenèse et la progression du cancer, et la science translationnelle du cancer. Le volume 4 (2020) est passé d'un accès sécurisé à un accès ouvert via le programme Annual Reviews&rsquo Subscribe to Open, avec tous les articles publiés sous une licence CC BY. Les tomes du dos, datant de 2017, sont désormais en libre accès.


    Sur l'horizon

    De nombreux outils nécessaires à la création de modèles d'apprentissage en profondeur sont disponibles gratuitement en ligne, notamment des bibliothèques de logiciels et des cadres de codage tels que TensorFlow, Pytorch, Keras et Caffe. Les chercheurs qui souhaitent poser des questions et réfléchir à des solutions aux problèmes qui surgissent avec les outils d'analyse d'images peuvent utiliser une ressource en ligne appelée Scientific Community Image Forum. Des référentiels deviennent également disponibles qui permettent aux chercheurs de trouver et de réutiliser des modèles d'apprentissage en profondeur pour des tâches connexes - un processus appelé apprentissage par transfert. Un exemple est Kipoi, qui permet aux chercheurs de rechercher et d'explorer plus de 2 000 modèles prêts à l'emploi formés pour des tâches telles que la prédiction de la façon dont les protéines connues sous le nom de facteurs de transcription se lieront à l'ADN, ou où les enzymes sont susceptibles d'épisser le code génétique.

    En collaboration avec d'autres développeurs d'outils, l'équipe de Lundberg a mis en place un « zoo modèle » rudimentaire (https://bioimage.io) pour partager rapidement ses modèles d'atlas des protéines humaines, et crée maintenant un référentiel plus sophistiqué qui sera utile aux producteurs de modèles et utilisateurs non experts.

    Une plate-forme appelée ImJoy fera partie de cet effort, dit Lundberg. Créée par Wei Ouyang, postdoc dans son laboratoire, la plateforme permet aux chercheurs de tester et d'exécuter des modèles d'IA via un navigateur Web sur leur ordinateur, dans le cloud ou sur un téléphone. Le partage d'ensembles de données de bio-imagerie et de modèles d'apprentissage en profondeur sera également une priorité pour le Center for Open Bioimage Analysis, un effort financé par le gouvernement américain et dirigé par Carpenter et Kevin Eliceiri, bioingénieur à l'Université du Wisconsin-Madison.

    Une autre option, ZeroCostDL4Mic, a été lancée le mois dernier. Développé par le biophysicien Ricardo Henriques de l'University College de Londres, ZeroCostDL4Mic utilise Colab, le service cloud gratuit de Google pour les développeurs d'IA, pour donner accès à plusieurs outils de microscopie d'apprentissage en profondeur populaires, y compris celui que Jacquemet utilise pour automatiser l'étiquetage des noyaux cellulaires dans ses films. . « Tout ce dont vous avez besoin est installé en quelques minutes », explique Jacquemet. En quelques clics de souris, les utilisateurs peuvent utiliser des exemples de données pour entraîner un réseau de neurones à effectuer la tâche souhaitée (voir « Recherché : plus de données »), puis appliquer ce réseau à leurs propres données, le tout sans avoir besoin de coder.

    Recherché : plus de données

    Les modèles d'apprentissage en profondeur peuvent traiter des données brutes, mais ils doivent d'abord être entraînés avec des informations annotées.

    Il faut de grandes quantités de données étiquetées pour former des modèles d'apprentissage en profondeur. Mais ce n'est pas toujours facile à trouver, explique Casey Greene, biologiste informatique à l'Université de Pennsylvanie à Philadelphie. « Les données sont bon marché, mais les données étiquetées sont chères. »

    Dans le domaine de la génomique, les séquences sont abondantes et accessibles au public. Mais leurs descriptions associées, ou métadonnées, sont souvent manquantes, erronées ou non standardisées, explique Emily Flynn, doctorante en informatique biomédicale à l'Université de Stanford en Californie. Un chercheur souhaitant former un modèle pour détecter le cancer du poumon non à petites cellules dans des échantillons de patients, par exemple, pourrait bien trouver des ensembles de données diversement étiquetés « nsclc », « non à petites cellules » ou « LC non à petites cellules » – différences qui confond les outils d'analyse. Ou les échantillons peuvent être étiquetés « maladie : glioblastome » et « maladie : oui », explique le biostatisticien Colin Dewey de l'Université du Wisconsin-Madison.

    Pour aider à organiser ces données, Dewey a créé un pipeline de calcul appelé MetaSRA, qui utilise des techniques d'exploration de texte pour normaliser et stocker des métadonnées sur des séquences publiques. Et Greene et ses collègues ont créé affiner.bio, un référentiel qui harmonise les données sur l'expression et le séquençage de l'ARN. En collaboration avec le bio-ingénieur de Stanford Russ Altman, Flynn utilise des techniques d'apprentissage automatique pour déduire les étiquettes manquantes à partir des données d'expression génétique afin d'améliorer les annotations dans raffiner.bio.

    En bio-imagerie, le problème réside davantage dans l'annotation. Pour étiqueter un ensemble de diapositives d'histopathologie, par exemple, « quelqu'un doit entrer et dessiner un cadre de délimitation autour des parties qui sont cancéreuses », explique Greene. "Et cette personne gagne probablement beaucoup d'argent." Désormais, les développeurs forment des algorithmes d'apprentissage en profondeur pour étiqueter les noyaux et autres structures dans les images cellulaires, tandis que la ressource de données d'image et d'autres référentiels en ligne permettent aux chercheurs de partager et de trouver plus facilement des images des sciences de la vie.

    Les chercheurs qui souhaitent utiliser des ensembles de données plus volumineux ou former des modèles plus complexes peuvent avoir besoin d'acheter ou d'accéder à des ressources de calcul supplémentaires au-delà du service gratuit de Google.

    En facilitant l'utilisation de l'apprentissage en profondeur par les biologistes disposant de peu de savoir-faire et de ressources, ZeroCostDL4Mic agit comme un « médicament de passerelle » pour l'IA, incitant les chercheurs à explorer les logiciels sous-jacents à ces outils qui continueront à transformer la recherche sur le cancer et au-delà.

    La nature 580, 551-553 (2020)


    INTRODUCTION

    Le cancer humain est une maladie très diversifiée et complexe composée de cellules cancéreuses avec un statut génétique, épigénétique et transcriptionnel distinct, formant des populations fonctionnelles hétérogènes de cellules cancéreuses, ce qui constitue un obstacle majeur au diagnostic et au traitement du cancer (1–4). Certaines cellules cancéreuses ont une activité de prolifération cellulaire élevée, certaines ont une agressivité tumorale et une capacité de métastase, certaines présentent des propriétés semblables à celles des cellules souches, tandis que d'autres présentent un état de quiescence «paresseux» (5-7). Ces cellules cancéreuses fonctionnellement hétérogènes agissent de manière coopérative ou compétitive pendant toute l'évolution de la tumeur, conduisant à des phénotypes tumoraux distincts (8-10). Par conséquent, il est essentiel de décoder de manière complète et adéquate les états fonctionnels des cellules cancéreuses.

    Les technologies basées sur le séquençage unicellulaire ouvrent de nouvelles voies pour explorer des écosystèmes complexes, en particulier les cancers, révolutionnant la science de l'organisme entier (11). Il offre une opportunité sans précédent de déchiffrer les états fonctionnels des cellules cancéreuses à une résolution cellulaire unique, permettant ainsi aux chercheurs d'explorer avec précision et impartialité l'hétérogénéité fonctionnelle des cellules cancéreuses et d'approfondir la compréhension de la cellule cancéreuse en tant qu'unité fonctionnelle pour exécuter des fonctions biologiques spécifiques. dans l'initiation et la progression du cancer. En 2014, une étude pionnière sur le glioblastome a utilisé le séquençage d'ARN monocellulaire (scRNA-seq) pour découvrir une hétérogénéité auparavant inattendue dans les états fonctionnels liés au cancer, tels que la tige, la prolifération et l'hypoxie (5). Profilage de 4347 cellules individuelles de six oligodendrogliomes humains par scRNA-seq, Tirosh et al. ont constaté que ces cellules uniques présentaient une hétérogénéité généralisée en termes de souche et de différenciation, et ont révélé que quelques cellules cancéreuses à forte souche peuvent agir comme des cellules souches cancéreuses pour alimenter la croissance du cancer (12). Et une étude sur la leucémie myéloïde chronique a révélé que les cellules ayant différentes activités de quiescence, de prolifération et de souche ont une sensibilité différente aux traitements par inhibiteur de la tyrosine kinase (ITK), conduisant à des rechutes fréquentes pour cette maladie (6).

    Le développement rapide de scRNA-seq conduit à l'accumulation accélérée d'une grande quantité d'ensembles de données scRNA-seq, et récemment plusieurs bases de données connexes ont été développées. Par exemple, SCPortalen a collecté et annoté des ensembles de données scRNA-seq chez l'homme et la souris, et a fourni des tables d'expression traitées à l'aide d'un pipeline pour le téléchargement (13). JingleBells a fourni des fichiers BAM d'ensembles de données scRNA-seq liés au système immunitaire pour la visualisation des lectures (14). scRNASeqDB a collecté des ensembles de données de transcriptome de cellules individuelles humaines et aide les chercheurs à interroger et à visualiser l'expression des gènes dans des cellules individuelles humaines (15). Cependant, tous se sont concentrés sur la collecte d'ensembles de données scRNA-seq, une base de données dédiée consacrée au déchiffrement des états fonctionnels des cellules cancéreuses individuelles fait toujours défaut.

    Par conséquent, nous avons développé CancerSEA, une base de données dédiée qui vise à décoder de manière exhaustive les états fonctionnels distincts des cellules cancéreuses au niveau unicellulaire. En juillet 2018, la base de données contenait 41 900 cellules cancéreuses uniques dans 25 cancers humains avec 14 états fonctionnels liés au cancer sélectionnés manuellement (y compris la souche, l'invasion, les métastases, la prolifération, l'EMT, l'angiogenèse, l'apoptose, le cycle cellulaire, la différenciation, les dommages à l'ADN, réparation de l'ADN, hypoxie, inflammation et quiescence). En caractérisant ces activités d'état fonctionnel de chaque cellule cancéreuse, CancerSEA fournit un atlas des états fonctionnels unicellulaires du cancer et associe les gènes codant pour les protéines (PCG) et les lncRNAs à ces états fonctionnels au niveau unicellulaire pour promouvoir la compréhension mécaniste des différences fonctionnelles de cellules cancéreuses. Nous nous attendons à ce que cette base de données élaborée puisse servir de ressource importante et précieuse pour faciliter l'exploration de l'hétérogénéité tumorale.


    Résumé

    Le cancer au sens large fait référence à plus de 277 types différents de maladies cancéreuses. Les scientifiques ont identifié différents stades de cancer, indiquant que plusieurs mutations génétiques sont impliquées dans la pathogenèse du cancer. Ces mutations génétiques conduisent à une prolifération cellulaire anormale. Les troubles génétiques causés par l'hérédité ou les facteurs héréditaires ont un rôle central dans l'augmentation de la croissance cellulaire. Avec l'aide des progrès technologiques de la bioinformatique et des techniques moléculaires, des informations supplémentaires ont été obtenues qui peuvent être utiles pour un diagnostic précoce et un traitement approprié. Les effets des médicaments sur les patients atteints de cancer peuvent prédire et même gérer certains aspects des effets secondaires. Ces dernières années, des mécanismes de cancérogenèse ont été détectés par des études de génétique moléculaire. Les résultats de ces études ont permis de mieux comprendre le rôle des troubles génétiques dans la formation du cancer. Dans cette étude, notre objectif était d'examiner les aspects moléculaires du cancer.


    Division cellulaire et risque de cancer

    Cette activité guide l'analyse d'un chiffre scientifique publié à partir d'une étude qui a examiné comment des mutations aléatoires au cours de la division cellulaire peuvent contribuer au cancer.

    Les facteurs héréditaires et environnementaux n'expliquent qu'une fraction du risque global de cancer. Dans cette étude, les chercheurs ont étudié comment un troisième facteur, les mutations fortuites au cours de la division des cellules souches et de la réplication de l'ADN, peut contribuer aux taux de cancer de divers tissus corporels. La figure compare le nombre de fois où les cellules souches se divisent dans différents tissus avec les risques à vie de développer un cancer dans ces tissus. Le document « Matériel pour l'éducateur » comprend une figure sous-titrée, des informations générales, une interprétation du graphique et des questions de discussion. Le « Document de l'étudiant » comprend une figure sous-titrée et des informations générales.

    Le lien « Resource Google Folder » dirige vers un dossier Google Drive de documents de ressources au format Google Docs. Tous les documents téléchargeables pour la ressource peuvent ne pas être disponibles dans ce format. Le dossier Google Drive est défini sur "Affichage uniquement" pour enregistrer une copie d'un document de ce dossier sur votre Google Drive, ouvrez ce document, puis sélectionnez Fichier → "Faire une copie". Ces documents peuvent être copiés, modifiés et distribués en ligne conformément aux conditions d'utilisation répertoriées dans la section « Détails » ci-dessous, y compris en créditant BioInteractive.

    Objectifs d'apprentissage des élèves
    • Analyser et interpréter les données d'un chiffre scientifique.
    • Décrire comment la division cellulaire peut contribuer au risque de cancer dans les tissus corporels.
    Des détails

    carcinome, corrélation, échelle logarithmique, mutation, sarcome, nuage de points, tissu, tumeur

    Tomasetti, Cristian et Bert Vogelstein. "La variation du risque de cancer entre les tissus peut s'expliquer par le nombre de divisions de cellules souches." Science 347, 6217 (2015) : 78-81. https://doi.org/10.1126/science.1260825.

    Pour accéder à cet article, créez un compte AAAS gratuit. Une version annotée de l'article est également disponible sur Science in the Classroom.

    Veuillez consulter les conditions d'utilisation pour plus d'informations sur la façon dont cette ressource peut être utilisée.