O echipă de specialiști din mai multe domenii a realizat o resursă online, bazată pe Atlasul genomului cancerului, disponibilă gratuit pentru oamenii de știință, astfel încât aceștia să poată clasifica mai bine subtipurile de cancer în vederea diagnosticului.
Resursa este considerată utilă deoarece tumorile aparținând unor tipuri diferite pot avea răspunsuri diferite la terapiile pentru cancer.
Atlasul genomului cancerului (TCGA) a colectat și analizat informații genetice de la mii de pacienți cu cancer și boli genetice.
Într-un articol publicat la începutul anului 2025 în “Cancer Cell”, inițiatorii resursei afirmă că aceasta este primul instrument menit să faciliteze implementarea clinică a cunoștințelor cuprinse în baza de date uriașă a TCGA.
“TCGA a definit subtipuri moleculare pentru fiecare tip major de cancer. Cu această resursă, ne-am propus să oferim comunităților clinice și științifice instrumentele pentru a clasifica o tumoră nou diagnosticată într-unul dintre aceste subtipuri”, a declarat dr. Peter W. Laird, de la catedra de epigenetică a Institutului Van Andel, citat de sciencedaily.com.
Resursa este considerată suficient de puternică pentru a crea evaluări clinice bazate pe variațiile moleculare între subtipurile de cancer.
Atlasul TCGA a însemnat un efort care a durat un deceniu, sub coordonarea Institutului Național al Cancerului din SUA, și conține hărți moleculare detaliate pentru 33 de tipuri de cancer.
Spre deosebire de abordările tradiționale, care definesc tipurile de cancer pe baza organelor sau țesuturi în care apar, TCGA se bazează pe caracteristici nuanțate genomice, epigenomice, proteomice și transcriptomice, ce definesc mult mai precis subtipurile de cancer.
Noua resursă a pornit de la numeroasele solicitări primite de cercetătorii implicați în realizarea TCGA de la medici, care cereau ajutor pentru a clasifica precis probele de la pacienți.
Acest lucru a fost determinat de complexitatea TCGA, în condițiile în care multe subtipuri moleculare din cadrul atlasului au fost generate utilizând sute sau chiar mii de caracteristici de la diverse tipuri de date.
Pornind de la aceste solicitări, echipa a creat o resursă care simplifică utilizarea datelor din TCGA. Astfel, resursa a valorificat date din 8.791 de mostre de cancer, din 26 de cohorte de pacienți cu cancer și 106 subtipuri de cancer.
Ulterior, cercetătorii au folosit instrumente de machine learning pentru a dezvolta și testa aproape jumătate de milion de modele din șase categorii: expresie a genelor, metilarea ADN, miARN, număr de copii, mutații și “multi-om-ică” (o abordare biologică bazată pe multiple domenii cu terminație în “om” – genom, microbiom, proteom, transcriptom etc).
Dintre acestea, cercetătorii au selectat modelele care s-au comportat cel mai bine și le-au inclus în resursa online.
În total, resursa conține 737 modele gata de a fi folosite, reprezentând modelele cele mai reprezentative pentru fiecare dintre cele 26 de cohorte de pacienți cu cancer, cinci algoritmi de training și șase tipuri de date. Mai mult, aceste modele pot fi folosite de alți cercetători pentru a genera noi seturi de date.
Resursa online este disponibilă în următorul link: https://github.com/NCICCGPO/gdan-tmp-models.