Проект за анатомијата на геномот на ракот

Проект за анатомијата на геномот на ракот или Проект „Анатомија на геномот на ракот“проект создаден од Националниот институт за рак на Соединетите Држави во 1997 година и воведен од Ал Гор. Тој е семрежна база на податоци за нормални, предракородни и ракородни геноми. Исто така, обезбедува алатки за прегледување и анализа на податоците, овозможувајќи идентификација на гените вклучени во различни аспекти на напредокот на туморот. Целта на Проектот е да го карактеризира ракот на молекуларно ниво преку обезбедување на платформа со лесно достапни ажурирани податоци и збир на алатки што истражувачите можат лесно да ги поврзат нивните наоди со постојното знаење. Исто така, се насочува на развој на софтверски алатки кои ја подобруваат употребата на големи и сложени збирки на податоци.[1][2] Проектот е раководен од Даниела С. Герхард и вклучува потпроекти или иницијативи, со значајни како Проектот за аберација на хромозомот на ракот и Иницијативата за генетска прибелешка. Проектот за анатомијата на геномот на ракот придонесува за многу бази на податоци и организации како што е Националните центар за биотехнички информации на Соединетите Држави придонесуваат за базите на податоци на овој Проект.

Евентуалните исходи на Проектот се воспоставување на корелација помеѓу напредокот на одреден рак со неговиот терапевтски исход, подобрена евалуација на третманот и развој на нови техники за спречување, откривање и лекување. Ова е постигнато со карактеризација на производите со информациската РНК на ткивата.

Истражување

уреди

Заднина

уреди

Основната причина за ракот е неможноста на клетката да го регулира своето генско изразување. За да биде карактеризиран специфичен вид рак, може да бидат испитани белковините кои се правени од изменетото генско изразување или од претходничката информациска РНК на белковината. Проектот работи на поврзување на профилот на изразување на одредена клетка, молекуларниот потпис или транскриптом, кој во суштина е отпечаток од прст на клетката, со фенотипот на клетката. Затоа, профилите на изразување постојат со оглед на видот рак и фазата на напредок.[3]

Секвенционирање

уреди

Првичната цел на Проектот била да биде воспоставен индекс на туморски гени за складирање на профилите на изразување. Ова ќе придонесе и за новите и за постоечките бази на податоци.[4] Ова придонело за два вида библиотеки, база на податоци на изразени ознаки на секвенци и подоцна базата на податоци на низната анализа на генското изразување. Ова било изведено во низа чекори:[3]

  • Содржината на клетките се мие преку плочи со поли Т секвенци. Ова ќе ги врзе опашките на Поли-A кои постојат само на молекулите на информациска РНК, па затоа одбрано ќе биде задржа информациска РНК.
  • Изолираната информациска РНК е обработувана во транскрипт на комплементарна ДНК преку реакции на обратна транскрипција и полимеризација на ДНК.
  • Добиената двоверижна ДНК потоа е ставана во плазмидите на E.coli. Секоја бактерија сега содржи една единствена комплементарна ДНК и се реплицира за да произведе клонови со исти генетски информации. Ова е нарекувано библиотека на комплементарна ДНК.
  • Библиотеката потоа може да бидат секвенционирано со техники на секвенционирање со висок пропуст. Ова може да ги одликува и различните гени изразени од првобитната клетка и количината на изразување на секој ген.

Индексот на туморски гени прво бил насочен на ракот на простата, дојка, јајници, бели дробови и дебелото црево, а Проектот бил проширен и на други видови рак во своето истражување. Практично, биле појавени прашања кои Проектот ги отсликал кога новите технологии станале достапни.

Многу видови рак се јавуваат во ткива со повеќе видови клетки. Традиционалните техники го земале примерокот од целото ткиво и правеле библиотеки на комплементарна ДНК од ткивото. Оваа клеточна хетерогеност ги направила информациите за генското изразување во однос на биологијата на ракот помалку точни. Пример е ткивото на ракот на простата каде што епителните клетки, за кои било покажано дека се единствениот вид клетки предизвикуваат рак, сочинуваат само 10% од бројот на клетките. Ова довело до развој на ласерско фаќање со микрорасекување, техника која може да изолира поединечни видови клетки, што довело до подем на библиотеките на комплементарна ДНК од специфични видови клетки.[4]

Секвенционирањето на комплементарна ДНК ќе го произведе целиот транскрипт на информациска РНК што го создал. Практично, само дел од секвенцата е потребен за уникатно да биде идентификувана информациска РНК или поврзана со белковина. Резултантниот дел од низата бил наречен изразена ознака за секвенца и секогаш е на крајот од низата блиску до опашката поли А. Податоците на изразените ознаки за секвенца се чувани во базата на податоци т.н. dbEST. Изразените ознаки за секвенца треба да бидат долги само околу 400 бази, но со техниките со масовното напоредно секвенционирање ова сепак ќе произведува читања со низок квалитет. Затоа, користен е и подобрен метод наречен низна анализа на генското изразување. Овој метод идентификува, за секоја транскриптна молекула на комплементарната ДНК произведена од генското изразување на клетката, региони долги само 10-14 бази насекаде по читаната секвенца, доволни за единствено да биде идентификуван тој транскрипт на комплементарната ДНК. Овие бази се отсечени и поврзани заедно, а потоа се ставани во бактериски плазмиди како што е споменато погоре. Библиотеките на низната анализа на генското изразување имаат подобар квалитет на читање и создаваат поголема количина на податоци кога се секвенционирани, и бидејќи транскриптите се споредувани во апсолутни наместо во релативно нивоа, низната анализа на генското изразување ја има предноста што не бара нормализација на податоците преку споредба со референца.[1][4]

Ресурси

уреди

По секвенционирањето и воспоставувањето на библиотеките, Проектот ги става податоците заедно со постоечките извори на податоци и обезбедува различни бази на податоци и алатки за анализа. Детален опис на алатките и базите на податоци создадени или користени од Проектот може да биде најден на мрежната страница на Проектот, во индексот на туморски гени. Подолу се дадени некои од иницијативите или алатките за истражување обезбедени од Проектот.

Иницијатива за геномска прибелешка

уреди

Целта на Иницијативата за геномска прибелешка при Проектот за анатомијата на геномот на ракот е да бидат откриени и каталогизирани единечно нуклеотидни полиморфизми кои се во корелација со започнувањето и напредокот на ракот.[4] Иницијативата создала различни алатки за откривање, анализа и прикажување на единечно нуклеотидните полиморфизми. Единечно нуклеотидните полиморфизми се вредни во истражувањето на ракот бидејќи може да бидат користени во неколку различни генетски студии, најчесто за следење на преносот, идентификување на алтернативни облици на гени и анализа на сложени молекуларни патишта кои го регулираат клеточниот метаболизам, растот или диференцијацијата.[5]

Единечно нуклеотидните полиморфизми во Иницијативата или се пронајдени како резултат на пресеквенционирање на гени од интерес кај различни поединци или гледање низ постоечките човечки бази на податоци на изразени ознаки на секвенци и правење споредби.[2] Ги испитува транскриптите од здрави поединци, лица со болест, туморско ткиво и клеточни линии од голем сет на поединци; затоа базата на податоци е поверојатно да вклучува мутации на ретки болести, покрај варијантите со висока честота.[6] Вообичаен предизвик со забележувањето единечно нуклеотидни полиморфизми е диференцијација помеѓу грешките во секвенционирањето со вистински полиморфизми. Пронајдените единечно нуклеотидни полиморфизми се подложени на статистичка анализа користејќи го обработувачот на податоци за единечно нуклеотидни полиморфизми при Проектот за да се пресмета веројатноста дека варијантата е всушност полиморфизам. Единечно нуклеотидните полиморфизми со голема веројатност се потврдени и има достапни алатки кои даваат предвидувања за тоа дали функцијата е изменета.[2]

За да ги направи податоците лесно достапни, Иницијативата има голем број алатки кои можат да прикажат и порамнување на секвенците и преглед на склопување во контекст на секвенците од кои се предвидени. Единечно нуклеотидните полиморфизми се бележани и често се одредуваат интегрирани генетски/физички карти.[6]

Проект за хромозомската аберација на ракот

уреди

Геномската нестабилност е честа особина на ракот; затоа разбирањето на структурните и хромозомските абнормалности може да даде увид во прогресијата на болеста. Проектот за хромозомската аберација на ракот е иницијатива поддржана од Проектот за анатомијата на геномот на ракот што е користен за дефинирање на структурата на хромозомот и за карактеризирање на преуредувања кои се поврзани со малигна преобразба.[4][7] Ја вклучува семрежната верзија на Мителмановата база на податоци, создадена од Феликс Мителман, Бертил Јохансон и Фредрик Мертенс пред создавањето на Проектот за анатомијата на геномот на ракот, друга збирка на познати хромозомски преуредувања. Проектот за хромозомската аберација има неколку цели:[7]

  • Интеграција на цитогенетски и физички карти на човечкиот геном
  • Да создава складиште на клонови на бактериски вештачки хромозомски клонови низ геномот кои се генетски и физички картирани
  • Развивање платформа за напоредна корелација на бази на податоци за аберации поврзани со рак (база на податоци за бактериски вештачки хромозомски клонови, картирана со флуоресцентна „на лице место“ хибридизација)
  • Интегрирање на три техники на цитогенетски анализи (спектрално кариотипизирање, споредбена хибридизација на геномот и флуоресцентна „на лице место“ хибридизација) за да биде усовршена дефинирачката номенклатура за кариотипски аберации.

Има цитогенетски информации од над 64.000 случаи на пациенти, вклучително и повеќе од 2000 фузија на гени, содржани во базата на податоци.[1]

Како дел од овој проект постои складиште на физички и цитогенетски картирани бактериски вештачки хромозомски клонови за човечкиот геном кои се физички достапни преку мрежа на дистрибутери.[1] Картите со клонови на Проектот за хромозомската аберација на ракот се изработени цитогенетски со помош на флуоресцентна „на лице место“ хибридизација со резолуција од 1-2Mb низ човечкиот геном и физички картирани со користење на места означени со секвенца.[8] Податоците за бактериските вештачки хромозомски клонови се достапни и преку базите на податоци на Проектот за анатомијата на геномот на ракот и Националниот центар за биотехнолошки информации на Соединетите Држави.

Други ресурси

уреди

Подолу се наведени некои други ресурси достапни преку Проектот за анатомијата на геномот на ракот.[1]

Дигитален диференцијален приказник

уреди

Рана техника што ја користи Проектот е дигитален диференцијален приказник, кој го користи Фишеровиот точен тест за да ги споредува библиотеките една со друга, со цел да биде најде значајна разлика помеѓу групите на население. Проектот обезбедил дека дигиталниот диференцијален приказник може да ги споредува сите библиотеки на комплементарна ДНК во базата на податоци на изразените ознаки за секвенца, а не само оние што се создавани од страна на Проектот.[4]

Збирка на гени од цицачи

уреди

Збирката им обезбедува на истражувачите целосни информации за белковините од комплементарната ДНК, за разлика од базите на податоци на изразените ознаки за секвенца или низната анализа на генското изразување кои обезбедуваат само идентификациона ознака. Проектот вклучува човечки и глувчешки гени, а подоцна биле додадени и кравји комплементарни ДНК-и создадени од установа Геном Канада (Genome Canada).[9]

Карта со низна анализа на генското изразување

уреди

Картата со низна анализа на генското изразување (SAGEmap) е база на податоци што е користена за складирање на библиотеки за низна анализа на генското изразување. Постојат над 3,4 милиони ознаки со низна анализа на генското изразување, согласно од 2001 година. Алатките може да бидат користени за картирање на ознаки со низна анализа на генското изразување во кластери на UniGene, база на податоци што складира транскриптоми. Ова овозможува полесна идентификација на соодветната секвенца на ознаката со низна анализа на генското изразување. Покрај тоа, постојат алатки поврзани со картите со низна анализа на генското изразување:[10]

  • Digital Northern е користи за мерење на нивото на изразување на специфични гени.[1]
  • SAGE Anatomic Viewer ги прикажува овие информации за гледање и ги споредува помеѓу нормалните и ракородните клетки.
  • Ludwig Transcript Viewer прикажува алтернативни транскрипти и нивните можни поврзани ознаки со низна анализа на генското изразување.
  • mSAGE Expression Matrix ги покажува нивоата на генско изразување во текот на развојот на глушецот за различни видови ткива.

Пронаоѓач на гени

уреди

Проектот наоѓа ген или список на гени врз основа на одредени критериуми за пребарување и обезбедува врски до различни бази на податоци на Националниот центар за рак и Националниот центар за биотехнолошки информации. Генот може да биде баран конкретно со користење на уникатен идентификатор како што се генските симболи и генскиот број на Entrez, како и воглавно по функција, ткиво или клучен збор.[11]

Други алатки за гени достапни преку мрежниот приказник на Проектот се Gene Ontology Browser и алатката Nucleotide BLAST.

Алатки за изразување гени

уреди

cDNA xProfiler и cDNA Digital gene expression displayer (Дигитален прикажувач на изразување гени на комплементарна ДНК) заедно се користени за да бидат пронајдени статистички значајни гени од интерес кои се диференцијално изразени во два групи на библиотеки на комплементарна ДНК, обично е правена споредба помеѓу нормалните и ракородните ткива.[12] Статистичката значајност е определувана со cDNA Digital gene expression displayer со користење на комбинација од Бејсова статистика и сооднос на шансите за секвенца за да биде пресметана веројатноста. Дигиталниот прикажувал за комплементарна ДНК се потпира на релациската база на податоци на UniGene додека cDNA xProfiler користи база на податоци за рамни датотеки што не е достапна на интернет.[13]

Резултати и иднина

уреди

Проектот сега е централизирано место за неколку алатки за геномика и генетски бази на податоци и широко е користен во истражувањето на ракот и молекуларната биологија. Базите на податоци воспоставени од Проектот продолжуваат да придонесуваат за знаење за рак во однос на нивните патишта и напредок. Базите на податоци за транскриптом може да бидат користени и во истражувања кои не се поврзани со ракот, бидејќи содржат информации што може да бидат користени за брзо и лесно идентификување на одредени секвенционирани гени. Податоците, исто така, имаат клиничко влијание, бидејќи комплементарната ДНК може да биде користена за создавање микрочипови за цели на дијагноза и споредба на третман. Проектот е користен во многу студии, на пример:[1][4]

Покрај тоа, огромното количество податоци создадено од Проектот поттикнало за подобрување на техниките за анализа на податоци и податочно рударење, на пример:[1]

  • Споредба на генско изразување од повеќе библиотеки со комплементарна ДНК[19]
  • Подобрени техники за рударење во библиотеки со изразени ознаки на секвенци[20]
  • Интегрални, големи студии за анализа на човечки транскриптом [21]

Поврзано

уреди

Наводи

уреди
  1. 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 Riggins, G. J. (2001). „Genome and genetic resources from the Cancer Genome Anatomy Project“. Human Molecular Genetics. 10 (7): 663–667. doi:10.1093/hmg/10.7.663. ISSN 1460-2083. PMID 11257097.
  2. 2,0 2,1 2,2 Strausberg, Robert L.; Buetow, Kenneth H.; Emmert-Buck, Michael R.; Klausner, Richard D. (2000). „The Cancer Genome Anatomy Project: building an annotated gene index“. Trends in Genetics. 16 (3): 103–106. doi:10.1016/S0168-9525(99)01937-X. ISSN 0168-9525. PMID 10689348.
  3. 3,0 3,1 „Understanding Cancer“. Архивирано од изворникот на 2014-08-05. Посетено на 20 февруари 2024.
  4. 4,0 4,1 4,2 4,3 4,4 4,5 4,6 Krizman, David B.; Wagner, Lukas; Lash, Alex; Strausberg, Robert L.; Emmert-Buck, Michael R. (1999). „The Cancer Genome Anatomy Project: EST Sequencing and the Genetics of Cancer Progression“. Neoplasia. 1 (2): 101–106. doi:10.1038/sj.neo.7900002. ISSN 1476-5586. PMC 1508126. PMID 10933042.
  5. Clifford, R. (2000). „Expression-based Genetic/Physical Maps of Single-Nucleotide Polymorphisms Identified by the Cancer Genome Anatomy Project“. Genome Research. 10 (8): 1259–1265. doi:10.1101/gr.10.8.1259. ISSN 1088-9051. PMC 310932. PMID 10958644.
  6. 6,0 6,1 Clifford, Robert J.; Edmonson, Michael N.; Nguyen, Cu; Scherpbier, Titia; Hu, Ying; Buetow, Kenneth H. (2004). „Bioinformatics Tools for Single Nucleotide Polymorphism Discovery and Analysis“. Annals of the New York Academy of Sciences. 1020 (1): 101–109. Bibcode:2004NYASA1020..101C. doi:10.1196/annals.1310.011. ISSN 0077-8923. PMID 15208187.
  7. 7,0 7,1 „The Cancer Chromosome Aberration Project (CCAP)“. Посетено на 20 февруари 2024.
  8. „All About the FISH-mapped BACs“. Посетено на 20 февруари 2024.
  9. „Mammalian Gene Collection“. Архивирано од изворникот на 2015-02-25. Посетено на 20 февруари 2024.
  10. „SAGE genie“. Посетено на 20 февруари 2024.
  11. „Gene Finder“. Посетено на 20 февруари 2024.
  12. „CGAP How to: Tools“. Посетено на 20 февруари 2024.
  13. Milnthorpe, Andrew T; Soloviev, Mikhail (2011). „Errors in CGAP xProfiler and cDNA DGED: the importance of library parsing and gene selection algorithms“. BMC Bioinformatics. 12 (1): 97. doi:10.1186/1471-2105-12-97. ISSN 1471-2105. PMC 3094240. PMID 21496233.
  14. Croix, B. St. (2000). „Genes Expressed in Human Tumor Endothelium“. Science. 289 (5482): 1197–1202. Bibcode:2000Sci...289.1197S. doi:10.1126/science.289.5482.1197. ISSN 0036-8075. PMID 10947988.
  15. Loging, W. T. (2000). „Identifying Potential Tumor Markers and Antigens by Database Mining and Rapid Expression Screening“. Genome Research. 10 (9): 1393–1402. doi:10.1101/gr.138000. ISSN 1088-9051. PMC 310902. PMID 10984457.
  16. C. D. Hough; C. A. Sherman-Baust; E. S. Pizer; F. J. Montz; D. D. Im; N. B. Rosenshein; K. R. Cho; G. J. Riggins; P. J. Morin (November 2000). „Large-scale serial analysis of gene expression reveals genes differentially expressed in ovarian cancer“. Cancer Research. 60 (22): 6281–6287. PMID 11103784.
  17. G. Vasmatzis; M. Essand; U. Brinkmann; B. Lee; I. Pastan (јануари1998). „Discovery of three genes specifically expressed in human prostate by expressed sequence tag database analysis“. Proceedings of the National Academy of Sciences of the United States of America. 95 (1): 300–304. Bibcode:1998PNAS...95..300V. doi:10.1073/pnas.95.1.300. PMC 18207. PMID 9419370. Проверете ги датумските вредности во: |date= (help)
  18. U. Brinkmann; G. Vasmatzis; B. Lee; N. Yerushalmi; M. Essand; I. Pastan (септември 1998). „PAGE-1, an X chromosome-linked GAGE-like gene that is expressed in normal and neoplastic prostate, testis, and uterus“. Proceedings of the National Academy of Sciences of the United States of America. 95 (18): 10757–10762. Bibcode:1998PNAS...9510757B. doi:10.1073/pnas.95.18.10757. PMC 27968. PMID 9724777.
  19. D. J. Stekel; Y. Git; F. Falciani (декември 2000). „The comparison of gene expression from multiple cDNA libraries“. Genome Research. 10 (12): 2055–2061. doi:10.1101/gr.gr-1325rr. PMC 313085. PMID 11116099.
  20. Schmitt, A. O.; Specht, T.; Beckmann, G.; Dahl, E.; Pilarsky, C. P.; Hinzmann, B.; Rosenthal, A. (1999). „Exhaustive mining of EST libraries for genes differentially expressed in normal and tumour tissues“. Nucleic Acids Research. 27 (21): 4251–4260. doi:10.1093/nar/27.21.4251. ISSN 0305-1048. PMC 148701. PMID 10518618.
  21. V. E. Velculescu; S. L. Madden; L. Zhang; A. E. Lash; J. Yu; C. Rago; A. Lal; C. J. Wang; G. A. Beaudry (December 1999). „Analysis of human transcriptomes“. Nature Genetics. 23 (4): 387–388. doi:10.1038/70487. PMID 10581018.

Надворешни врски

уреди