Функционална геномика

Функционална геномика ― поле на молекуларната биологија која се обидува да ги опише функциите и меѓудејствијата на генитебелковините). Функционалната геномика ги користи огромните податоци создадени од геномски и транскриптомски проекти (како што се проекти за секвенционирање на геном и секвенционирање на РНК). Функционалната геномика се насочува на динамичките гледишта како што се генска транскрипција, превод, регулација на генското изразивање и меѓудејствијата белковина со белковина, наспроти статичните аспекти на геномските информации како што се секвенцата на ДНК или структурите. Клучна одлика на студиите за функционална геномика е нивниот пристап на овие прашања за геномот во широка смисла, кој воглавно вклучува методи со висок пропуст, наместо потрадиционален пристап „кандидат-ген“.

Длабоко мутациско скенирање на мотивот за препознавање на РНК (РРМ2) на белковината за врзување на квасец PolyA (Pab1)

Дефиниција и цели на функционалната геномика

уреди

За да биде разбрана функционалната геномика, важно е прво да биде дефинирана функцијата. Во нивниот труд, Граур и други соработници ја дефинираат функцијата на два можни начини. Тоа се „избран ефект“ и „причинска улога“. Функцијата „избран ефект“ се однесува на функцијата за која е избрана одлика (ДНК, РНК, белковина итн.). Функцијата „причинска улога“ се однесува на функцијата за која е доволна и неопходна одлика. Функционалната геномика обично ја тестира дефиницијата за функцијата „причинска улога“.

Целта на функционалната геномика е да се разбере функцијата на гените или белковините, на крајот на сите компоненти на геномот. Поимот функционална геномика често е користен за да се однесува на многу технички пристапи за проучување на гените и белковините на организмот, вклучувајќи ги „биохемиските, клеточните и/или физиолошките својства на секој генски производ“[1] додека некои автори ја вклучуваат студијата на негенски елементи во нивната дефиниција.[2] Функционалната геномика може да вклучува и студии за природните генетски варијации со текот на времето (како што е развојот на организмот) или просторот (како што се неговите делови од телото), како и функционални нарушувања како што се мутациите.

Ветувањето за функционална геномика е да создава и синтетизира геномско и протеомско знаење во разбирање на динамичките својства на организмот. Ова потенцијално би можело да обезбеди поцелосна слика за тоа како геномот ја одредува функцијата во споредба со студиите за поединечни гени. Вклучувањето на функционалните геномски податоци често е дел од пристапите на системската биологија.

Техники и примени

уреди

Функционалната геномика вклучува гледишта поврзани со функцијата на самиот геном, како што се мутација и полиморфизам (како што е анализата на полиморфизмот на еден нуклеотид, како и мерење на молекуларните активности. Последниве опфаќаат голем број „ -омики “ како што се транскриптомика (генско изразување), протеомика (производство на белковини) и метаболомика. Функционалната геномика користи претежно мултиплексни техники за мерење на изобилството на многу или сите генски производи како што се информациска РНК или белковини во биолошки примерок. Пофокусиран пристап на функционална геномика може да ја тестира функцијата на сите варијанти на еден ген и да ги измери ефектите на мутантите со користење на секвенционирање како отчитување на активноста. Заедно, овие мерни модалитети се трудат да ги квантифицираат различните биолошки постапки и да го подобрат нашето разбирање за функциите и меѓудејствијата на гените и белковините.

На ниво на ДНК

уреди

Картирање на генетските меѓудејствија

уреди

Систематско парно бришење на гени или инхибиција на генското изразување може да биде користено за да бидат идентификувани гените со сродна функција, дури и ако тие не општат физички. Епистазата се однесува на фактот дека ефектите за два различни генски соборувања може да не бидат адитивни; односно, фенотипот што произлегува кога два гена се инхибирани може да се разликува од збирот на ефектите од единечните соборувања.

ДНК-ови/белковински меѓудејствија

уреди

Белковините создадени со превод на информациска РНК (кодирана информација од ДНК за синтеза на белковини) играат главна улога во регулирањето на генското изразување. За да се разбере како тие ја регулираат генското изразување, неопходно е да бидат идентификувани секвенците на ДНК со кои што тие општат. Развиени се техники за да се идентификуваат местата на меѓудејствија на ДНК со белковина. Тие се секвенционирање на чипови, секвенционирање CUT&;RUN и повикувачки картички.

Анализи за пристапност на ДНК

уреди

Развиени се анализи за да бидат идентификувани регионите на геномот кои се достапни. Овие региони на пристапен хроматин се кандидатски регулаторни региони. Овие анализи се ATAC-seq, DNase-Seq и FAIRE-Seq.

На ниво на РНК

уреди

Микрочипови

уреди
 
ДНК-микрочип.

Микрочиповите го мерат количеството на информациска РНК во примерок што одговара на даден ген или секвенца на ДНК со сонда. Секвенците со сонда се имобилизирани на цврста површина и се оставаат да се хибридираат со флуоресцентно означена „целна“ информациска РНК. Интензитетот на флуоресценцијата на точката е пропорционален на количината на целната секвенца што се хибридизирала со тоа место и затоа на изобилството на таа секвенца на информациска РНК во примерокот. Микрочиповите овозможуваат идентификација на кандидатски гени вклучени во дадена постапка врз основа на варијации помеѓу нивоата на транскрипти за различни услови и заеднички модели на изразување со гени со позната функција.

Сериска анализа на генското изразување

уреди

Сериската анализа на генското изразување е алтернативен метод на анализа заснован на секвенционирање на РНК наместо хибридизација. Оваа анализа се потпира на секвенционирање на ознаки од 10-17 базни парови кои се единствени за секој ген. Овие ознаки се произведувани од поли-А информациска РНК и се врзувани од крај до крај пред да бидат секвенционирани. SAGE дава непристрасно мерење на бројот на транскрипти по клетка, бидејќи тоа не зависи од претходното знаење за тоа кои транскрипти да бидат проучувани (како што прават микрочиповите).

Секвенционирање на РНК

уреди

Секвенционирањето на РНК ја презело технологијата на микросреди и сериската анализа на генското изразување во последниве години, како што било забележано во 2016 година, и стана најефикасниот начин за проучување на транскрипцијата и генското изразување. Ова обично се прави со секвенционирање со т.н. „следна генерација“.

Подгрупа на секвенционирани РНК се мали РНК, класа на некодирачки молекули на РНК кои се клучни регулатори на транскрипциското и послетранскрипциското потиштување на гените или потиштувањето на РНК. Секвенционирањето со „следна генерација“ е златна стандардна алатка за откривање, профилирање и анализа на изразување некодирачка РНК.

Масовно напоредни известувачки анализи

уреди

Масовно напоредните известувачки анализи се технологија за тестирање на цис-регулаторната активност на секвенците на ДНК Овие анализи користат плазмид со синтетички цис-регулаторен елемент горе од промоторот кој управува со синтетички ген како што е зелената флуоресцентна белковина. Библиотеката на цис-регулаторни елементи обично се тестира со користење вакви анализи, библиотеката може да содржи од стотици до илјадници цис-регулаторни елементи. Цис-регулаторната активност на елементите се проценува со користење на активноста на известувачот низводно. Активноста на сите членови на библиотеката е анализирана напоредно со користење на баркодови за секој цис-регулаторен елемент. Едно ограничување на овие аналиси е тоа што активноста е испитувана на плазмид и може да не ги опфати сите гледишта на генската регулација забележани во геномот.

Секвенционирање со самотранскрибирачки активен регулаторен регион

уреди

Секвенционирањето со самотранскрибирачки активен регулаторен регион е техника слична на Масовно напоредните известувачки анализи за да биде анализирана активноста на засилувачот на случајно скратените геномски фрагменти. Во изворната публикација, случајно исечените фрагменти од геномот на Drosophila биле поставени низводно од минимален промотор. Кандидатите за засилувачи меѓу случајно исечените фрагменти ќе се транскрибираат со помош на минималниот промотор. Со користење на секвенционирање како отчитување и контролирање на влезните количини на секоја секвенца, јачината на наводните засилувачи се оценува со овој метод.

Пертурбациско секвенционирање

уреди
 
Преглед на работниот тек на пертурбациско секвенционирање.

Пертурбациското секвенционирање ги спарува посредуваните генски падови со генско изразување на една клетка преку групирано редовните меѓупросторни кратки палиндромски повторувања. Линеарни модели се користени за пресметување на ефектот на падот на еден ген врз изразувањето на повеќе гени.

На белковинско ниво

уреди

Квасен двохибриден систем

уреди

Двохибридниот преглед на квасец ја тестира белковината „мамка“ против многу потенцијални интерактивни белковини („плен“) за да бидат идентификувани физичките меѓудејствија белковина со белковина. Овој систем се заснова на фактор на транскрипција, првично GAL4, чиишто посебни домени за врзување на ДНК и активирање на транскрипција се потребни за белковината да предизвика транскрипција на генот известувач. Во двохибридниот преглед, белковината „мамка“ се спојува со сврзувачкиот домен на GAL4, а библиотека на потенцијални „пленови“ (меѓудејствија) белковини е рекомбинантно изразена во вектор со доменот на активирање. Меѓудејствието, во живо, на белковините мамка и плен во клетка на квасец ги доближува домените на активирање и врзување на GAL4 доволно блиску еден до друг за да резултира со изразување на известувачки ген. Исто така, можно е систематски да биде тестирана библиотека со белковини од мамка против библиотека со белковини од плен за да се идентификуваат сите можни меѓудејствија во клетката.

Масена спектрометрија и афинитетно прочистување/масена спектрометрија

уреди

Масовната спектрометрија може да ги идентификува белковините и нивните релативни нивоа, па затоа може да биде користена за проучување на белковинското изразување. Кога е користена во комбинација со афинитетното прочистување, масената спектрометрија може да бидат користени за проучување на белковинските комплекси, односно, кои белковини меѓудејствуваат еден со друг во комплексите и во кои соодноси. Со цел да бидат прочистени белковинските комплекси, обично белковината „мамка“ е означен со специфична белковина или пептид што може да биде користен за да биде извлечен комплексот од сложената мешавина. Прочистувањето обично е вршено со користење на антитело или соединение што се врзува за делот за фузија. Белковините потоа се варени во кратки пептидни фрагменти и е користена масена спектрометрија за да бидат идентификувани белковините врз основа на односот маса-полнење на тие фрагменти.

Длабоко мутациско скенирање

уреди

Во длабокото мутациско скенирање најпрво е синтетизирана секоја можна промена на аминокиселините во дадена белковина. Активноста на секоја од овие варијанти на белковини е анализирана напоредно со користење на баркодови за секоја варијанта. Со споредување на активноста со белковината од дива врста, е идентификуван ефектот на секоја мутација. Иако е можно да биде проценета секоја можна единечна промена на аминокиселина поради комбинаторика, тешко е да бидат тестирани две или повеќе истовремени мутации. Опитите за длабоко мутационо скенирање исто така се користени за да биде заклучена структурата на меѓудејствијата белковина со белковина.

Мутагенеза и фенотипизација

уреди

Важна функционална одлика на гените е фенотипот предизвикан од мутации. Мутантите може да се произведат со случајни мутации или со насочена мутагенеза, вклучително и насочена мутагенеза, бришење на целосни гени или други техники.

Соборувања (бришење гени)

уреди

Функцијата на генот може да биде испитан со систематско „соборување“ на гените еден по еден. Ова е правено со бришење или со нарушување на функцијата (како што е вметната мутагенеза) и стекнатите организми се проверувани за фенотипови кои обезбедуваат индиции за функцијата на нарушениот ген. Направени се соборувања за цели геноми, односно со бришење на сите гени во геномот. За суштинските гени, тоа не е можно, па затоа се користат други техники, на пр. бришење на ген додека е изразуван генот од плазмид, со користење на индуциран промотор, така што нивото на генски производ може да биде променет по желба (а со тоа и „функционално“ бришење е постигнато).

Мутагенеза насочена кон место

уреди

Мутагенезата насочена кон местото е користена за мутација на специфични бази (а со тоа и аминокиселини). Ова е критично за да биде испитана функцијата на специфичните аминокиселини во белковината, на пр. во активното место на ензимот.

Мешање во РНК

уреди

Методите на мешање во РНК може да бидат користени за минливо замолчување или соборување на генското изразување со користење на ~20 базни парови со двоверижна РНК, обично испорачана со трансфекција на синтетички ~20-мерни кратко-интерферентни молекули на РНК или со вирусно кодирани краткофибна РНК. Прегледите на мешање во РНК, вообичаено изведени во анализи засновани на клеточна култура или опитни организми (како што е C. elegans) може да бидат користени за систематско нарушување на речиси секој ген во геномот или подмножества на гени (под-геном); можните функции на нарушените гени може да бидат доделени врз основа на набљудуваните фенотипови.

Прегледи со групирано редовните меѓупросторни кратки палиндромски повторувања

уреди
 
Пример на губење на функцијата преку преглед со групирано редовните меѓупросторни кратки палиндромски повторувања.

CRISPR-Cas9 (CRSIPR е кратенка за „групирано редовни меѓупросторни кратки палиндромски повторувања“) е користена за бришење гени на мултиплексиран начин во клеточните линии. Квантификувањето на количината на водич-РНК за секој ген пред и по опитот може да укаже на суштински гени. Ако водич-РНК го наруши суштинскиот ген, тоа ќе доведе до губење на таа клетка и оттука ќе има исцрпување на таа конкретна водилка-РНК по прегледот. Во неодамнешниот опит на CRISPR-cas9, во клеточни линии на цицачи, било откриено дека околу 2000 гени се суштински во повеќе клеточни линии. Некои од овие гени биле суштински само во една клеточна линија. Повеќето гени се дел од повеќебелковински комплекси. Овој пристап може да биде користен за да биде идентификуван синтетичката смртност со користење на соодветна генетска позадина. CRISPRi и CRISPRa овозможуваат прегледи со губење на функција и зголемување на функцијата на сличен начин. CRISPRi идентификувал ~2100 суштински гени во клеточната линија K562. Прегледите за бришење на групирано редовните меѓупросторни кратки палиндромски повторувања исто така се користени за да бидат идентификувани потенцијалните регулаторни елементи на генот. На пример, била објавена техника наречена ScanDel со која бил обиден овој пристап. Авторите избришале региони надвор од ген од интерес (HPRT1 вклучен во Менделово нарушување) во обид да ги идентификуваат регулаторните елементи на овој ген. Гасперини и соработниците не идентификувале никакви дистални регулаторни елементи за HPRT1 користејќи го овој пристап, но таквите пристапи може да бидат проширени на други гени од интерес.

Функционални прибелешки за гени

уреди

Геномска прибелешка

уреди

Наводните гени може да бидат идентификувани со скенирање на геном за региони кои веројатно ќе кодираат белковини, врз основа на одлики како што се долги отворени рамки за читање, секвенци на започнување на транскрипција и полиаденилација. Секвенцата идентификувана како наводен ген мора да биде потврдена со дополнителни докази, како што е сличноста со секвенците на cDNA или EST од истиот организам, сличноста на предвидената белковинска секвенца со познатите белковини, поврзаноста со промоторните секвенци или доказ дека мутирањето на секвенцата произведува забележлив фенотип.

Пристап „Камен од розета“

уреди

Пристапот „Камен од Розета“ е пресметковен метод за од почеток белковинска прогноза на функцијата. Се заснова на хипотезата дека некои белковини вклучени во дадена физиолошка постапка може да постојат како два посебни гени во еден организам и како единствен ген во друг. Геномите се скенирани за секвенци кои се независни во еден организам и во една отворена рамка за читање во друг. Ако два гени се споиле, се предвидува дека тие имаат слични биолошки функции што ја прават таквата корегулација поволна.

Биоинформатички методи за функционална геномика

уреди

Поради големото количество податоци произведени од овие техники и желбата да бидат пронајдени биолошки значајни обрасци, биоинформатиката е од клучно значење за анализата на функционалните геномски податоци. Примери на техники во оваа класа се групирање податоци или анализа на главна компонента за машинско учење без надзор (откривање класа), како и вештачки невронски мрежи или векторски машини за поддршка за надгледувано машинско учење (предвидување класа, класификација). Функционална анализа на збогатување е користена за да биде одреден степенот на прекумерно или недоволно изразување (позитивни или негативни регулатори во случај на прегледи со мешање во РНК) на функционални категории во однос на множества на позадина. Анализата на збогатување заснована на генска онтологија е обезбедена од Базата на податоци за прибелешки, визуелизација и интегрирано откривање и анализата на збогатување на генски множества, анализа базирана на патека од Ingenuity[3] и студио Pathway [4] и анализа заснована на белковински комплекси од страна на COMPLEAT.

 
Преглед на работниот тек на фидмите.

Развиени се нови сметачки методи за разбирање на резултатите од опитите за длабоко мутациско скенирање. „Фидмите“ го споредуваат резултатот од опитот за длабоко мутациско скенирање со филогенетско дрво. Ова му овозможува на корисникот да заклучи дали постапката на одбирање во природата применува слични ограничувања на белковината како што покажуваат резултатите од длабокото мутациско скенирање. Ова може да му овозможи на опитувачот да избира помеѓу различни опитни услови врз основа на тоа колку добро ја одразуваат природата. Длабокото мутациско скенирање исто така е користено за да бидат заклучени меѓудејствијата белковина со белковина. Авторите користеле термодинамички модел за да ги предвидат ефектите на мутациите во различни делови на димерот. Длабоката мутациска структура, исто така, може да биде користена за да биде заклучена структурата на белковините. Силната позитивна епистаза помеѓу две мутации во длабоко мутациско скенирање може да биде показател за два дела од белковината кои се блиску еден до друг во тродимензионален простор. Оваа информација потоа може да биде користена за да биде заклучена структурата на белковините. Доказ за начелото на овој пристап бил прикажан од две групи кои ја користеле белковината GB1.

Резултатите од опитите со масовно напоредните известувачки анализи барале пристапи за машинско учење за толкување на податоците. Употребен е процепувачки k-mer SVM модел за да бидат заклучени кмерите кои се збогатени во рамките на цис-регулаторните секвенци со висока активност во споредба со секвенците со помала активност. Овие модели обезбедуваат висока моќ на предвидување. Пристапите за длабоко учење и случајни шумски пристапи исто така се користени за толкување на резултатите од овие високодимензионални опити. Овие модели почнуваат да помагаат да биде развиено подобро разбирање на функцијата на некодирачката ДНК кон генската регулација.

Конзорциумски проекти насочени кон функционалната геномика

уреди

Проект „ENCODE“

уреди

Проектот ENCODE (Енциклопедија на ДНК елементи) е длабинска анализа на човечкиот геном чија цел е да бидат идентификувани сите функционални елементи на геномната ДНК, и во кодирачки и во некодирачки региони. Важните резултати вклучуваат докази од геномските плочки дека повеќето нуклеотиди се транскрибираат како кодирани транскрипти, некодирачки РНК или случајни транскрипти, откривање на дополнителни транскрипциски регулаторни места, дополнително разјаснување на механизмите за модифицирање на хроматин.

Проект „Изразување генотип со ткиво“

уреди
 
Употребени примероци и eQTL откриени во GTEx v6.

Проектот „Изразување генотип со ткиво“ е проект за човечка генетика чија цел е да биде разбрана улогата на генетските варијации во обликувањето на варијациите во транскриптомите низ ткивата. Проектот има собрано различни примероци од ткиво (> 50 различни ткива) од повеќе од 700 дарители по смртта. Ова резултираки со собирање на >11.000 примероци. Проектот помогнал да биде разбрано споделувањето на ткивото и специфичноста на ткивото преку изразување со квантитативни особини на локуси. Геномскиот ресурс бил развиен за „да го збогати нашето разбирање за тоа како разликите во нашата секвенца на ДНК придонесува за здравјето и болестите“.[5]

Поврзано

уреди

 

Наводи

уреди
  1. Gibson G, Muse SV. A primer of genome science (3rd. изд.). Sunderland, MA: Sinauer Associates.
  2. Pevsner J (2009). Bioinformatics and functional genomics (2nd. изд.). Hoboken, NJ: Wiley-Blackwell. ISBN 9780470085851.
  3. „Ingenuity Systems“. Архивирано од изворникот на 1999-01-25. Посетено на 2007-12-31.
  4. „Ariadne Genomics: Pathway Studio“. Архивирано од изворникот на 2007-12-30. Посетено на 2007-12-31.
  5. „GTEx Creates a Reference Data Set to Study Genetic Changes and Gene Expression“. National Institutes of Health : Office of Strategic Coordination - The Common Fund. 8 февруари 2018. Посетено на 2022-01-13.

Надворешни врски

уреди