Човечкиот геном е комплетен сет на секвенци на нуклеинска киселина за луѓето, кодирани како ДНК во 23-те хромозомски парови во клеточните јадра и во мала молекула на ДНК пронајдена во поединечни митохондрии. Тие обично се третираат одделно како нуклеарен геном и митохондријален геном.[1] Човечките геноми вклучуваат и ДНК секвенци кои кодираат протеини и различни типови на ДНК што не ги кодираат протеините. Последново е разновидна категорија која вклучува ДНК кодирање за непреведена РНК, како што е онаа за рибозомална РНК, трансферна РНК, рибозими, мали нуклеарни РНК и неколку типови на регулаторни РНК. Исто така, вклучува промотори и нивни поврзани ген-регулаторни елементи, ДНК што игра структурни и репликативни улоги, како што се областите на скелето, теломерите, центромерите и потеклото на репликацијата, плус голем број транспонирани елементи, вметната вирусна ДНК, нефункционални псевдогени и едноставни, многу повторувачки секвенци. Интроните сочинуваат голем процент од некодирачка ДНК. Дел од оваа некодирачка ДНК е нефункционална несакана ДНК, како што се псевдогени, но не постои цврст консензус за вкупната количина на несакана ДНК.

Хаплоидните човечки геноми, кои се содржани во герминативните клетки (клетките на јајце клетките и гаметите на спермата создадени во фазата на мејоза на сексуалната репродукција пред оплодувањето) се состојат од 3.054.815.472 базни парови на ДНК (ако се користи Х-хромозом),[2] додека женските диплоидни геноми (пронајдени во соматските клетки) имаат двојно поголема содржина на ДНК.

Иако постојат значајни разлики меѓу геномите на човечките индивидуи (од редот од 0,1% поради еднонуклеотидните варијанти [3] и 0,6% кога се разгледуваат инделите),[4] тие се значително помали од разликите помеѓу луѓето и нивните најблиски живи роднини, бонобо и шимпанза (~ 1,1% фиксни еднонуклеотидни варијанти [5] и 4% кога се вклучени индели).[6] Големината во базни парови може да варира исто така; должината на теломерите се намалува по секој круг на репликација на ДНК.

Иако секвенцата на човечкиот геном е целосно одредена со секвенционирање на ДНК во 2022 година (вклучувајќи метилација ), таа сè уште не е целосно разбрана. Повеќето, но не сите, гени се идентификувани со комбинација на експериментални и биоинформатички пристапи со висока пропусна моќ, но сепак треба да се направи уште многу работа за дополнително да се разјаснат биолошките функции на нивните протеини и РНК производи (особено, прибелешка на целосниот CHM13v2 .0 секвенца сè уште е во тек [7]).

Во 2003 година, научниците пријавиле секвенционирање на 85% од целиот човечки геном, но до 2020 година најмалку 8% сè уште недостасувале. Во 2021 година, научниците пријавиле секвенционирање на целосниот женски геном (т.е. без Y-хромозомот).[8] Оваа секвенца идентификувала 19.969 протеин -кодирачки секвенци, кои сочинуваат приближно 1,5% од геномот и вкупно 63.494 гени, од кои повеќето се некодирачки РНК гени. Геномот се состои од регулаторни ДНК секвенци, долго прошаран нуклеарен елемент, краток прошаран нуклеарен елемент, интрони и секвенци за кои сè уште не е одредена функција. Човечкиот Y хромозом, кој се состои од 62.460.029 базни парови од различна клеточна линија и пронајден кај сите мажи, бил комплетно секвенциониран во јануари 2022 година [9][10]

Во 2023 година, бил објавен нацрт-навод за човечки пангеном.[11] Се заснова на 47 геноми од лица од различна етничка припадност. Во тек се планови за подобрен навод што ќе долови уште поголема биоразновидност од уште поширок примерок.

Секвенции

уреди

Првите секвенци на човечки геном биле објавени во речиси целосна нацрт-форма во февруари 2001 година од страна на проектот за човечки геном [12] и Celera Corporation.[13] Завршувањето на напорите за секвенционирање на Проектот за човечки геном било објавено во 2004 година со објавување на нацрт-геномската секвенца, оставајќи само 341 празнини во низата, што претставува многу повторувачка и друга ДНК што не можела да се секвенционира со технологијата достапна во тоа време.[14] Човечкиот геном бил првиот од сите 'рбетници што бил секвенциониран до таков скоро завршен, а од 2018 година, диплоидните геноми на повеќе од милион индивидуални луѓе биле утврдени со користење на секвенционирање на следната генерација.

Овие податоци се користат ширум светот во биомедицинската наука, антропологијата, форензиката и другите гранки на науката. Ваквите геномски студии довеле до напредок во дијагнозата и третманот на болестите и до нови сознанија во многу области на биологијата, вклучително и човечката еволуција.

До 2018 година, вкупниот број на гени бил зголемен на најмалку 46.831,[15] плус уште 2300 микро-РНК гени.[16] Истражувањето на населението од 2018 година открило уште 300 милиони бази на човечки геном што не биле во наводната секвенца.[17] Пред стекнувањето на целосната геномска секвенца, проценките за бројот на човечки гени се движиле од 50.000 до 140.000 (со повремена нејасност околу тоа дали овие проценки вклучуваат гени кои не кодираат протеини).[18] Како што се подобрил квалитетот на секвенцата на геномот и методите за идентификување на гените за кодирање на протеини, бројот на признати гени за кодирање на протеини се намалил на 19.000-20.000.[19]

Во јуни 2016 година, научниците официјално го објавиле проектот HGP-Write, план за синтеза на човечкиот геном.[20][21]

Во 2022 година, конзорциумот Теломер-на-Теломер (T2T) ја пријавил целосната секвенца на човечки женски геном, пополнувајќи ги сите празнини во Х-хромозомот (2020) и 22-те автозоми (мај 2021 година).[22] Деловите кои претходно не биле секвенцирани содржат гени за имунолошки одговор кои помагаат да се прилагодат и преживеат инфекциите, како и гени кои се важни за предвидување на одговорот на лекот.[23] Завршената секвенца на човечкиот геном, исто така, треба да обезбеди подобро разбирање на човечкото формирање како индивидуален организам и како луѓето се разликуваат меѓу себе и меѓу другите видови.

Постигнување на комплетност

уреди

Иако „завршувањето“ на проектот за човечкиот геном било објавено во 2001 година,[24] останале стотици празнини, при што околу 5-10% од вкупната низа останала неодредена. Недостасувале генетски информации главно во репетитивните хетерохроматски региони и во близина на центромерите и теломерите, но исто така и некои еухроматски региони кои кодираат ген.[25] Останале 160 еухроматски празнини во 2015 година, кога биле утврдени секвенците што опфаќаат уште 50 претходно несеквенционирани региони.[26] Дури во 2020 година била утврдена првата вистинска комплетна секвенца од теломер до теломер на човечки хромозом, имено на Х-хромозомот .[27] Првата комплетна секвенца од теломер до теломер на човечки автосомален хромозом, хромозом 8, следела една година подоцна.[28] Целосниот човечки геном (без Y хромозом) бил објавен во 2021 година, додека со Y хромозомот во јануари 2022 година.[29]

Во 2023 година, бил објавена нацрт-навод за човечки пангеном. Се заснова на 47 геноми од лица од различна етничка припадност. Во тек се планови за подобрени наводи што ќе доловат уште поголема биоразновидност од уште поширок примерок.

Молекуларна организација и содржина на гени

уреди

Вкупната должина на човечкиот референтен геном не ја претставува секвенцата на која било специфична индивидуа. Геномот е организиран во 22 спарени хромозоми, наречени автозоми, плус 23-тиот пар полови хромозоми (XX) кај женката и (XY) кај мажот. Овие хромозоми се сите големи линеарни молекули на ДНК содржани во клеточното јадро. Тековната верзија на човечкиот референтен геном вклучува по една копија од секоја од автозомите плус една копија од двата полови хромозоми (X и Y). Вкупната количина на ДНК е 3,1 милијарди базни парови (3,1 Mb).[30]

Информативна содржина

уреди

Моменталната верзија на човечкиот референтен геном содржи речиси 20.000 гени за кодирање на протеини и околу 26.000 некодирачки гени. Општо е прифатено дека има околу 20.000 гени кои кодираат протеини. Некодирачките гени извршуваат голем број клеточни функции.[31][32][33][34] Има помала согласност за вкупниот број на некодирачки гени бидејќи некои автори веруваат дека многу од транскриптите немаат функција.[35]

Кодирачка наспроти некодирачка ДНК

уреди

Содржината на човечкиот геном најчесто се дели на кодирани и некодирани секвенци на ДНК. Кодирачката ДНК е дефинирана како оние секвенци кои можат да се транскрибираат во mRNA и да се преведат во протеини во текот на човечкиот животен циклус; овие секвенци заземаат само мал дел од геномот (<2%). Некодирачката ДНК е составена од сите оние секвенци (приближно 98% од геномот) кои не се користат за кодирање на протеините.

Некои некодирачки ДНК содржат гени за РНК молекули со важни биолошки функции (како некодирачка РНК, на пример рибозомска РНК и транспортна РНК). Истражувањето на функцијата и еволутивното потекло на некодирачката ДНК е важна цел на современото истражување на геномот, вклучувајќи го и проектот ENCODE (Енциклопедија на ДНК елементи), кој има за цел да го испита целиот човечки геном, користејќи различни експериментални алатки чии резултати се индикативни на молекуларна активност. Сепак, спорно е дали молекуларната активност (транскрипција на ДНК во РНК) сама по себе имплицира дека произведената РНК има значајна биолошка функција, бидејќи експериментите покажале дека случајната нефункционална ДНК, исто така, репродуктивно ќе регрутира фактори на транскрипција што резултира со транскрипција во нефункционална РНК.[36]

Не постои консензус за тоа што всушност претставува „функционален“ елемент во геномот бидејќи генетичарите, еволуционите биолози и молекуларните биолози користат различни дефиниции и методи.[37][38] Поради двосмисленоста во терминологијата, се појавиле различни толкувања на мислата.[39] Во еволутивните дефиниции, „функционалната“ ДНК, без разлика дали е кодирана или некодирана, придонесува за кондицијата на организмот и затоа се одржува со негативен еволутивен притисок, додека „нефункционалната“ ДНК нема никаква корист за организмот и поради тоа се наоѓа под неутрален селективен притисок. Овој тип на ДНК е опишан како несакана ДНК [40][41] Во генетските дефиниции, „функционалната“ ДНК е поврзана со тоа како ДНК сегментите се манифестираат по фенотип, а „нефункционалната“ е поврзана со ефектите на губење на функцијата врз организмот. Во биохемиските дефиниции, „функционалната“ ДНК се однесува на секвенците на ДНК кои ги специфицираат молекуларните производи (на пример некодирани РНК) и биохемиските активности со механички улоги во регулацијата на генот или геномот (т.е. ДНК секвенци кои влијаат на активноста на клеточно ниво, како што се типот, состојбата и молекуларниот процес на клетката).[42] Не постои консензус во литературата за количината на функционална ДНК бидејќи, во зависност од тоа како се разбира „функцијата“, се проценети опсезите од до 90% од човечкиот геном е веројатно нефункционална ДНК [43] до нагоре. до 80% од геномот е веројатно функционален.[44] Исто така, можно е несаканата ДНК да добие функција во иднина и затоа може да игра улога во еволуцијата,[45] но тоа веројатно ќе се случи многу ретко. Конечно ДНК што е штетна за организмот и е под негативен селективен притисок се нарекува „ѓубре“ ДНК.

Бидејќи некодираната ДНК во голема мера ја надминува бројната кодирана ДНК, концептот на секвенцираниот геном станал пофокусиран аналитички концепт од класичниот концепт на генот за кодирање на ДНК.[46][46]

Кодирани секвенци (гени за кодирање на протеини)

уреди
 
Човечки гени категоризирани според функцијата на транскрибираните протеини, дадени и како број на кодирани гени и процент од сите гени [47]

Секвенците за кодирање на протеини ја претставуваат најшироко проучената и најдобро разбрана компонента на човечкиот геном. Овие секвенци на крајот водат до производство на сите човечки протеини, иако неколку биолошки процеси (како на пример ДНК рекомбинација и алтернативно пред-мРНК спојување) може да доведат до производство на многу повеќе уникатни протеини од бројот на гени кои кодираат протеини. Целосниот модуларен протеинско-кодирачки капацитет на геномот е содржан во егзомот и се состои од ДНК секвенци кодирани од егзони кои можат да се претворат во протеини. Поради својата биолошка важност и фактот дека сочинува помалку од 2% од геномот, секвенционирањето на егзомот било првата голема пресвртница на проектот за човечки геном.

Број на кодирани гени на протеини. Во базите на податоци како што е Uniprot се забележани 20.000 човечки протеини.[48] Историски гледано, проценките за бројот на протеински гени варираат во голема мера, движејќи се до 2.000.000 во доцните 1960-ти,[49] но неколку истражувачи истакнале во раните 1970-ти дека проценетата мутациона оптовареност од штетните мутации поставила горна граница од приближно 40.000 за вкупниот број на функционални локуси (ова вклучува кодирани гени на протеини и функционални некодирачки гени).[50] Бројот на кодирани гени на човечките протеини не е значително поголем од оној на многу помалку сложени организми, како што се виткиот црв и мушичката. Оваа разлика може да произлезе од широката употреба на алтернативно пред-mRNA спојување кај луѓето, што обезбедува способност да се изгради многу голем број модуларни протеини преку селективно инкорпорирање на егзони.

Капацитет за кодирање на протеини по хромозом. Гените за кодирање на протеините се нерамномерно распоредени низ хромозомите, кои се движат од неколку десетици до повеќе од 2000, со особено висока генска густина во хромозомите 1, 11 и 19. Секој хромозом содржи различни региони богати со гени и сиромашни со гени, кои можат да бидат во корелација со цитогенетиката и GC-содржина.[51] Значењето на овие неслучајни обрасци на генска густина не е добро разбрано.

Големина на кодираните гени на протеини. Големината на кодираните гени на протеини во човечкиот геном покажува огромна варијабилност. На пример, генот за хистон H1a (HIST1HIA) е релативно мал и едноставен, нема интрони и кодира mRNA долга 781 нуклеотид кој произведува протеин од 215 аминокиселини од неговата отворена рамка за читање од 648 нуклеотиди. Дистрофин (DMD) бил најголемиот кодиран ген на протеини во човечкиот референтен геном од 2001 година, опфаќајќи вкупно 2,2 милиони нуклеотиди,[52] додека поновата систематска мета-анализа на ажурираните податоци за човечкиот геном идентификувала уште поголем кодиран ген на протеини. RBFOX1 (РНК врзувачки протеин, хомолог fox-1 1), кој опфаќа вкупно 2,47 милиони нуклеотиди.[53] Титин (TTN) има најдолга кодирана секвенца (114.414 нуклеотиди), најголем број егзони (363), и најдолг единечен егзон (17.106 нуклеотиди). Како што се проценува врз основа на куриран збир на гени кои кодираат протеини во целиот геном, средната големина е 26.288 нуклеотиди (средна вредност = 66.577), средната големина на егзонот, 133 нуклеотиди (средна вредност = 309), просечниот број на егзони, 8 ( средна вредност = 11), а просечниот кодиран протеин е 425 аминокиселини (просечно = 553) во должина.

Примери на кодирани гени на човечки протеини
Протеин Хром Ген Должина Егзони Должина на егзон Должина на ентрон Alt splicing
Протеин за подложност на рак на дојка тип 2 13 BRCA2 83,736 27 11,386 72,350 yes
Регулатор на трансмембранска спроводливост на цистична фиброза 7 CFTR 202,881 27 4,440 198,441 yes
Цитохромb MT MTCYB 1,140 1 1,140 0 no
Дистрофин X DMD 2,220,381 79 10,500 2,209,881 yes
Глицералдехид-3-фосфат дехидрогеназа 12 GAPDH 4,444 9 1,425 3,019 yes
Хемоглобин 11 HBB 1,605 3 626 979 no
Хистон H1A 6 HIST1H1A 781 1 781 0 no
Титин 2 TTN 281,434 364 104,301 177,133 yes

Некодирана ДНК (ncDNA)

уреди

Некодираната ДНК е дефинирана како сите секвенци на ДНК во геномот кои не се наоѓаат во ексоните кои кодираат протеини и затоа никогаш не се претставени во аминокиселинската секвенца на изразените протеини. Според оваа дефиниција, повеќе од 98% од човечкиот геном е составен од ncDNA.

Идентификувани се бројни класи на некодирана ДНК, вклучувајќи гени за некодирана РНК (на пр. tRNA и rRNA), псевдогени, интрони, непреведени региони на mRNA, регулаторни ДНК секвенци, повторувачки ДНК секвенци и секвенци поврзани со мобилни генетски елементи.

Бројни секвенци кои се вклучени во гените се исто така дефинирани како некодирана ДНК. Тие вклучуваат гени за некодирачка РНК (на пр. tRNA, rRNA) и непреведени компоненти на гените за кодирање на протеини (на пр. интрони и 5' и 3' непреведени региони на mRNA).

Секвенците за кодирање на протеини (конкретно, кодирани егзони) сочинуваат помалку од 1,5% од човечкиот геном. Покрај тоа, околу 26% од човечкиот геном е интрон.[54] Освен гените (екзони и интрони) и познатите регулаторни секвенци (8-20%), човечкиот геном содржи региони на некодирна ДНК. Точната количина на некодирна ДНК која игра улога во клеточната физиологија е жестока дебатирана. Анализата на проектот Енциклопедија на ДНК елементи покажува дека 80% од целиот човечки геном е или транскрибиран, се врзува за регулаторните протеини или е поврзан со некоја друга биохемиска активност.[55]

Сепак, останува контроверзно дали целата оваа биохемиска активност придонесува за клеточната физиологија или дали значителен дел од ова е резултат на транскрипционата и биохемиската бучава, која мора активно да се филтрира од организмот.[56] Со исклучок на протеинските секвенци, интроните и регулаторни региони, голем дел од некодираната ДНК е составена од: голем број ДНК секвенци кои не играат улога во генската експресија имаат важни биолошки функции. Компаративните геномски проучувања покажуваат дека околу 5% од геномот содржи секвенци на некодирана ДНК кои се високо конзервирани, понекогаш на временски размери што претставуваат стотици милиони години, што имплицира дека овие некодирани региони се под силен еволутивен притисок и прочистувачка селекција.[57]

Голем дел од овие секвенци ја регулираат структурата на хромозомите со ограничување на областите на формирање на хетерохроматин и регулирање на структурните карактеристики на хромозомите, како што се теломерите и центромерите. Други некодирани региони служат како потекло на репликацијата на ДНК. Конечно, неколку региони се транскрибираат во функционална некодирана РНК која ја регулира експресијата на гените кои кодираат протеини (на пример [58]), транслацијата и стабилноста на mRNA (види микро РНА), структурата на хроматин (вклучувајќи модификации на хистон, на пример [59] ), ДНК метилација (на пример [60]), рекомбинација на ДНК (на пример [61]) и вкрстено регулирање на други некодирачки РНК (на пример [62]). Исто така, веројатно е дека многу транскрибирани некодирани региони не имаат никаква улога и дека оваа транскрипција е производ на неспецифична активност на РНК полимераза.

Псевдогени

уреди

Псевдогените се неактивни копии на кодирните гени на протеини, често генерирани со дуплирање на гените, кои станале нефункционални преку акумулација на инактивирачки мутации. Бројот на псевдогени во човечкиот геном е од редот на 13.000,[63] и во некои хромозоми е скоро ист како и бројот на функционални гени кои кодираат протеини. Умножувањето на гените е главен механизам преку кој се генерира нов генетски материјал за време на молекуларната еволуција.

На пример, семејството на генски рецептори за мирис е еден од најдобро документираните примери на псевдогени во човечкиот геном. Повеќе од 60% од гените во ова семејство се нефункционални псевдогени кај луѓето. За споредба, дури 20% од гените во семејството на генски рецептори за мирис на глувци се псевдогени. Истражувањата сугерираат дека ова е специфична карактеристика на видот, бидејќи најблиските примати имаат пропорционално помалку псевдогени. Ова генетско откритие помага да се објасни помалку акутното чувство за мирис кај луѓето во однос на другите цицачи.[64]

Гени за некодирана РНК (ncRNA)

уреди

Некодираните РНК молекули играат многу суштински улоги во клетките, особено во многуте реакции на синтеза на протеини и обработка на РНК. Некодираната РНК вклучува транспортна РНК, рибозомална РНК, микро-РНК, мала нуклеарна РНА и други некодирачки РНК гени вклучувајќи околу 60.000 долги некодирани РНК (lncRNAs).[65][66][67] Иако бројот на пријавени гени на lncRNA продолжува да расте и точниот број во човечкиот геном допрва треба да се дефинира, многу од нив се смета дека се нефункционални.[68]

Голем број на долги некодирани РНК се критични елементи во генската регулација и изразување. Некодираната РНК, исто така, придонесува за епигенетиката, транскрипцијата, спојувањето на РНК и транслациската машинерија. Улогата на РНК во генетската регулација и болеста нуди ново потенцијално ниво на неистражена геномска сложеност.[69]

Интрони и непреведени региони на mRNA

уреди

Покрај молекулите на долги некодирани РНК кои се кодирани од дискретни гени, почетните транскрипти на гените кои кодираат протеини обично содржат обемни некодирани секвенци, во форма на интрони, 5'-непреведени региони (5'-UTR) и 3'-непреведени региони (3'-UTR). Во повеќето протеински-кодирани гени на човечкиот геном, должината на секвенците на интроните е 10- до 100 пати поголема од должината на секвенците на егзони.

Повторувачки ДНК секвенци

уреди

Човечкиот геном има многу различни регулаторни секвенци кои се клучни за контролирање на генската експресија. Конзервативните проценки покажуваат дека овие секвенци сочинуваат 8% од геномот,[70] сепак екстраполации од проектот Енциклопедија на РНК елементите покажуваат дека 20 [71] -40% [72] од геномот е ген-регулаторна секвенца. Некои типови на некодирани ДНК се генетски „прекинувачи“ кои не ги кодираат протеините, но регулираат кога и каде се изразуваат гените (наречени засилувачи).[73]

Регулаторните секвенци се познати уште од доцните 1960-ти.[74] Првата идентификација на регулаторните секвенци во човечкиот геном се потпирала на технологијата на рекомбинантна ДНК.[75] Подоцна со доаѓањето на геномското секвенционирање, идентификацијата на овие секвенци може да се заклучи со еволутивна конзервација. Еволутивната гранка помеѓу приматите и глушецот, на пример, се случила пред 70-90 милиони години.[76] Така, компјутерските споредби на генските секвенци кои идентификуваат зачувани некодирани секвенци ќе бидат показател за нивната важност во должностите како што е регулацијата на гените.[77]

Други геноми се секвенционирани со истата намера за да помогнат во методите водени од зачувување, на пример геномот на тетраодонтовите.[78] Сепак, регулаторните секвенци исчезнуваат и повторно се развиваат за време на еволуцијата со голема брзина.[79][80][81]

Започнувајќи од 2012 година, напорите се префрлиле кон пронаоѓање на интеракции помеѓу ДНК и регулаторните протеини со техниката ChIP-Seq, или празнини каде што ДНК не е спакувана со хистони ( преосетливи места на DNase), кои и двете кажуваат каде има активни регулаторни секвенци во истражуваниот тип на клетка.[70]

Регулаторни ДНК секвенци

уреди

Повторливите секвенци на ДНК сочинуваат приближно 50% од човечкиот геном.[82]

Околу 8% од човечкиот геном се состои од тандем ДНК низи или тандемски повторувања, ниска сложеност на повторувачки секвенци кои имаат повеќе соседни копии (на пример „CAGCAGCAG...“).[83] Тандемските секвенци може да бидат со променлива должина, од два нуклеотиди до десетици нуклеотиди. Овие секвенци се многу променливи, дури и меѓу тесно поврзани лица, и поради тоа се користат за генеалошко тестирање на ДНК и форензичка ДНК анализа .[84]

Повторените секвенци од помалку од десет нуклеотиди (на пр. динуклеотидното повторување (AC) n ) се нарекуваат микросателитски секвенци. Помеѓу микросателитните секвенци, тринуклеотидните повторувања се од особена важност, бидејќи понекогаш се случуваат во кодираните региони на гените за протеините и може да доведат до генетски нарушувања. На пример, Хантингтоновата болест е резултат на проширување на тринуклеотидното повторување (CAG) n во рамките на Хантингтин генот на човечкиот хромозом 4. Теломерите (краевите на линеарните хромозоми) завршуваат со микросателитско хексануклеотидно повторување на низата (TTAGGG) n

Тандемските повторувања на подолги секвенци (низи од повторени секвенци долги 10-60 нуклеотиди) се нарекуваат минисателити.[85]

Мобилни генетски елементи (транспозони) и нивните реликвии

уреди

Транспозонските генетски елементи, секвенците на ДНК кои можат да се реплицираат и да вметнат копии од себе на други места во рамките на геномот на домаќинот, се обилна компонента во човечкиот геном. Најзастапената транспозонска лоза, Alu, има околу 50.000 активни копии,[86] и може да се вметне во интрагенски и меѓугенски региони.[87] Една друга лоза, LINE-1, има околу 100 активни копии по геном (бројот варира помеѓу луѓето).[88] Заедно со нефункционалните реликвии на стари транспозони, тие сочинуваат повеќе од половина од вкупната човечка ДНК.[89] Тие некогаш биле наречени „скокачки гени“. Транспозоните одиграле главна улога во извајањето на човечкиот геном. Некои од овие секвенци претставуваат ендогени ретровируси, ДНК копии на вирусни секвенци кои станале трајно интегрирани во геномот и денес се пренесуваат на следните генерации.

Мобилните елементи во човечкиот геном може да се класифицираат во LTR ретротранспонзони (8,3% од вкупниот геном), SINE (13,1% од вкупниот геном) вклучувајќи Alu елементи, ЛИНИИ (20,4% од вкупниот геном), SVA (SINE- VNTR -Alu) и Класа II ДНК транспозони (2,9% од вкупниот геном).

Геномска варијација кај луѓето

уреди

Човечки наводен геном

уреди

Со исклучок на идентични близнаци, сите луѓе покажуваат значителни варијации во секвенците на геномската ДНК. Човечкиот наводен геном (HRG) се користи како стандарден навод за секвенца.

Постојат неколку важни точки во врска со човечкиот наводен геном:

  • HRG е хаплоидна низа. Секој хромозом е претставен еднаш.
  • HRG е композитна низа и не одговара на ниту една вистинска човечка индивидуа.
  • HRG периодично се ажурира за да се поправат грешките, нејаснотијата и непознатите „празнини“.
  • HRG во никој случај не претставува „идеална“ или „совршена“ човечка индивидуа. Тоа е едноставно стандардизирано претставување или модел што се користи за компаративни цели.

Наводниот конзорциум за геном е одговорен за ажурирање на HRG. Верзијата 38 била објавена во декември 2013 година..[90]

Мерење на човечка генетска варијација

уреди

Повеќето проучувања за човековите генетски варијации се фокусирани на еднонуклеотидни полиморфизми (SNPs), кои се замени во поединечни бази по должината на хромозомот. Повеќето анализи проценуваат дека SNP се појавуваат 1 од 1000 базни парови, во просек, во ехроматичниот човечки геном, иако тие не се појавуваат со еднаква густина. Така следи популарната изјава дека „сите сме, без разлика на расата, генетски 99,9% исти“,[91] иако тоа би било донекаде квалификувано од повеќето генетичари. На пример, денес се смета дека многу поголем дел од геномот е вклучен во варијацијата на бројот на копии.[92] Голем заеднички напор за каталог на варијации на SNP во човечкиот геном е преземен од страна на Меѓународниот проект HapMap.

Геномските локуси и должината на одредени типови на мали повторувачки секвенци се многу променливи од личност до личност, што е основа на технологиите за земање отпечатоци од прсти и ДНК за тестирање на татковство. Се смета дека хетерохроматските делови од човечкиот геном, кои се вкупно неколку стотици милиони базни парови, се доста променливи во рамките на човечката популација (тие се толку повторливи и толку долги што не можат точно да се секвенционираат со сегашната технологија). Овие региони содржат малку гени и не е јасно дали некој значаен фенотипски ефект е резултат на типичната варијација во повторувањата или хетерохроматинот.

Повеќето груби геномски мутации во гаметните герминативни клетки веројатно резултираат со неиздржливи ембриони; сепак, голем број човечки болести се поврзани со големи геномски абнормалности. Даунов синдром, Тарнеров синдром и голем број други болести се резултат на неразградување на цели хромозоми. Клетките на ракот често имаат анеуплоидија на хромозомите и краците на хромозомите, иако не е утврдена причинско-последична врска помеѓу анеуплоидијата и ракот.

Мапирање на човечка геномска варијација

уреди

Додека геномската секвенца го наведува редоследот на секоја база на ДНК во геномот, мапата на геномот ги идентификува обележјата. Картата на геномот е помалку детална од геномската секвенца и помага во навигацијата околу геномот.[93][94]

Пример за карта на варијации е HapMap што се развива од Меѓународниот проект HapMap. HapMap претставува хаплотипска карта на човечкиот геном, „која ќе ги опише заедничките обрасци на варијација на секвенцата на човечката ДНК“.[95] Таа ги каталогизира моделите на мали варијации во геномот кои вклучуваат единечни ДНК букви или бази.

Истражувачите ја објавиле првата карта заснована на секвенца на големи структурни варијации низ човечкиот геном во списанието Nature во мај 2008 година.[96][97] Структурните варијации од големи размери претставуваат разлики во геномот меѓу луѓето кои се движат од неколку илјади до неколку милиони ДНК бази; некои се добивки или загуби на протегања на геномската секвенца, а други се појавуваат како преуредување на делови од секвенца. Овие варијации вклучуваат разлики во бројот на копии кои поединците ги имаат од одреден ген, бришења, транслокации и инверзии.

Структурна варијација

уреди

Структурните варијации се однесуваат на генетски варијанти кои влијаат на поголеми сегменти од човечкиот геном, наспроти точкести мутации. Често, структурните варијанти (SV) се дефинираат како варијанти од 50 базни парови (bp) или поголеми, како што се бришења, дупликации, вметнувања, инверзии и други преуредувања. Околу 90% од структурните варијанти се некодирачки бришења, но повеќето поединци имаат повеќе од илјада такви бришења; големината на бришењата се движи од десетици базни парови до десетици илјади bp.[98] Во просек, поединците носат ~ 3 ретки структурни варијанти кои ги менуваат кодираните региони, на пр. бришење на егзони . Околу 2% од поединците носат ултра ретки структурни варијанти во мегабаза, особено преуредувања. Односно, милиони базни парови може да се превртат во хромозомот; ултра-ретки значи дека тие се наоѓаат само кај поединци или членови на нивното семејство и затоа се појавиле многу неодамна.

Фреквенција на SNP низ човечкиот геном

уреди

Еднонуклеотидните полиморфизми (SNP) не се појавуваат хомогено низ човечкиот геном. Всушност, постои огромна разновидност во фреквенцијата на SNP помеѓу гените, што одразува различни селективни притисоци врз секој ген, како и различни стапки на мутација и рекомбинација низ геномот. Сепак, студиите за SNP се пристрасни кон регионите за кодирање, податоците генерирани од нив веројатно нема да ја одразуваат целокупната дистрибуција на SNP низ геномот. Затоа, протоколот на конзорциумот SNP бил дизајниран да ги идентификува SNP без пристрасност кон регионите за кодирање и 100.000 SNP на Конзорциумот генерално ја рефлектираат разновидноста на низата низ човечките хромозоми. Конзорциумот SNP има за цел да го прошири бројот на SNP идентификувани низ геномот на 300 000 до крајот на првиот квартал од 2001 година.[99]

 
Распределба на TSC SNP долж долгиот крак на хромозомот 22 (од https://web.archive.org/web/20130903043223/http://snp.cshl.org/). Секоја колона претставува интервал од 1 Mb; приближната цитогенетска положба е дадена на х-оската. Можат да се видат јасни врвови и корита на густината на SNP, што веројатно одразуваат различни стапки на мутација, рекомбинација и селекција.

Промените во некодирачката секвенца и синонимните промени во секвенцата на кодирање се генерално почести од несинонимните промени, што одразува поголем селективен притисок што ја намалува различноста на позициите што го диктираат идентитетот на аминокиселините. Преодните промени се почести од трансверзиите, при што CpG динуклеотидите покажуваат највисока стапка на мутација, веројатно поради деаминација.

Лични геноми

уреди

Лична секвенца на геном е (речиси) целосна низа од хемиските базни парови кои ја сочинуваат ДНК на една личност. Бидејќи медицинските третмани имаат различни ефекти врз различни луѓе поради генетските варијации како што се еднонуклеотидните полиморфизми (SNPs), анализата на личните геноми може да доведе до персонализиран медицински третман заснован на поединечни генотипови.[100]

Првата лична геномска секвенца што била одредена била онаа на Крег Вентер во 2007 година. Личните геноми не биле секвенционирани во јавниот проект за човечки геном за да се заштити идентитетот на волонтерите кои дадоа примероци на ДНК. Таа низа е изведена од ДНК на неколку волонтери од разновидна популација.[101] Сепак, на почетокот на обидот за секвенционирање на геномот на Celera Genomics, предводен од Вентер, била донесена одлука да се префрли од секвенционирање на композитен примерок на користење на ДНК од една индивидуа, за која подоцна се открило дека бил самиот Вентер. Така, секвенцата на човечкиот геном Celera објавена во 2000 година во голема мера била онаа на еден човек. Последователната замена на раните композитни податоци и одредувањето на диплоидната секвенца, која ги претставува двете групи на хромозоми, наместо првично пријавената хаплоидна секвенца, овозможило ослободување на првиот личен геном.[102] Во април 2008 година била завршена и онаа на Џејмс Вотсон. Во 2009 година, Стивен Квејк објавил своја сопствена геномска секвенца изведена од секвенсер на неговиот сопствен дизајн, Хелископ.[103] Тимот од Стенфорд предводен од Јуан Ешли објавиле рамка за медицинско толкување на човечките геноми имплементирани на геномот на Квејк и за прв пат донеле цели медицински одлуки информирани за геномот.[104] Тој тим дополнително го проширил пристапот кон семејството, првото семејство секвенционирано како дел од програмата за секвенционирање на личниот геном на Илумина.[105] Оттогаш биле објавени стотици секвенци на личниот геном, вклучувајќи ги и оние на Дезмонд Туту,[106][107][108] и на палео-еским.[109] Во 2012 година, целата геномска секвенца на две семејни триа меѓу 1092 геноми била објавена во јавноста.[110][111] Во ноември 2013 година, едно шпанско семејство направило четири лични податоци за егзоми (околу 1% од геномот) јавно достапни под лиценца за јавен домен на Криејтив комонс. Проектот за личен геном (започнат во 2005 година) е меѓу ретките што ги направил јавно достапни и геномските секвенци и соодветните медицински фенотипови.[112][113]

Секвенционирањето на поединечни геноми дополнително ги открило нивоата на генетска сложеност кои не биле ценети порано. Личната геномика помогнала да се открие значајното ниво на разновидност во човечкиот геном што се припишува не само на SNP, туку и на структурните варијации. Меѓутоа, примената на таквото знаење во лекувањето на болестите и во медицинското поле е единствено на самиот почеток.[114] Секвенционирањето на егзомите станало сè попопуларно како алатка за помош во дијагностицирањето на генетските болести бидејќи егзомот придонесува само 1% од геномската секвенца, но претставува околу 85% од мутациите кои значително придонесуваат за болеста.[115]

Човечки нокаути

уреди

Кај луѓето, генските нокаути природно се случуваат како хетерозиготни или хомозиготни генски нокаути со губење на функцијата. Овие нокаути честопати е тешко да се разликуваат, особено во хетерогено генетско потекло. Тие се исто така тешко да се најдат бидејќи се појавуваат на ниски фреквенции.[116]]]

 
Педигре што прикажува парење од прв братучед (носители кои носат хетерозиготни нокаути се парат како што е означено со двојна линија) што доведува до потомство што поседува хомозиготен генски нокаут

Популациите со високи стапки на сродство, како што се земјите со високи стапки на бракови со прв братучед, покажуваат највисоки фреквенции на нокаути на хомозиготни гени. Таквите популации вклучуваат популации на Пакистан, Исланд и кај Амишите. Овие популации со високо ниво на родителска поврзаност биле предмет на човечко нокаут истражување кое помогнало да се одреди функцијата на специфичните гени кај луѓето. Разликувајќи ги специфичните нокаути, истражувачите можат да користат фенотипски анализи на овие лица за да помогнат во карактеризирањето на генот кој е исфрлен.

Нокаутите во одредени гени може да предизвикаат генетски заболувања, потенцијално да имаат корисни ефекти, па дури и да резултираат со никаков фенотипски ефект. Сепак, одредувањето на фенотипскиот ефект на нокаут и кај луѓето може да биде предизвик. Предизвиците за карактеризирање и клиничко толкување на нокаутите вклучуваат потешкотии со повикување на варијанти на ДНК, одредување на нарушување на функцијата на протеините (анотација) и разгледување на количината на влијание што мозаицизмот го има врз фенотипот.

Едно големо проучување кое ги истражувало човечките нокаути е студијата за пакистанскиот ризик од миокарден инфаркт. било откриено дека индивидуите кои поседуваат хетерозиготен генски нокаут за губење на функцијата за генот APOC3 имале пониски триглицериди во крвта по конзумирање оброци со висока содржина на маснотии во споредба со лицата без мутација. Како и да е, поединците кои поседуваат хомозиготни гени за губење на функцијата на генот APOC3 покажале најниско ниво на триглицериди во крвта по тестот за оптоварување со маснотии, бидејќи не произведуваат функционален протеин APOC3.[117]

Човечки генетски нарушувања

уреди

Повеќето аспекти на човечката биологија вклучуваат и генетски (наследни) и негенетски (еколошки) фактори. Некои наследни варијации влијаат на аспектите на нашата биологија кои не се медицински по природа (висина, боја на очите, способност за вкус или мирис на одредени соединенија итн.). Покрај тоа, некои генетски нарушувања предизвикуваат болест само во комбинација со соодветни фактори на животната средина (како што е исхраната). Со овие предупредувања, генетските нарушувања може да се опишат како клинички дефинирани болести предизвикани од варијација на геномската секвенца на ДНК. Во наједноставните случаи, нарушувањето може да биде поврзано со варијација во еден ген. На пример, цистичната фиброза е предизвикана од мутации во генот CFTR и е најчестото рецесивно нарушување кај кавкаските популации со повеќе од 1.300 различни мутации познати.[118]

Мутациите кои предизвикуваат болести кај специфичните гени обично се тешки во однос на функцијата на гените и за среќа се ретки, така што генетските нарушувања се слично индивидуално ретки. Меѓутоа, бидејќи има многу гени кои можат да варираат за да предизвикаат генетски нарушувања, тие во агрегат претставуваат значајна компонента на познати медицински состојби, особено во педијатриската медицина. Молекуларно карактеризирани генетски нарушувања се оние за кои е идентификуван основниот причински ген. Во моментов има околу 2.200 вакви нарушувања забележани во базата на податоци на ОМИМ.

Студиите за генетски нарушувања често се изведуваат со помош на семејни студии. Во некои случаи, се користат пристапи засновани на популација, особено во случајот на таканаречените популации основачи, како што се оние во Финска, Франција-Канада, Јута, Сардинија итн. Дијагнозата и третманот на генетските нарушувања обично ги врши генетичар - лекар обучени за клиничка/медицинска генетика. Резултатите од проектот за човечки геном веројатно ќе обезбедат зголемена достапност на генетско тестирање за нарушувања поврзани со гените и на крајот подобрен третман. Родителите може да бидат прегледани за наследни состојби и да се советуваат за последиците, веројатноста за наследување и како да го избегнат или да го подобрат тоа кај нивните потомци.

Постојат многу различни видови на варијации на ДНК секвенци, кои се движат од комплетни дополнителни или исчезнати хромозоми до единечни нуклеотидни промени. Генерално се претпоставува дека многу природно настанати генетски варијации во човечката популација се фенотипски неутрални, т.е. имаат мал или никаков забележлив ефект врз физиологијата на поединецот (иако може да има фракциони разлики во кондицијата дефинирани во еволутивните временски рамки). Генетските нарушувања можат да бидат предизвикани од било кој или од сите познати типови на варијации на низата. За молекуларно карактеризирање на ново генетско нарушување, неопходно е да се воспостави причинско-последична врска помеѓу одредена варијанта на геномската секвенца и клиничката болест што се истражува. Ваквите студии го сочинуваат царството на човечката молекуларна генетика.

Со доаѓањето на човечкиот геном и меѓународниот проект HapMap, станало изводливо да се истражат суптилните генетски влијанија врз многу вообичаени болести како што се дијабетес, астма, мигрена, шизофренија итн. одредени гени и некои од овие болести, често со голем публицитет во општите медиуми, тие обично не се сметаат за генетски нарушувања сами по себе бидејќи нивните причини се сложени, вклучувајќи многу различни генетски и еколошки фактори. Така, во одредени случаи може да има несогласување дали одредена медицинска состојба треба да се нарече генетско нарушување.

Дополнителни генетски нарушувања кои се споменуваат се Калман синдром и Фајфер синдром (ген FGFR1), Фухсова корнеална дистрофија (ген TCF4), Хиршпрунг-ова болест (гени RET и FECH), Барде-Бидл синдром 1 (гени CCDC28B и BBS1), синдром Барде-10 (ген BBS10) и фациоскапулохумерална мускулна дистрофија тип 2 (гени D4Z4 и SMCHD1).[119]

Секвенционирањето на геномот сега може да го стесни геномот на одредени локации за попрецизно да пронајде мутации што ќе резултираат со генетско нарушување. Варијантите на бројот на копии (CNV) и варијанти на единечни нуклеотиди (SNV) исто така можат да се детектираат истовремено со секвенционирањето на геномот со достапни понови процедури за секвенционирање, наречени Секвенционирање на следната генерација (NGS).[120] Ова анализира само мал дел од геномот, околу 1-2%. Резултатите од ова секвенционирање може да се користат за клиничка дијагноза на генетска состојба, вклучувајќи Ашеров синдром, болест на мрежницата, оштетување на слухот, дијабетес, епилепсија, болест на Ли, наследен карцином, невромускулни заболувања, примарни имунодефициенција, тешка комбинирана имунодефициенција (SCID) и болести на митохондриите.[121] НГС може да се користи и за да се идентификуваат носители на болести пред зачнувањето. Болестите што можат да се откријат во оваа секвенца вклучуваат Теј-Саксова болест, Блум синдром, Гошеова болест, Канаван болест, фамилијарна дисавтономија, цистична фиброза, спинална мускулна атрофија и синдром на кревка-Х. Следното секвенционирање на геномот може да се намали за конкретно да се бараат болести поприсутни кај одредени етнички популации.[122]

Преваленца и поврзан ген/хромозом за некои човечки генетски нарушувања
Нарушување Преваленца Вклучен хромозом или ген
Хромозомски состојби
Даунов синдром 1:600 Хромозом 21
Клајнфелтер синдром 1:500–1000 мажи Дополнителен Х хромозом
Тарнеров синдром 1:2000 жени Губење на Х-хромозомот
Српеста анемија 1 од 50 раѓања во делови на Африка; поретко на друго место β-глобин (на хромозомот 11)
Блум синдром 1:48000 Ашкенази Евреи BLM
Рак
Рак на дојка / јајници (чувствителност) ~ 5% од случаите на овие типови на рак BRCA1, BRCA2
FAP (наследна неполипоза коли) 1:3500 APC
Линч синдром 5-10% од сите случаи на рак на дебелото црево MLH1, MSH2, MSH6, PMS2
Фанкони анемија 1:130000 раѓања FANCC
Невролошки состојби
Хантингтонова болест 1:20000 Хантингтин
Алцхајмерова болест - ран почеток 1:2500 PS1, PS2, APP
Теј-Сакс 1:3600 раѓања кај Ашкенази Евреите HEXA ген (на хромозомот 15)
Канаванова болест 2,5% источноевропско еврејско потекло ASPA ген (на хромозомот 17)
Фамилијарна дисавтономија 600 познати случаи ширум светот од откривањето IKBKAP ген (на хромозомот 9)
Кревка Х синдром 1,4:10000 кај мажјаците, 0,9:10000 кај жените FMR1 ген (на X хромозом)
Муколипидоза тип IV 1:90 до 1:100 во Ашкенази Евреите MCOLN1
Други услови
Цистична фиброза 1:2500 CFTR
Мускулна дистрофија на Душен 1:3500 момчиња Дистрофин
Бекерова мускулна дистрофија 1,5–6:100000 мажи DMD
Бета таласемија 1:100000 HBB
Вродена адренална хиперплазија 1:280 во Индијанци и Јупик Ескими

1:15000 кај американските кавказки

CYP21A2
Болест за складирање на гликоген тип I 1:100000 раѓања во Америка G6PC
Болест на урина од јаворов сируп 1:180000 во САД

1:176 во заедниците на Менонити/Амиши

1:250000 во Австрија

BCKDHA, BCKDHB, DBT, DLD
Niemann-Pick-ова болест, поврзана со SMPD1 1.200 случаи ширум светот SMPD1
Ашеров синдром 1:23000 во САД

1:28000 во Норвешка

1:12500 во Германија

CDH23, CLRN1, DFNB31, GPR98, MYO7A, PCDH15, USH1C, USH1G, USH2A

Еволуција

уреди

Компаративните геномски студии на геномите на цицачите сугерираат дека приближно 5% од човечкиот геном е зачуван со еволуција од дивергенцијата на постојните лоза пред приближно 200 милиони години, кои содржат огромно мнозинство гени.[123][124] Објавениот геном на шимпанзото се разликува од оној на човечкиот геном за 1,23% во директни споредби на секвенци.[125] Околу 20% од оваа бројка се должи на варијации во секој вид, оставајќи само ~ 1,06% конзистентна секвенца дивергенција помеѓу луѓето и шимпанзата во заедничките гени.[126] Овој нуклеотид по нуклеотидна разлика е џуџеста, сепак, со делот од секој геном што не е споделен, вклучувајќи околу 6% од функционалните гени кои се единствени за луѓето или за шимпанзата.[127]

Со други зборови, значителните забележливи разлики меѓу луѓето и шимпанзата може да се должат исто толку или повеќе на варијациите на нивото на геномот во бројот, функцијата и изразувањето на гените, наместо промените во ДНК секвенцата во заедничките гени. Дури и кај луѓето, било откриено дека има претходно непроценета количина на варијации на бројот на копии (CNV) што може да сочинува дури 5-15% од човечкиот геном. Со други зборови, меѓу луѓето, може да има +/- 500.000.000 базни парови на ДНК, некои се активни гени, други инактивирани или активни на различни нивоа. Целосното значење на ова откритие останува да се види. Во просек, типичен човечки протеински ген за кодирање се разликува од неговиот ортолог на шимпанзо со само две замени на аминокиселини; речиси една третина од човечките гени го имаат истиот превод на протеини како и нивните ортолози на шимпанзо. Главната разлика помеѓу двата генома е човечкиот хромозом 2, кој е еквивалентен на производ од спојување на хромозомите 12 и 13 на шимпанзото[128](подоцна преименувана во хромозомите 2A и 2B, соодветно).

Луѓето претрпеле извонредна загуба на гените за миризливи рецептори за време на нашата неодамнешна еволуција, што го објаснува нашето релативно грубо чувство за мирис во споредба со повеќето други цицачи. Еволутивните докази сугерираат дека појавата на видот во боја кај луѓето и неколку други видови примати ја намалило потребата за сетилото за мирис.[129]

Во септември 2016 година, научниците известиле дека, врз основа на генетските студии на човечката ДНК, сите не-Африканци во светот денес може да се проследат до една популација што ја напуштила Африка помеѓу 50.000 и 80.000 години.[130]

Митохондриска ДНК

уреди

Човечката митохондриска ДНК е од огромен интерес за генетичарите, бидејќи несомнено игра улога во митохондријалната болест. Таа, исто така фрла светлина врз човечката еволуција; на пример анализата на варијации во човечкиот митохондријален геном довела до постулација на неодамнешен заеднички предок за сите луѓе на мајчината линија на потекло (види Митохондриска Ева).

Поради недостаток на систем за проверка на грешки при копирање,[131] митохондриска ДНК (mtDNA) има побрза стапка на варијација од нуклеарната ДНК. Оваа 20 пати повисока стапка на мутација овозможува mtDNA да се користи за попрецизно следење на мајчиното потекло.Студиите за mtDNA во популации овозможиле да се следат древните миграциски патеки, како што е миграцијата на Индијанците од Сибир[132] или Полинезијците од југоисточна Азија.Исто така се користел за да се покаже дека нема трага од ДНК на неандерталците во европската генска мешавина наследена преку чисто мајчина лоза.[133] Поради рестриктивниот или никаков начин на наследување на mtDNA, овој резултат (нема трага од mtDNA на неандерталецот) би бил веројатен освен ако немало голем процент на потекло од неандерталците, или немало силна позитивна селекција за таа mtDNA. На пример, враќајќи се 5 генерации наназад, само 1 од 32 предци на една личност придонел за mtDNA на таа личност, па ако еден од овие 32 бил чист неандерталец, очекуваните ~ 3% од автосомната ДНК на таа личност би биле од неандерталско потекло, но сепак тие би имале ~ 97% шанса да нема трага од mtDNA на неандерталецот.

Епигеном

уреди

Епигенетиката опишува различни карактеристики на човечкиот геном кои ја надминуваат неговата примарна ДНК секвенца, како што се пакувањето на хроматин, модификациите на хистоните и метилацијата на ДНК, и кои се важни во регулирањето на генската експресија, репликацијата на геномот и другите клеточни процеси. Епигенетските маркери ја зајакнуваат и ослабуваат транскрипцијата на одредени гени, но не влијаат на вистинската секвенца на нуклеотиди на ДНК. Метилацијата на ДНК е главна форма на епигенетска контрола над генската експресија и една од најпроучените теми во епигенетиката. Во текот на развојот, профилот на метилација на човечката ДНК доживува драматични промени. Во клетките на раната герминативна линија, геномот има многу ниски нивоа на метилација. Овие ниски нивоа генерално ги опишуваат активните гени. Како што напредува развојот, родителските ознаки за втиснување доведуваат до зголемена активност на метилација.[134][135]

Епигенетските обрасци може да се идентификуваат помеѓу ткивата во поединецот, како и помеѓу самите поединци. Идентичните гени кои имаат разлики само во нивната епигенетска состојба се нарекуваат епиалели . Епиалелите може да се поделат во три категории: оние директно одредени од генотипот на поединецот, оние под влијание на генотипот и оние целосно независни од генотипот. Епигеномот е исто така под значително влијание на факторите на животната средина. Исхраната, токсините и хормоните влијаат на епигенетската состојба. Студиите за манипулација со исхраната покажаа дека диетите со дефицит на метил се поврзани со хипометилација на епигеномот. Ваквите студии ја воспоставуваат епигенетиката како важен интерфејс помеѓу околината и геномот..[136]

Наводи

уреди
  1. Brown TA (2002). The Human Genome (англиски) (2nd. изд.). Oxford: Wiley-Liss.
  2. „The complete sequence of a human genome“. Science. 376 (6588): 44–53. April 2022. Bibcode:2022Sci...376...44N. doi:10.1126/science.abj6987. PMC 9186530 Проверете ја вредноста |pmc= (help). PMID 35357919 Проверете ја вредноста |pmid= (help).CS1-одржување: display-автори (link)
  3. „An integrated map of genetic variation from 1,092 human genomes“. Nature. 491 (7422): 56–65. November 2012. Bibcode:2012Natur.491...56T. doi:10.1038/nature11632. PMC 3498066. PMID 23128226.CS1-одржување: display-автори (link)
  4. „A global reference for human genetic variation“. Nature. 526 (7571): 68–74. October 2015. Bibcode:2015Natur.526...68T. doi:10.1038/nature15393. PMC 4750478. PMID 26432245.CS1-одржување: display-автори (link)
  5. Chimpanzee Sequencing Analysis Consortium (September 2005). „Initial sequence of the chimpanzee genome and comparison with the human genome“. Nature. 437 (7055): 69–87. Bibcode:2005Natur.437...69.. doi:10.1038/nature04072. PMID 16136131.
  6. „Comparing the human and chimpanzee genomes: searching for needles in a haystack“. Genome Research. 15 (12): 1746–1758. December 2005. doi:10.1101/gr.3737405. PMID 16339373.
  7. „Homo sapiens Annotation Report“. www.ncbi.nlm.nih.gov. Посетено на 17 April 2022.
  8. „CHM13 T2T v1.1 – Genome – Assembly – NCBI“. www.ncbi.nlm.nih.gov. Посетено на 2021-07-26.
  9. „The complete sequence of a human Y chromosome“ (англиски). December 2022. doi:10.1101/2022.12.01.518724. Наводот journal бара |journal= (help)CS1-одржување: display-автори (link)
  10. Rhie, Arang; Nurk, Sergey; Cechova, Monika; Hoyt, Savannah J.; Taylor, Dylan J.; Altemose, Nicolas; Hook, Paul W.; Koren, Sergey; Rautiainen, Mikko (2023-08-23). „The complete sequence of a human Y chromosome“. Nature (англиски): 1–11. doi:10.1038/s41586-023-06457-y. ISSN 1476-4687.
  11. „A draft human pangenome reference“. Nature. 617 (7960): 312–324. May 2023. Bibcode:2023Natur.617..312L. doi:10.1038/s41586-023-05896-x. PMC 10172123 Проверете ја вредноста |pmc= (help). PMID 37165242 Проверете ја вредноста |pmid= (help).CS1-одржување: display-автори (link)
  12. „International Human Genome Sequencing Consortium Publishes Sequence and Analysis of the Human Genome“. National Human Genome Research Institute. National Institutes of Health, U.S. Department of Health and Human Resources. 12 February 2001.
  13. „The human genome“. Science. 291 (5507): 1177–1180. February 2001. doi:10.1126/science.291.5507.1177. PMID 11233420.
  14. International Human Genome Sequencing Consortium (Oct 2004). „Finishing the euchromatic sequence of the human genome“. Nature. 431 (7011): 931–945. Bibcode:2004Natur.431..931H. doi:10.1038/nature03001. PMID 15496913.
  15. „A recount of human genes ups the number to at least 46,831“. Science News. 17 September 2018.
  16. „An estimate of the total number of true human miRNAs“. Nucleic Acids Research. 47 (7): 3353–3364. April 2019. doi:10.1093/nar/gkz097. PMC 6468295. PMID 30820533.CS1-одржување: display-автори (link)
  17. „300 Million Letters of DNA Are Missing From the Human Genome“. The Atlantic. 28 November 2018.
  18. „Number of Human Genes Is Put at 140,000, a Significant Gain“. The New York Times. 23 September 1999.
  19. „Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes“. Human Molecular Genetics. 23 (22): 5866–5878. November 2014. doi:10.1093/hmg/ddu309. PMC 4204768. PMID 24939910.
  20. „Scientists Announce HGP-Write, Project to Synthesize the Human Genome“. The New York Times. 2 June 2016. Посетено на 2 June 2016.
  21. „The Genome Project-Write“. Science. 353 (6295): 126–127. July 2016. Bibcode:2016Sci...353..126B. doi:10.1126/science.aaf6850. PMID 27256881.CS1-одржување: display-автори (link)
  22. „Filling in the gaps telomere to telomere“. Nature Milestones: Genomic Sequencing: S21. February 2021.
  23. „Scientists sequence the complete human genome for the first time“. CNN. 31 March 2022. Посетено на 1 April 2022.
  24. „Initial sequencing and analysis of the human genome“. Nature. 409 (6822): 860–921. February 2001. Bibcode:2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011. |hdl-access= бара |hdl= (help)CS1-одржување: display-автори (link)
  25. „300 Million Letters of DNA Are Missing From the Human Genome“. The Atlantic (англиски). 28 November 2018. Посетено на 2019-08-16.
  26. „Resolving the complexity of the human genome using single-molecule sequencing“. Nature. 517 (7536): 608–611. January 2015. Bibcode:2015Natur.517..608C. doi:10.1038/nature13907. PMC 4317254. PMID 25383537.CS1-одржување: display-автори (link)
  27. „Telomere-to-telomere assembly of a complete human X chromosome“. Nature. 585 (7823): 79–84. September 2020. Bibcode:2020Natur.585...79M. doi:10.1038/s41586-020-2547-7. PMC 7484160. PMID 32663838.CS1-одржување: display-автори (link)
  28. „The structure, function and evolution of a complete human chromosome 8“. Nature. 593 (7857): 101–107. May 2021. Bibcode:2021Natur.593..101L. doi:10.1038/s41586-021-03420-7. PMC 8099727 Проверете ја вредноста |pmc= (help). PMID 33828295 Проверете ја вредноста |pmid= (help).CS1-одржување: display-автори (link)
  29. „Genome List – Genome – NCBI“. www.ncbi.nlm.nih.gov. Посетено на 2021-07-26.
  30. „Human genome assembly“. Ensembl. Посетено на 2024-01-23.
  31. Hatje, Klas; Mühlhausen, Stefanie; Simm, Dominic; Kollmar, Martin (2019-09-23). „The Protein-Coding Human Genome: Annotating High-Hanging Fruits“. BioEssays (англиски). 41 (11): e1900066. doi:10.1002/bies.201900066. PMID 31544971. Посетено на 2023-07-01.
  32. Nurk, Sergey; и др. (2022-03-31). „The complete sequence of a human genome“. Science (англиски). 376 (6588): 44–53. Bibcode:2022Sci...376...44N. doi:10.1126/science.abj6987. PMC 9186530 Проверете ја вредноста |pmc= (help). PMID 35357919 Проверете ја вредноста |pmid= (help).
  33. „A recount of human genes ups the number to at least 46,831“. Science News (англиски). 2018-09-17. Посетено на 2023-06-23.
  34. „Human Genome Project Completion: Frequently Asked Questions“. National Human Genome Research Institute (NHGRI) (англиски). Посетено на 2019-02-02.
  35. „Non-coding RNA: what is functional and what is junk?“. Frontiers in Genetics. 60 (2): e1004351. January 2015. doi:10.3389/fgene.2015.00002. PMC 4306305. PMID 25674102.
  36. „Massively parallel in vivo enhancer assay reveals that highly local features determine the cis-regulatory function of ChIP-seq peaks“. Proceedings of the National Academy of Sciences of the United States of America. 110 (29): 11952–11957. July 2013. Bibcode:2013PNAS..11011952W. doi:10.1073/pnas.1307449110. PMC 3718143. PMID 23818646.
  37. „Defining functional DNA elements in the human genome“. Proceedings of the National Academy of Sciences of the United States of America. 111 (17): 6131–6138. April 2014. Bibcode:2014PNAS..111.6131K. doi:10.1073/pnas.1318948111. PMC 4035993. PMID 24753594.CS1-одржување: display-автори (link)
  38. „Getting clear about the F-word in genomics“. PLOS Genetics. 16 (4): e1008702. April 2020. doi:10.1371/journal.pgen.1008702. PMC 7153884. PMID 32236092.
  39. „We simply cannot go on being so vague about 'function'. Genome Biology. 19 (1): 223. December 2018. doi:10.1186/s13059-018-1600-4. PMC 6299606. PMID 30563541.
  40. Graur D (2017). „Rubbish DNA: the functionless fraction of the human genome.“. Evolution of the Human Genome I. Evolutionary Studies. Tokyo: Springer. стр. 19–60. arXiv:1601.06047. doi:10.1007/978-4-431-56603-8_2. ISBN 978-4-431-56603-8.
  41. Pena SD (2021). „An Overview of the Human Genome: Coding DNA and Non-Coding DNA“. Во Haddad LA (уред.). Human Genome Structure, Function and Clinical Considerations. Cham: Springer Nature. стр. 5–7. ISBN 978-3-03-073151-9.
  42. „Expanded Encyclopaedias of DNA elements in the Human and Mouse Genomes“. Nature. 583 (7818): 699–710. 30 July 2020. Bibcode:2020Natur.583..699E. doi:10.1038/s41586-020-2493-4. PMC 7410828. PMID 32728249. Operationally, functional elements are defined as discrete, linearly ordered sequence features that specify molecular products (for example, protein-coding genes or noncoding RNAs) or biochemical activities with mechanistic roles in gene or genome regulation (for example, transcriptional promoters or enhancers).
  43. „An Upper Limit on the Functional Fraction of the Human Genome“. Genome Biology and Evolution. 9 (7): 1880–1885. July 2017. doi:10.1093/gbe/evx121. PMC 5570035. PMID 28854598.
  44. „An integrated encyclopedia of DNA elements in the human genome“. Nature. 489 (7414): 57–74. September 2012. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616. These data enabled us to assign biochemical functions for 80% of the genome, in particular outside of the well-studied protein-coding regions.
  45. „Adaptive evolution of non-coding DNA in Drosophila“. Nature. 437 (7062): 1149–52. October 2005. Bibcode:2005Natur.437.1149A. doi:10.1038/nature04107. PMID 16237443.
  46. 46,0 46,1 Празен навод (help)
  47. „PANTHER Pie Chart“. PANTHER (Protein ANalysis THrough Evolutionary Relationships) Classification System. Посетено на 25 May 2011.
  48. „List of human proteins in the Uniprot Human reference proteome“. UniProt. Посетено на 28 January 2015.
  49. „Metabolic stability and epigenesis in randomly constructed genetic nets“. Journal of Theoretical Biology. 22 (3): 437–467. Mar 1969. Bibcode:1969JThBi..22..437K. doi:10.1016/0022-5193(69)90015-0. PMID 5803332.
  50. „An argument for the genetic simplicity of man and other mammals“. Journal of Human Evolution. 1 (6): 651–662. 1972. doi:10.1016/0047-2484(72)90011-5.
  51. „Relationship between gene expression and GC-content in mammals: statistical significance and biological relevance“. Human Molecular Genetics. 14 (3): 421–427. February 2005. doi:10.1093/hmg/ddi038. PMID 15590696.
  52. „The complete gene sequence of titin, expression of an unusual approximately 700-kDa titin isoform, and its interaction with obscurin identify a novel Z-line to I-band linking system“. Circulation Research. 89 (11): 1065–1072. 2001. doi:10.1161/hh2301.100981. PMID 11717165.
  53. „GeneBase 1.1: a tool to summarize data from NCBI gene datasets and its application to an update of human gene statistics“. Database: The Journal of Biological Databases and Curation. 2016: baw153. 2016. doi:10.1093/database/baw153. PMC 5199132. PMID 28025344.
  54. „Synergy between sequence and size in large-scale genomics“. Nature Reviews Genetics. 6 (9): 699–708. Sep 2005. doi:10.1038/nrg1674. PMID 16151375.
  55. „Genomics. ENCODE project writes eulogy for junk DNA“. Science. 337 (6099): 1159–1161. Sep 2012. doi:10.1126/science.337.6099.1159. PMID 22955811.
  56. „Nuclear export as a key arbiter of "mRNA identity" in eukaryotes“. Biochimica et Biophysica Acta (BBA) - Gene Regulatory Mechanisms. 1819 (6): 566–577. Jun 2012. doi:10.1016/j.bbagrm.2011.12.012. PMID 22248619.
  57. „Functional evolution of noncoding DNA“. Current Opinion in Genetics & Development. 12 (6): 634–639. Dec 2002. doi:10.1016/S0959-437X(02)00355-6. PMID 12433575.
  58. „Intergenic transcription is required to repress the Saccharomyces cerevisiae SER3 gene“. Nature. 429 (6991): 571–574. Jun 2004. Bibcode:2004Natur.429..571M. doi:10.1038/nature02538. PMID 15175754.
  59. „Long noncoding RNA as modular scaffold of histone modification complexes“. Science. 329 (5992): 689–693. Aug 2010. Bibcode:2010Sci...329..689T. doi:10.1126/science.1192002. PMC 2967777. PMID 20616235.
  60. „Parental imprinting of the mouse H19 gene“. Nature. 351 (6322): 153–155. May 1991. Bibcode:1991Natur.351..153B. doi:10.1038/351153a0. PMID 1709450.
  61. „Recombination regulation by transcription-induced cohesin dissociation in rDNA repeats“. Science. 309 (5740): 1581–1584. Sep 2005. Bibcode:2005Sci...309.1581K. doi:10.1126/science.1116102. PMID 16141077.
  62. „A ceRNA hypothesis: the Rosetta Stone of a hidden RNA language?“. Cell. 146 (3): 353–358. Aug 2011. doi:10.1016/j.cell.2011.07.014. PMC 3235919. PMID 21802130.
  63. „The GENCODE pseudogene resource“. Genome Biology. 13 (9): R51. 2012. doi:10.1186/gb-2012-13-9-r51. PMC 3491395. PMID 22951037.
  64. „Human specific loss of olfactory receptor genes“. Proceedings of the National Academy of Sciences of the United States of America. 100 (6): 3324–3327. Mar 2003. Bibcode:2003PNAS..100.3324G. doi:10.1073/pnas.0535697100. PMC 152291. PMID 12612342.
  65. „The landscape of long noncoding RNAs in the human transcriptome“. Nature Genetics. 47 (3): 199–208. Mar 2015. doi:10.1038/ng.3192. PMC 4417758. PMID 25599403.
  66. „Non-coding RNA genes and the modern RNA world“. Nature Reviews Genetics. 2 (12): 919–929. Dec 2001. doi:10.1038/35103511. PMID 11733745.
  67. „The vast, conserved mammalian lincRNome“. PLOS Computational Biology. 9 (2): e1002917. 2013. Bibcode:2013PLSCB...9E2917M. doi:10.1371/journal.pcbi.1002917. PMC 3585383. PMID 23468607.
  68. „Non-coding RNA: what is functional and what is junk?“. Frontiers in Genetics. 6: 2. 2015. doi:10.3389/fgene.2015.00002. PMC 4306305. PMID 25674102.
  69. „Non-coding RNA“. Human Molecular Genetics. 15 (Spec No 1): R17–29. Apr 2006. doi:10.1093/hmg/ddl046. PMID 16651366.
  70. 70,0 70,1 „An integrated encyclopedia of DNA elements in the human genome“. Nature. 489 (7414): 57–74. Sep 2012. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
  71. „ENCODE: My own thoughts“. Ewan's Blog: Bioinformatician at large. 5 September 2012.
  72. „What does our genome encode?“. Genome Research. 22 (9): 1602–1611. Sep 2012. doi:10.1101/gr.146506.112. PMC 3431477. PMID 22955972.
  73. „Regulating Evolution“. Scientific American. 298 (5): 60–67. May 2008. Bibcode:2008SciAm.298e..60C. doi:10.1038/scientificamerican0508-60. PMID 18444326.
  74. „The promoter-operator region of the lac operon of Escherichia coli“. J. Mol. Biol. 38 (3): 413–420. 1968. doi:10.1016/0022-2836(68)90395-1. PMID 4887877.
  75. „DNA sequences required for regulated expression of beta-globin genes in murine erythroleukemia cells“. Cell. 38 (1): 265–273. 1984. doi:10.1016/0092-8674(84)90548-8. PMID 6088069.
  76. „Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms“. Proceedings of the National Academy of Sciences of the United States of America. 98 (5): 2497–2502. Feb 2001. Bibcode:2001PNAS...98.2497N. doi:10.1073/pnas.051611498. PMC 30166. PMID 11226267.
  77. „Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons“. Science. 288 (5463): 136–140. Apr 2000. Bibcode:2000Sci...288..136L. doi:10.1126/science.288.5463.136. PMID 10753117.
  78. „Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome“. Genoscope. Архивирано од изворникот на 16 October 2006. Посетено на 12 September 2006.
  79. „Comparative studies of gene expression and the evolution of gene regulation“. Nature Reviews Genetics. 13 (7): 505–516. Jul 2012. doi:10.1038/nrg3229. PMC 4034676. PMID 22705669.
  80. „Five-vertebrate ChIP-seq reveals the evolutionary dynamics of transcription factor binding“. Science. 328 (5981): 1036–1040. May 2010. Bibcode:2010Sci...328.1036S. doi:10.1126/science.1186176. PMC 3008766. PMID 20378774.
  81. „Species-specific transcription in mice carrying human chromosome 21“. Science. 322 (5900): 434–438. Oct 2008. Bibcode:2008Sci...322..434W. doi:10.1126/science.1160930. PMC 3717767. PMID 18787134.
  82. „Repetitive DNA and next-generation sequencing: computational challenges and solutions“. Nature Reviews Genetics. 13 (1): 36–46. Jan 2012. doi:10.1038/nrg3117. PMC 3324860. PMID 22124482.
  83. „Large-scale analysis of tandem repeat variability in the human genome“. Nucleic Acids Research. 42 (9): 5728–5741. May 2014. doi:10.1093/nar/gku212. PMC 4027155. PMID 24682812.
  84. Pierce BA (2012). Genetics : a conceptual approach (4th. изд.). New York: W.H. Freeman. стр. 538–540. ISBN 978-1-4292-3250-0.
  85. „minisatellite, n. meanings, etymology and more | Oxford English Dictionary“. www.oed.com. Посетено на 2023-10-08.
  86. „Active Alu retrotransposons in the human genome“. Genome Research. 18 (12): 1875–1883. Dec 2008. doi:10.1101/gr.081737.108. PMC 2593586. PMID 18836035.
  87. „A gene expression restriction network mediated by sense and antisense Alu sequences located on protein-coding messenger RNAs“. BMC Genomics. 14: 325. 2013. doi:10.1186/1471-2164-14-325. PMC 3655826. PMID 23663499.
  88. „Hot L1s account for the bulk of retrotransposition in the human population“. Proceedings of the National Academy of Sciences of the United States of America. 100 (9): 5280–5285. Apr 2003. Bibcode:2003PNAS..100.5280B. doi:10.1073/pnas.0831042100. PMC 154336. PMID 12682288.
  89. Barton NH, Briggs DE, Eisen JA, Goldstein DB, Patel NH (2007). Evolution. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-684-9.
  90. NCBI. „GRCh38 – hg38 – Genome – Assembly“. ncbi.nlm.nih.gov. Посетено на 2019-03-15.
  91. „from Bill Clinton's 2000 State of the Union address“. Архивирано од изворникот на 21 February 2017. Посетено на 14 June 2007.
  92. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, и др. (November 2006). „Global variation in copy number in the human genome“. Nature. 444 (7118): 444–454. Bibcode:2006Natur.444..444R. doi:10.1038/nature05329. PMC 2669898. PMID 17122850.
  93. „What's a Genome?“. Genomenewsnetwork.org. 15 January 2003. Посетено на 31 May 2009.
  94. „Fact Sheet: Genome Mapping: A Guide to the Genetic Highway We Call the Human Genome“. National Center for Biotechnology Information. U.S. National Library of Medicine, National Institutes of Health. 29 март 2004. Архивирано од изворникот на 19 јули 2010. Посетено на 31 мај 2009.
  95. „About the Project“. International HapMap Project. Архивирано од изворникот на 15 May 2008. Посетено на 31 May 2009.
  96. „2008 Release: Researchers Produce First Sequence Map of Large-Scale Structural Variation in the Human Genome“. genome.gov. Посетено на 31 May 2009.
  97. Kidd JM, Cooper GM, Donahue WF, Hayden HS, Sampas N, Graves T, и др. (May 2008). „Mapping and sequencing of structural variation from eight human genomes“. Nature. 453 (7191): 56–64. Bibcode:2008Natur.453...56K. doi:10.1038/nature06862. PMC 2424287. PMID 18451855.
  98. Abel HJ, Larson DE, Regier AA, Chiang C, Das I, Kanchi KL, и др. (July 2020). „Mapping and characterization of structural variation in 17,795 human genomes“. Nature. 583 (7814): 83–89. Bibcode:2020Natur.583...83A. doi:10.1038/s41586-020-2371-0. PMC 7547914 Проверете ја вредноста |pmc= (help). PMID 32460305.
  99. Gray IC, Campbell DA, Spurr NK (2000). „Single nucleotide polymorphisms as tools in human genetics“. Human Molecular Genetics. 9 (16): 2403–2408. doi:10.1093/hmg/9.16.2403. PMID 11005795.
  100. Lai E (June 2001). „Application of SNP technologies in medicine: lessons learned and future challenges“. Genome Research. 11 (6): 927–929. doi:10.1101/gr.192301. PMID 11381021.
  101. „Human Genome Project Completion: Frequently Asked Questions“. genome.gov. Посетено на 31 May 2009.
  102. Singer E (4 September 2007). „Craig Venter's Genome“. MIT Technology Review. Архивирано од изворникот на 2011-06-07. Посетено на 25 May 2010.
  103. Pushkarev D, Neff NF, Quake SR (September 2009). „Single-molecule sequencing of an individual human genome“. Nature Biotechnology. 27 (9): 847–850. doi:10.1038/nbt.1561. PMC 4117198. PMID 19668243.
  104. Ashley EA, Butte AJ, Wheeler MT, Chen R, Klein TE, Dewey FE, и др. (May 2010). „Clinical assessment incorporating a personal genome“. Lancet. 375 (9725): 1525–1535. doi:10.1016/S0140-6736(10)60452-7. PMC 2937184. PMID 20435227.
  105. Dewey FE, Chen R, Cordero SP, Ormond KE, Caleshu C, Karczewski KJ, и др. (September 2011). „Phased whole-genome genetic risk in a family quartet using a major allele reference sequence“. PLOS Genetics. 7 (9): e1002280. doi:10.1371/journal.pgen.1002280. PMC 3174201. PMID 21935354.
  106. "Complete Genomics Adds 29 High-Coverage, Complete Human Genome Sequencing Datasets to Its Public Genomic Repository". Соопштение за печат.
  107. Sample I (17 February 2010). „Desmond Tutu's genome sequenced as part of genetic diversity study“. The Guardian.
  108. Schuster SC, Miller W, Ratan A, Tomsho LP, Giardine B, Kasson LR, и др. (February 2010). „Complete Khoisan and Bantu genomes from southern Africa“. Nature. 463 (7283): 943–947. Bibcode:2010Natur.463..943S. doi:10.1038/nature08795. PMC 3890430. PMID 20164927.
  109. Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, и др. (February 2010). „Ancient human genome sequence of an extinct Palaeo-Eskimo“. Nature. 463 (7282): 757–762. Bibcode:2010Natur.463..757R. doi:10.1038/nature08835. PMC 3951495. PMID 20148029.
  110. Corpas M, Cariaso M, Coletta A, Weiss D, Harrison AP, Moran F, Yang H (12 November 2013). „A Complete Public Domain Family Genomics Dataset“. bioRxiv 10.1101/000216.
  111. Corpas M (June 2013). „Crowdsourcing the corpasome“. Source Code for Biology and Medicine. 8 (1): 13. doi:10.1186/1751-0473-8-13. PMC 3706263. PMID 23799911.
  112. Mao Q, Ciotlos S, Zhang RY, Ball MP, Chin R, Carnevali P, и др. (October 2016). „The whole genome sequences and experimentally phased haplotypes of over 100 personal genomes“. GigaScience. 5 (1): 42. doi:10.1186/s13742-016-0148-z. PMC 5057367. PMID 27724973.
  113. Cai B, Li B, Kiga N, Thusberg J, Bergquist T, Chen YC, и др. (September 2017). „Matching phenotypes to whole genomes: Lessons learned from four iterations of the personal genome project community challenges“. Human Mutation. 38 (9): 1266–1276. doi:10.1002/humu.23265. PMC 5645203. PMID 28544481.
  114. Gonzaga-Jauregui C, Lupski JR, Gibbs RA (2012). „Human genome sequencing in health and disease“. Annual Review of Medicine. 63: 35–61. doi:10.1146/annurev-med-051010-162644. PMC 3656720. PMID 22248320.
  115. Choi M, Scholl UI, Ji W, Liu T, Tikhonova IR, Zumbo P, Nayir A, Bakkaloğlu A, Ozen S, Sanjad S, Nelson-Williams C, Farhi A, Mane S, Lifton RP (Nov 2009). „Genetic diagnosis by whole exome capture and massively parallel DNA sequencing“. Proceedings of the National Academy of Sciences of the United States of America. 106 (45): 19096–19101. Bibcode:2009PNAS..10619096C. doi:10.1073/pnas.0910672106. PMC 2768590. PMID 19861545.
  116. Narasimhan VM, Xue Y, Tyler-Smith C (April 2016). „Human Knockout Carriers: Dead, Diseased, Healthy, or Improved?“. Trends in Molecular Medicine. 22 (4): 341–351. doi:10.1016/j.molmed.2016.02.006. PMC 4826344. PMID 26988438.
  117. Saleheen D, Natarajan P, Armean IM, Zhao W, Rasheed A, Khetarpal SA, и др. (April 2017). „Human knockouts and phenotypic analysis in a cohort with a high rate of consanguinity“. Nature. 544 (7649): 235–239. Bibcode:2017Natur.544..235S. doi:10.1038/nature22034. PMC 5600291. PMID 28406212.
  118. Hamosh A, Scott AF, Amberger J, Bocchini C, Valle D, McKusick VA (January 2002). „Online Mendelian Inheritance in Man (OMIM), a knowledgebase of human genes and genetic disorders“. Nucleic Acids Research. 30 (1): 52–55. doi:10.1093/nar/30.1.52. PMC 99152. PMID 11752252.
  119. Katsanis N (November 2016). „The continuum of causality in human genetic disorders“. Genome Biology. 17 (1): 233. doi:10.1186/s13059-016-1107-9. PMC 5114767. PMID 27855690.
  120. Alekseyev YO, Fazeli R, Yang S, Basran R, Maher T, Miller NS, Remick D (2018). „A Next-Generation Sequencing Primer-How Does It Work and What Can It Do?“. Academic Pathology. 5: 2374289518766521. doi:10.1177/2374289518766521. PMC 5944141. PMID 29761157.
  121. Wong JC (2017). „Overview of the Clinical Utility of Next Generation Sequencing in Molecular Diagnoses of Human Genetic Disorders“. Во Wong LJ (уред.). Next Generation Sequencing Based Clinical Molecular Diagnosis of Human Genetic Disorders (англиски). Cham: Springer International Publishing. стр. 1–11. doi:10.1007/978-3-319-56418-0_1. ISBN 978-3-319-56416-6.
  122. Fedick A, Zhang J (2017). „Next Generation of Carrier Screening“. Во Wong LJ (уред.). Next Generation Sequencing Based Clinical Molecular Diagnosis of Human Genetic Disorders (англиски). Cham: Springer International Publishing. стр. 339–354. doi:10.1007/978-3-319-56418-0_16. ISBN 978-3-319-56416-6.
  123. Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, и др. (Dec 2002). „Initial sequencing and comparative analysis of the mouse genome“. Nature. 420 (6915): 520–562. Bibcode:2002Natur.420..520W. doi:10.1038/nature01262. PMID 12466850. the proportion of small (50–100 bp) segments in the mammalian genome that is under (purifying) selection can be estimated to be about 5%. This proportion is much higher than can be explained by protein-coding sequences alone, implying that the genome contains many additional features (such as untranslated regions, regulatory elements, non-protein-coding genes, and chromosomal structural elements) under selection for biological function.
  124. Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, и др. (Jun 2007). „Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project“. Nature. 447 (7146): 799–816. Bibcode:2007Natur.447..799B. doi:10.1038/nature05874. PMC 2212820. PMID 17571346.
  125. The Chimpanzee Sequencing Analysis Consortium (Sep 2005). „Initial sequence of the chimpanzee genome and comparison with the human genome“. Nature. 437 (7055): 69–87. Bibcode:2005Natur.437...69.. doi:10.1038/nature04072. PMID 16136131. We calculate the genome-wide nucleotide divergence between human and chimpanzee to be 1.23%, confirming recent results from more limited studies.
  126. The Chimpanzee Sequencing Analysis Consortium (Sep 2005). „Initial sequence of the chimpanzee genome and comparison with the human genome“. Nature. 437 (7055): 69–87. Bibcode:2005Natur.437...69.. doi:10.1038/nature04072. PMID 16136131. we estimate that polymorphism accounts for 14–22% of the observed divergence rate and thus that the fixed divergence is ~1.06% or less
  127. Demuth JP, De Bie T, Stajich JE, Cristianini N, Hahn MW (2006). „The evolution of mammalian gene families“. PLOS ONE. 1 (1): e85. Bibcode:2006PLoSO...1...85D. doi:10.1371/journal.pone.0000085. PMC 1762380. PMID 17183716. Our results imply that humans and chimpanzees differ by at least 6% (1,418 of 22,000 genes) in their complement of genes, which stands in stark contrast to the oft-cited 1.5% difference between orthologous nucleotide sequences
  128. The Chimpanzee Sequencing Analysis Consortium (Sep 2005). „Initial sequence of the chimpanzee genome and comparison with the human genome“. Nature. 437 (7055): 69–87. Bibcode:2005Natur.437...69.. doi:10.1038/nature04072. PMID 16136131. Human chromosome 2 resulted from a fusion of two ancestral chromosomes that remained separate in the chimpanzee lineage
    Olson MV, Varki A (Jan 2003). „Sequencing the chimpanzee genome: insights into human evolution and disease“. Nature Reviews Genetics. 4 (1): 20–28. doi:10.1038/nrg981. PMID 12509750. S2CID 205486561. Large-scale sequencing of the chimpanzee genome is now imminent.
  129. Gilad Y, Wiebe V, Przeworski M, Lancet D, Pääbo S (Jan 2004). „Loss of olfactory receptor genes coincides with the acquisition of full trichromatic vision in primates“. PLOS Biology. 2 (1): E5. doi:10.1371/journal.pbio.0020005. PMC 314465. PMID 14737185. Our findings suggest that the deterioration of the olfactory repertoire occurred concomitant with the acquisition of full trichromatic color vision in primates.
  130. Zimmer C (21 September 2016). „How We Got Here: DNA Points to a Single Migration From Africa“. The New York Times. Посетено на 22 September 2016.
  131. Copeland WC (January 2012). „Defects in mitochondrial DNA replication and human disease“. Critical Reviews in Biochemistry and Molecular Biology. 47 (1): 64–74. doi:10.3109/10409238.2011.632763. PMC 3244805. PMID 22176657.
  132. Nielsen R, Akey JM, Jakobsson M, Pritchard JK, Tishkoff S, Willerslev E (January 2017). „Tracing the peopling of the world through genomics“. Nature. 541 (7637): 302–310. Bibcode:2017Natur.541..302N. doi:10.1038/nature21347. PMC 5772775. PMID 28102248.
  133. Sykes B (9 октомври 2003). „Mitochondrial DNA and human history“. The Human Genome. Архивирано од изворникот на 7 септември 2015. Посетено на 19 септември 2006.
  134. Misteli T (Feb 2007). „Beyond the sequence: cellular organization of genome function“. Cell. 128 (4): 787–800. doi:10.1016/j.cell.2007.01.028. PMID 17320514. S2CID 9064584.
  135. Bernstein BE, Meissner A, Lander ES (Feb 2007). „The mammalian epigenome“. Cell. 128 (4): 669–681. doi:10.1016/j.cell.2007.01.033. PMID 17320505. S2CID 2722988.
  136. Scheen AJ, Junien C (May–Jun 2012). „[Epigenetics, interface between environment and genes: role in complex diseases]“. Revue Médicale de Liège. 67 (5–6): 250–257. PMID 22891475.

Надворешни врски

уреди
 
Викицитат има збирка цитати поврзани со: