Белковинско натсемејство

Белковинско натсемејство — највисокиот степен на групирање (клад) на белковините за кои постојат докази за заедничко потекло (види хомологија). Обично заедничкото потекло се заклучува по пат на структурно порамнување[1] и механистичка сличност, дури и доколку не постои очигледна сличност во аминокиселинската низа.[2] Но и покрај малата сличност во низите, понекогаш може да биде откриена низна хомологија. Едно белковинско натсемејство обично содржи повеќе белковински семејства, а членовите во рамките на едно семејство покажуваат значителна сличност во низите. Поимот белковински клан обично се користи за именување на натсемејствата на протеази и гликозил хидролази, во MEROPS и CAZy класификационите системи.[2][3]

Идентификација

уреди
Горе, сочуваност на вторичната структура на 80 членови од PA кланот на протеази (натсемејство). H се однесува на алфа-завојница, E се однесува на бета-плоча, а L на петелка. Долу, сочуваност на низата за истото порамнување. Стрелките ги означуваат остатоците на каталитичката тријада. Порамнувањето е на основа на структури од страна на DALI.

Белковинските натсемејства можат да бидат идентификувани со голем број на методи.

Сличност во низата

уреди
 
Порамнување на низите на хистони од цицачи. Сличноста во низите сугерира дека тие еволуирале по пат на генска дупликација. Аминокиселинските остатоци кои се сочувани во сите низи се означени со сива боја. Под белковинските низи има клуч кој ги означува сочуваните низи (*), конзервативните мутации (:), полуконзервативните мутации (.), и не-конзервативните мутации ( ).[4]

Историски гледано, сличноста помеѓу различните аминокиселински низи е најчестиот метод за откривање на хомологија.[5] Сличноста во низите се смета за добар предвидувач на сродност, бидејќи сличните низи најверојатно се резултат на генска дупликација и дивергентна еволуција, отколку на конвергентна еволуција. Аминокиселинската низа се смета за почувствителен метод за детекција на хомологност, бидејќи аминокиселинските низи обично се посочувани во текот на еволуцијата од РНК-низите (поради дегенеративноста на генетскиот код). Бидејќи некои од аминокиселините имаат слични физичко-хемиски својства (на пример, електричен полнеж, хидрофобност, големина), конзервативните мутации често се неутрални и немаат влијание на функцијата. Најсочуваните региони во низата на белковините се оние кои се функционално најважни, како што се каталитичките и врзувачките места, бидејќи овие региони најмалку толерираат промени.

Употребата на сличноста во низата за откривање на хомологија има неколку ограничувања. Не постои минимално ниво на сличност во низата кое гарантира добивање на идентични структури. После долги периоди на еволуција, сродните белковини може да ја изгубат сличноста во низите. Низите кои претрпеле мноштво на вметнувања и бришења во текот на еволуцијата, понекогаш тешко може да се порамнат за да се идентификуваат хомологните региони. Во PA кланот на протеази, на пример, не е сочуван ниту еден аминокиселински остаток во низите на различните припадници на ова натсемејство, дури и оние во склоп на каталитичката тријада. Спротивно на тоа, поединечните семејства кои го сочинуваат натсемејството се дефинирани врз основа на порамнувањето на низите, на пример семејството на протеази C04 во рамките на кланот PA.

Сепак, сличноста во низата е најчесто користениот доказ за сродство, бидејќи бројот на познати низи е многу поголем од бројот на познати третични структури.[6] Во отсуство на структурни информации, сличноста во низите ги стеснува границите за вклучување на нови белковини кон одредено натсемејство.[6]

Структурна сличност

уреди
 
Структурна хомологија во натсемејството PA (клан PA). Двојниот β-цилиндар кој го карактеризира натсемејството е обележан со црвена боја. Прикажани се претставителни структури од неколку семејства во рамките на PA натсемејството. Химотрипсин (1gg6), TEV протеаза (1lvm), калцивирин (1wqs), WNV протеаза (1fp7), ексфолијатин токсин (1exf), HtrA протеаза (1l1j), змијски отров плазминогенски активатор (1bqy), хлоропластна протеаза (4fln) и EVA протеаза (1mbm).

Структурата е еволутивно посочувана од низата, така што белковини со многу слични структури можат да имаат сосема различни низи.[7] Во текот на многу долги временски периоди на еволуција, многу малку аминокиселински остатоци се сочувани во низата, сепак елементите на вторичната структура и третичните структурни мотиви се доста сочувани. Одредена белковинска динамика[8] и конформациони промени на белковинската структура исто така може да бидат сочувани, како што се среќава кај серпинското натсемејство.[9] Од овие причини, третичната структура на белковините може да се користи за откривање на хомологност помеѓу белковините, дури и кога во нивните низи нема докази за сродство. Програмите за структурно порамнување, како што е DALI, ја користат 3Д-структурата на белковината од интерес за да најде белковини со слични склопови.[10] Меѓутоа, во ретки случаи, сродните белковини може да еволуираат за да станат структурно различни, па во овие случаи сродноста може да се заклучи само со употреба на други посебни методи.[11][12][13]

Механистичка сличност

уреди

Каталитичкиот механизам на ензимите во рамките на едно натсемејство најчесто е сочуван, иако специфичноста кон супстратот може да биде значително различна.[14] Исто така, каталитичките аминокиселински остатоци имаат тенденција да се појават во ист редослед во белковинските низи.[15] Семејствата во рамките на PA кланот на протеази имаат сличен механизам на ковалентна, нуклеофилна катализа на белковини, пептиди или аминокиселини, иако покажуваат дивергентна еволуција на остатоците од каталитичката тријада.[16] Сепак, механизмот сам по себе не е доволен за да се докаже сродство. Некои каталитички механизми имаат еволуирано независно едни од други по конвергентен пат, па затоа формираат посебни натсемејства,[17][18][19] а во некои натсемејства може да се сретне спектар на различни (иако често хемиски слични) механизми.[14][20]

Еволутивно значење

уреди

Белковинските натсемејства ја претставуваат моменталната граница на нашата способност за идентификување на заедничко потекло кај белковините.[21] Тие се моментално најголемото можно еволутивно групирање добиено врз основа на директни докази. Некои натсемејства имаат членови кои се присутни во сите царства на животот, што укажува на тоа дека последниот заеднички предок на тоа натсемејство бил присутен во последниот универзален заеднички предок на сите живи организми (LUCA, од анг. Last Universal Common Ancestor).[22]

Членови на едно натсемејство може да се најдат во различни видови кои имаат заедничко потекло, т.е. заеднички предок (ортологија). Спротивно на тоа, тие може да се најдат во рамките на истиот вид, а еволуирале од една иста белковина чијшто ген подлегнал на генска дупликација (паралогија).

Диверзификација

уреди

Повеќето белковини содржат повеќе домени во својата структура. Меѓу 66-80% од сите еукариотски белковини имаат повеќе домени, а 40-60% од сите прокариотски белковини имаат повеќе домени.[5] Со текот на времето, многу од натсемејствата на домени се имаат искомбинирано меѓусебе во структурите на повеќедоменските белковини. Всушност, многу ретко се среќаваат т.н. „доследно изолирани натсемејства“.[5] Кога домените се комбинираат, N- до C-терминалниот редослед во доменот („доменска архитектура“) најчесто добро е сочувана. Дополнително, бројот на комбинации на домени кои се среќаваат во природата е многу помал во споредба со бројот на можните комбинации, што укажува на тоа дека можните комбинации подлегнуваат на процесот на селекција.[5]

Примери

уреди

Натсемејство на α/β хидролази - Членовите на ова натсемејство споделуваат α/β-плоча која содржи 8 бета нишки поврзани со алфа-завојницаи, со ист редослед на остатоците од каталитичката тријада.[23] Тие имаат активности на протеази, липази, пероксидази, естерази, епоксид хидролази и дехалогенази.[24]

Натсемејство на алкални фосфатази - Членовите на ова натсемејство споделуваат структура на αβα сендвич,[25] како и промискуитетни реакции со заеднички механизам.[26]

Глобинска натсемејство - Членовите на ова натсемејство споделуваат глобински склоп од 8 алфа-завојници.[27][28]

Имуноглобулинско натсемејство - Членовите на ова натсемејство споделуваат структура на сендвич од две бета плочи со антипаралелни бета нишки (Ig-склоп), а имаат улога на препознавање, врзување, и адхезија.[29][30]

PA клан - Членовите на оваа натсемејство споделуваат структура слична на химотрипсин и слични механизми на протеолиза, иако имаат низна сличност <10%. Овој клан ги содржи цистеинските и серинските протеази.[2][31]

Ras натсемејство - Членовите на ова натсемејство споделуваат ист каталитички G домен на β-плоча од 6 β-нишки опкружена со 5 α-завојници.[32]

Серпинско натсемејство - Членовите на ова натсемејство споделуваат високоенергетски, нестабилен склоп кој може да подлегне на голема конформациона промена, која служи за инхибиција на цистеинските и серинските протеази со нарушување на нивната структура.[9]

Натсемејство на TIM цилиндар - Членовите на ова натсемејство споделуваат голем α8β8 цилиндар. Тој е еден од најчестите белковински склопови.[33][34]

Ресурси за белковински натсемејства

уреди

Постојат неколку биолошки бази на податоци кои ги документираат белковинските натсемејства и белковинските склопови, на пример:

  • Pfam - База на податоци за белковински семејства со порамнувања и HMMs
  • PROSITE - База на податоци за белковински домени, семејства и функционални места
  • PIRSF - Систем за класификација на натсемејства
  • PASS2 - Protein Alignment as Structural Superfamilies v2 - PASS2@NCBS
  • SUPERFAMILY - База на податоци за структурни и функционални назначувања за сите белковини и геноми
  • SCOP и CATH - Класификација на белковинските структури во натсемејства, семејства и домени

Постојат и алгоритми за пребарување на базите на податоци, како Protein Data Bank (PDB), со цел наоѓање на структурна хомологија, на пример:

  • DALI - Структурно порамнување врз основа на методот „distance alignment matrix method“

Поврзано

уреди

Наводи

уреди
  1. „Dali server: conservation mapping in 3D“. Nucleic Acids Research. 38 (Web Server issue): W545-9. July 2010. doi:10.1093/nar/gkq366. PMC 2896194. PMID 20457744.
  2. 2,0 2,1 2,2 „MEROPS: the database of proteolytic enzymes, their substrates and inhibitors“. Nucleic Acids Research. 40 (Database issue): D343-50. January 2012. doi:10.1093/nar/gkr987. PMC 3245014. PMID 22086950.
  3. „Updating the sequence-based classification of glycosyl hydrolases“. The Biochemical Journal. 316 (Pt 2): 695–6. June 1996. doi:10.1042/bj3160695. PMC 1217404. PMID 8687420.
  4. „Clustal FAQ #Symbols“. Clustal. Архивирано од изворникот на 2016-10-24. Посетено на 8 December 2014.
  5. 5,0 5,1 5,2 5,3 „The folding and evolution of multidomain proteins“. Nature Reviews Molecular Cell Biology. 8 (4): 319–30. April 2007. doi:10.1038/nrm2144. PMID 17356578.
  6. 6,0 6,1 „SUPFAM--a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes“. Nucleic Acids Research. 30 (1): 289–93. January 2002. doi:10.1093/nar/30.1.289. PMC 99061. PMID 11752317.
  7. „Protein families and their evolution-a structural perspective“. Annual Review of Biochemistry. 74 (1): 867–900. 2005. doi:10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
  8. „Sequence evolution correlates with structural dynamics“. Molecular Biology and Evolution. 29 (9): 2253–63. September 2012. doi:10.1093/molbev/mss097. PMID 22427707.
  9. 9,0 9,1 „The serpins are an expanding superfamily of structurally similar but functionally diverse proteins. Evolution, mechanism of inhibition, novel functions, and a revised nomenclature“. The Journal of Biological Chemistry. 276 (36): 33293–6. September 2001. doi:10.1074/jbc.R100016200. PMID 11435447.
  10. „Dali server update“. Nucleic Acids Research. 44 (W1): W351-5. July 2016. doi:10.1093/nar/gkw357. PMID 27131377.
  11. „Evolution of primate α and θ defensins revealed by analysis of genomes“. Molecular Biology Reports. 41 (6): 3859–66. June 2014. doi:10.1007/s11033-014-3253-z. PMID 24557891.
  12. „Structural drift: a possible path to protein fold change“. Bioinformatics. 21 (8): 1308–10. April 2005. doi:10.1093/bioinformatics/bti227. PMID 15604105.
  13. „Proteins that switch folds“. Current Opinion in Structural Biology. 20 (4): 482–8. August 2010. doi:10.1016/j.sbi.2010.06.002. PMID 20591649.
  14. 14,0 14,1 Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), „Function Diversity Within Folds and Superfamilies“, From Protein Structure to Function with Bioinformatics (англиски), Springer Netherlands: 295–325, doi:10.1007/978-94-024-1069-3_9, ISBN 9789402410679, Посетено на 2018-10-12
  15. „Causes of evolutionary rate variation among protein sites“. Nature Reviews. Genetics (англиски). 17 (2): 109–21. February 2016. doi:10.1038/nrg.2015.18. PMID 26781812.
  16. „Handicap-Recover Evolution Leads to a Chemically Versatile, Nucleophile-Permissive Protease“. Chembiochem. 16 (13): 1866–1869. September 2015. doi:10.1002/cbic.201500295. PMC 4576821. PMID 26097079.
  17. „Intrinsic evolutionary constraints on protease structure, enzyme acylation, and the identity of the catalytic triad“. Proceedings of the National Academy of Sciences of the United States of America. 110 (8): E653-61. February 2013. doi:10.1073/pnas.1221050110. PMC 3581919. PMID 23382230.
  18. „An evolving hierarchical family classification for glycosyltransferases“. Journal of Molecular Biology. 328 (2): 307–17. April 2003. doi:10.1016/S0022-2836(03)00307-3. PMID 12691742.
  19. „Independent evolution of four heme peroxidase superfamilies“. Archives of Biochemistry and Biophysics. 574: 108–19. May 2015. doi:10.1016/j.abb.2014.12.025. PMID 25575902.
  20. Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E.; Barber, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrad C.; Lauck, Florian; Mashiyama, Susan T. (2013-11-23). „The Structure–Function Linkage Database“. Nucleic Acids Research (англиски). 42 (D1): D521–D530. doi:10.1093/nar/gkt1130. ISSN 0305-1048.
  21. „Protein structure and evolutionary history determine sequence space topology“. Genome Research. 15 (3): 385–92. March 2005. arXiv:q-bio/0404040. doi:10.1101/gr.3133605. PMC 551565. PMID 15741509.
  22. „Protein superfamily evolution and the last universal common ancestor (LUCA)“. Journal of Molecular Evolution. 63 (4): 513–25. October 2006. doi:10.1007/s00239-005-0289-7. PMID 17021929.
  23. „Alpha/beta hydrolase fold: an update“. Protein and Peptide Letters. 16 (10): 1137–48. 2009. PMID 19508187.
  24. „Alpha/beta hydrolase fold enzymes: the family keeps growing“. Current Opinion in Structural Biology. 9 (6): 732–7. December 1999. doi:10.1016/S0959-440X(99)00037-8. PMID 10607665.
  25. „SCOP“. Архивирано од изворникот на 2014-07-29. Посетено на 28 May 2014.
  26. „Efficient, crosswise catalytic promiscuity among enzymes that catalyze phosphoryl transfer“. Biochimica et Biophysica Acta. 1834 (1): 417–24. January 2013. doi:10.1016/j.bbapap.2012.07.015. PMID 22885024.
  27. Branden C, Tooze J (1999). Introduction to protein structure (2. изд.). New York: Garland Pub. ISBN 978-0815323051.
  28. „Aplysia limacina myoglobin. Crystallographic analysis at 1.6 A resolution“. Journal of Molecular Biology. 205 (3): 529–44. February 1989. doi:10.1016/0022-2836(89)90224-6. PMID 2926816.
  29. „The immunoglobulin fold. Structural classification, sequence patterns and common core“. Journal of Molecular Biology. 242 (4): 309–20. September 1994. doi:10.1006/jmbi.1994.1582. PMID 7932691.
  30. „Cell adhesion molecules 1: immunoglobulin superfamily“. Protein Profile. 2 (9): 963–1108. 1995. PMID 8574878.
  31. „Viral cysteine proteases are homologous to the trypsin-like family of serine proteases: structural and functional implications“. Proceedings of the National Academy of Sciences of the United States of America. 85 (21): 7872–6. November 1988. doi:10.1073/pnas.85.21.7872. PMC 282299. PMID 3186696.
  32. „The guanine nucleotide-binding switch in three dimensions“. Science. 294 (5545): 1299–304. November 2001. doi:10.1126/science.1062023. PMID 11701921.
  33. „One fold with many functions: the evolutionary relationships between TIM barrel families based on their sequences, structures and functions“. Journal of Molecular Biology. 321 (5): 741–65. August 2002. doi:10.1016/s0022-2836(02)00649-6. PMID 12206759.
  34. „An α/β-barrel full of evolutionary trouble“. Current Opinion in Structural Biology. 3 (3): 409–412. 1993. doi:10.1016/S0959-440X(05)80114-9.