Белковинско семејство

Белковинско семејство е група на еволутивно сродни белковини. Во многу случаи белковинското семејство има складно генско семејство, во која секој ген кодира соодветна белковина во однос 1:1. Поимот белковинско семејство не треба да се меша со поимот семејство кој се користи во таксономијата на организмите.

Човечката циклофилинско семејство на белковини, претставена со структурите на изомеразните домени на некои од нејзините членови.

Белковините кои спаѓаат во истата белковинското семејство имаат заеднички предок и обично имаат слични тридимензионални структури, функции и значителна сличност во низата. Најважна е сличноста во низата (обично аминокиселинската низа), бидејќи таа е најстрогиот индикатор за хомологност, а оттаму и најочигледниот индикатор за заедничко потекло. Сличноста во низите се одредува со методи на порамнување на низите. Белковините кои не споделуваат заеднички предок многу малку е веројатно да имаат статистички значителна сличност во низите, па затоа порамнувањето на низите претставува моќна алатка за идентификација на членовите на белковинските семејства.

Белковинските семејства понекогаш се групираат заедно во поголеми кладови, наречени натсемејства, врз основа на структурни и механистички сличности, дури и ако нема очигледна хомологија во низите.

Досега, дефинирани се над 60,000 белковински семејства,[1] иако понекогаш двосмисленоста на дефиницијата за белковинско семејство предизвикува да различни истражувачи доаѓаат до многу различни бројки.

Терминологија и употреба уреди

Како и со многу други биолошки поими, употребата на поимот белковинско семејство донекаде зависи од контекстот; може да се однесува на голема група на белковини со најниско можно ниво на сличност во низите, или може да се однесува на мала група на белковини со речиси идентични низи, функции и тридимензионални структури. За да се направи разлика помеѓу овие случаи, поимот белковинско натсемејство често се користи за далечно сродни белковини, чија сродност не мора да соодветствува со голема сличност во низите, но се одредува преку заедничките структурни одлики.[2][3][4] Други поими, како што се белковинска класа, група, клан и потсемејство, биле воведени со текот на годините, но сите го имаат истиот недостаток на двосмисленост. Во употреба е хиерархијата во која натсемејствата (структурна хомологија) содржат семејства (низна хомологија), кои, пак, содржат под-семејства.

Горе, низна сочуваност на 250 членови од PA кланот на протеази (натсемејство). Долу, низна сочуваност на 70 членови од C04 семејството на протеази. Стрелките ги означуваат аминокиселинските остатоци од каталитичките тријади. Порамнети врз основа на структура од „Distance-matrix ALIgnment“ (DALI) алгоритмот.

Белковински домени и мотиви уреди

Концептот на белковинско семејство бил измислен во време кога биле познати многу малку белковински структури и низи; во тоа време структурно биле разработени главно мали, едно-доменски белковини, како што се миоглобинот, хемоглобинот и цитохром ц. Денес е познато дека многу белковини содржат повеќе независни структурни и функционални единици наречени белковински домени. Поради еволутивното мешање, различните домени во склоп на една белковина еволуирале независно. Затоа, во скорешно време, фокусот е во класификацијата на белковинските домени во семејства.

Регионите на секоја белковина имаат различни функционални ограничувања (одлики критични за структурата и функцијата на белковината). На пример, активното место на еден ензим поседува одредени аминокиселински остатоци кои се прецизно ориентирани во трите димензии. Од друга страна, интерфејсот на врзување на две белковини може да се состои од голема површина со ограничувања на хидрофобноста или поларитетот на аминокиселинските остатоци. Функционално ограничените региони на белковините еволуираат побавно од функционално неограничените региони, како што се површинските петелки, што резултира со забележливи блокови на сочувани низи кога се споредуваат низите на белковините кои припаѓаат на истата белковинско семејство (види порамнување на повеќе низи). Овие блокови најчесто се нарекуваат мотиви, иако во употреба се и многу други поими (блокови, ознаки, отпечатоци, итн.). Голем број на онлајн ресурси се посветени на идентификација и каталогизација на белковинските мотиви (види го списокот на крајот од статијата).

Еволуција на белковински семејства уреди

Според моменталниот консензус, белковинските семејства настануваат на два начина. Првиот начин е со разделување на два генетски изолирани видови кои се потомци на еден родителски вид, што им овозможува самостојно да акумулираат варијации (мутации) во одреден ген/белковина. Ова резултира со појава на семејства на ортологни белковини, кои обично имаат сочувани низни мотиви. Вториот начин е со генска дупликација, со која може да се создаде втора копија на истиот ген (наречен паралог). Бидејќи оригиналниот ген сѐ уште е способен да ја извршува својата функција, дуплираниот ген слободно може да дивергира и може да се здобие со нови функции (со случајна мутација). Одредени гени/белковински семејства, особено кај еукариотите, се подложени на екстремни експанзии и контракции во текот на еволуцијата, кои понекогаш се одвиваат заедно со дупликации на целиот геном. Овие експанзии и контракции на белковинските семејства претставуваат една од најважните одлики на геномската еволуција.

 
Филогенетско дрво на RAS натсемејствата. Дрвото е создадено со користење на FigTree (бесплатен онлајн софтвер).

Употреба и значење на белковинските семејства уреди

Како што вкупниот број на низионирани белковини постојано се зголемува, постои постојан напор белковините да се организираат во семејства и да се опишат нивните составни домени и мотиви. Веродостојната идентификација на белковинските семејства е од клучно значење за филогенетските анализи, назначувањето на функции и проучувањето на диверзитетот на белковински функции во дадена филогенетска гранка. Иницијативата за ензимска функција (анг. Enzyme Function Initiative, EFI) ги користи белковинските семејства и натсемејства како основа за развој на стратегија заснована на низа/структура за назначување на функции на ензими со непознати функции.[5]

Алгоритамските средства за утврдување на белковинските семејства се засноваат на поимот на сличност. Најчесто, единствената сличност со која располагаат истражувачите е сличноста во низите.

Ресурси за белковински семејства уреди

Постојат многу биолошки бази на податоци кои ги евидентираат примерите на белковински семејства и им овозможуваат на корисниците да идентификуваат дали новоидентификуваните белковини припаѓаат на некоја од познатите семејства. Еве неколку примери:

  • Pfam - База на податоци за белковински семејства со порамнувања и HMMs
  • PROSITE - База на податоци за белковински домени, семејства и функционални места
  • PIRSF - Систем за класификација на натсемејства
  • PASS2 - Protein Alignment as Structural Superfamilies v2 - PASS2@NCBS[6]
  • SUPERFAMILY - база на податоци за структурни и функционални назначувања за сите белковини и геноми
  • SCOP и CATH - класификација на белковинските структури во натсемејства, семејства и домени

Постојат и многу алгоритми за пребарување на базите на податоци, на пример:

  • BLAST - Пребарување на сличност на ДНК-низа
  • BLASTp - Пребарување на сличност на белковинска низа
  • OrthoFinder: Архивирано на 2 март 2021 г. брз и точен метод за групирање на белковините во семејства (ортогрупи)[7]

Поврзано уреди

Наводи уреди

  1. Kunin, V.; Cases, I.; Enright, A. J.; De Lorenzo, V.; Ouzounis, C. A. (2003). „Myriads of protein families, and still counting“. Genome Biology. 4 (2): 401. doi:10.1186/gb-2003-4-2-401. PMC 151299. PMID 12620116.
  2. Dayhoff, M. O. (1974). „Computer analysis of protein sequences“. Federation Proceedings. 33 (12): 2314–2316. PMID 4435228.
  3. Dayhoff, M. O.; McLaughlin, P. J.; Barker, W. C.; Hunt, L. T. (1975). „Evolution of sequences within protein superfamilies“. Die Naturwissenschaften. 62 (4): 154–161. Bibcode:1975NW.....62..154D. doi:10.1007/BF00608697.
  4. Dayhoff, M. O. (1976). „The origin and evolution of protein superfamilies“. Federation Proceedings. 35 (10): 2132–2138. PMID 181273.
  5. Gerlt, J. A.; Allen, K. N.; Almo, S. C.; Armstrong, R. N.; Babbitt, P. C.; Cronan, J. E.; Dunaway-Mariano, D.; Imker, H. J.; Jacobson, M. P. (2011). „The Enzyme Function Initiative“. Biochemistry. 50 (46): 9950–9962. doi:10.1021/bi201312u. PMC 3238057. PMID 21999478.
  6. Gandhimathi, A.; Nair, A. G.; Sowdhamini, R. (2011). „PASS2 version 4: An update to the database of structure-based sequence alignments of structural domain superfamilies“. Nucleic Acids Research. 40 (Database issue): D531–D534. doi:10.1093/nar/gkr1096. PMC 3245109. PMID 22123743.
  7. Emms DM, Kelly S. (Aug 2015). „OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy“. Genome Biology. 16 (157): 157. doi:10.1186/s13059-015-0721-2. PMC 4531804. PMID 26243257.