Предвидување на структурата на белковините: Разлика помеѓу преработките

[проверена преработка][проверена преработка]
Избришана содржина Додадена содржина
с Јазично подобрување, replaced: терцијар → третич (3), Терцијар → Третич (3), примар → првич, Примар → Првич (3), секундар → вторич (21), Секундар →
с Јазична исправка, replaced: секвенца → низа (18), секвенци → низи (44), Секвенци → Низи, низионирање → секвенционирање, низиска → низна (3)
Ред 1:
[[Податотека:Protein-structure.png|мини|Составните аминокиселини на една белковина може да бидат анализирани за да се предвиди вторичната, третичната и четвртичната структура на таа белковина.|алт=|336x336пкс]]
'''Предвидување на структурата на белковините''' — процес на изведување на тридимензионалната структура на [[Белковина|белковините]] од нивната [[Аминокиселина|аминокиселинска]] секвенцаниза, т.е., предвидувањето на нивното [[Склопување на белковините|склопување]] и нивната [[Вторична структура на белковините|вторична]] и [[Третична структура на белковините|третична структура]] од нивната [[Првична структура на белковините|првична структура]]. Предвидувањето на структурата е фундаментално различен проблем од инверзниот проблем на [[дизајнирање на белковини]]. Предвидување на структурата е една од најважните дејности на [[биоинформатика]]та и [[Теоретска хемија|теоретската хемија]], која е мошне значајна во [[медицина]]та (на пример, за [[Дизајнирање на лекови|дизајнирање на нови лекови]]) и во [[биотехнологија]]та (за пример, за дизајнирање на нови [[ензим]]и). Секои две години, перформансите на постојните методи се оценуваат со [[CASP]] експериментот (од [[Англиски јазик|анг.]] Critical Assessment of Techniques for Protein Structure Prediction - критична процена на техники за предвидување на структурата на белковините). Континуирана проценка на опслужувачите за предвидувањето на структурата на белковините се врши од страна на проектот [[CAMEO3D]] (од анг. Continuous Automated Model EvaluatiOn).
 
== Структура на белковините и терминологија ==
Ред 21:
Петелки се региони од полипептидната верига, кои: 1) се наоѓаат помеѓу α завојниците и β плочите, 2) имаат различни должини и тридимензионални конфигурации и 3) се наоѓаат на површината на структурата.
 
Петелките на шнолите кои прават целосен пресврт во полипептидниот синџир поврзуваат две антипаралелни β-нишки и можат да бидат само две аминокиселини во должина. Петелките стапуваат во интеракција со околната водена средина и другите белковини. Бидејќи аминокиселините во петелките не се просторно ограничени, како аминокиселините во јадрото, и немаат ефект врз аранжманот на вторичните структури во јадрото, кај нив можат да настанат повеќе супституции, вметнувања и бришења. Така, во порамнувањето на секвенцитенизите, присуството на овие особини може да биде показател за присуство на петелка. Позициите на [[интрон]]ите во геномската [[ДНК]] понекогаш одговараат на локациите на петелките во кодираната белковина. Петелките, исто така, имаат тенденција да содржат поларни и наелектризирани аминокиселини и тие често се дел од активните места на [[ензим]]ите. Деталниот преглед на структурите на петелките покажал дека тие припаѓаат на различни семејства.
 
=== Навои ===
Ред 27:
 
== Класификација на белковините ==
Белковините може да се класифицираат според нивната структурна и секвенцисканизна сличност. Кај структурната класификација, големините и просторните аранжмани на вторичните структури се споредуваат со познати тридимензионални структури. Класификацијата врз основа на сличност на секвенцитенизите била историски првата која се користела. Најрано била направена сличност врз основа на порамнување на цели секвенцинизи. Подоцна, белковините биле класифицирани врз основа на појавата на сочувани аминокиселини. Достапни се повеќе бази на податоци кои ги класифицираат белковините според една или повеќе од овие шеми. При разгледувањето на шемите за класификација на белковините, важно е да се имаат предвид неколку набљудувања. Прво, две сосема различни белковински секвенцинизи, со различно еволуционо потекло, може да се склопат во слична структура. Спротивно на тоа, секвенцатанизата на античкиот [[ген]] за дадена структура може значително да дивергирала кај различни [[Вид (биологија)|видови]] на организми, а во исто време да ги одржала (сочувала) основните структурни карактеристики. Пронаоѓањето на каква било заостаната сличност во секвенцитенизите во вакви случаи може да биде многу тешка задача. Второ, две белковини кои имаат значителен степен на сличност во секвенцитенизите или меѓусебно или со трета секвенцаниза, исто така, имаат заедничко еволутивно потекло и треба да споделуваат некои структурни карактеристики. Сепак, генските дупликации и генетските преуредувања за време на [[еволуција]]та може да доведат до појава на нови генски копии, кои потоа може да еволуираат во белковини со нова функција и структура.<ref name="Mount"/>
 
=== Термини кои се користат за класификација на белковинските структури и секвенцинизи ===
Најчесто користените термини за еволутивни и структурни односи помеѓу белковините се наведени подолу. Разни дополнителни термини се користат за различни видови на структурни карактеристики кои се среќаваат кај белковините. Описи на такви термини можат да се најде на [[CATH]] мрежното место, [[структурна класификација на белковините]] (SCOP) мрежното место, и Glaxo-Wellcome туторијалот на Swiss bioinformatics Expasy мрежното место.
 
'''[[Активно место]]''' е локализирана комбинација на аминокиселински странични групи во рамките на [[Третична структура на белковините|третичната]] (тридимензионална) или [[Четвртична структура на белковините|четвртична]] (белковинска подединица) структура која може да стапува во интеракција со хемиски специфичен [[супстрат]] и која ја дава биолошката активност на белковината. Белковините со многу различни аминокиселински секвенцинизи може да се склопат во структура со исто активно место.
 
'''Архитектура''' е релативната ориентација на вторичните структури во тридимензионалната структура, без разлика на тоа дали тие споделуваат слична структура на петелките или не.
Ред 38:
'''Склоп''' е тип на архитектура која има сочувана структура и на петелките.
 
'''Блок''' е сочувана шема на аминокиселинска секвенцаниза во семејство на белковини. Шемата вклучува серија на можни совпаѓања на секоја позиција во претставените секвенцинизи, но нема вметнати или избришани позиции (вметнувања или бришења) во шемата или во секвенцитенизите. Спротивно на тоа, секвенцискитенизните профили се тип на бодувачка матрица која претставува сличен сет на шеми кои вклучуваат вметнувања и бришења.
 
'''Класа''' е термин кој се користи за класификација на белковинските домени според нивната содржина на вторични структури и организацијата. Левит и Чотиа (1976) првично навеле четири класи, а подоцна биле додадени уште неколку други во SCOP базата на податоци. CATH базата на податоци наведува три класи: доминантно-α, доминантно-β и α–β класи, со тоа што α–β класата ги вклучува α/β и α+β структурите.
Ред 44:
'''Јадро''' е дел од склопената белковинска молекула кое се состои од хидрофобна внатрешност на α-завојници и β-плочи. Оваа компактна структура ги доведува страничните групи на аминокиселините доволно блиску, така што тие можат да стапуваат во интеракција. Кога се споредуваат структурите на белковините, како што се врши во базата на податоци SCOP, јадрото е регионот кој е заеднички за повеќето структури кои имаат заеднички склоп или кои припаѓаат на истото натсемејство. Во предвидувањето на структурата, јадрото понекогаш се дефинира како распоредот на вторичните структури кои најверојатно е сочуван за време на еволутивната промена.
 
'''[[Белковински домен|Домен]]''' (во контекст на секвенцинизи) е сегмент од полипептидниот синџир кој може да се склопи во тридимензионална структура без оглед на присуството на други сегменти од синџирот. Посебните домени на дадена белковина може да стапуваат екстензивно во интеракција или може да бидат споени преку краток дел од полипептидниот синџир. Белковина со неколку домени (мултидоменска белковина) може да ги користи овие домени за функционални интеракции со различни молекули.
 
'''[[Белковинско семејство|Семејство]]''' (во контекст на секвенцинизи) е група на белковини со слична биохемиска функција, кои се повеќе од 50% идентични кога се порамнети. Една белковинско семејство содржи белковини со иста функција во различни организми (ортологни секвенцинизи), но исто така може да вклучува и белковини во склоп на истиот организам (паралогни секвенцинизи) добиени со генска дупликација и преуредувања. Семејствата може понатаму да се поделат на [[Белковинско потсемејство|потсемејства]] или да се групираат во натсемејства врз основа на соодветни повисоки или пониски нивоа на сличност во секвенцитенизите. Базата на податоци SCOP има 1296 семејства, а базата на податоци CATH (верзија 1.7 бета) има 1846 семејства.
 
Кога секвенцитенизите на белковините со истата функција се испитуваат подетално, за некои се наоѓаа дека имаат голема секвенцисканизна сличност. Според горенаведените критериуми тие се членови на исто семејство. Сепак, некои имаат многу мала, дури незначајна, секвенцисканизна сличност со другите членови на истото семејство. Во такви случаи, семејниот однос помеѓу двата далечни членови на истото семејство А и Ц може да се демонстрира со наоѓање на дополнителен член на семејството, на пример Б, кој има значителна сличност и со А и со Ц. Така, Б обезбедува врска помеѓу А и Ц.
 
Со 50% идентична секвенцаниза, белковините имаат иста тридимензионална структура, а идентичните атоми во порамнувањето на секвенцитенизите би се поклопиле за приближно 1 Å во структурниот модел. На тој начин, ако структурата на еден член од семејството е позната, може да се направи веродостојно предвидување на структурата на втор член на истата семејство. Што е поголема идентичноста во секвенцатанизата, тоа е поверодостојно предвидувањето на структурата.
 
'''Семејство''' (во контекст на структура) е, како што се користи во FSSP базата на податоци (од анг. Families of Structurally Similar Proteins - Семејства на структурно слични белковини) и на DALI/FSSP мрежното место, две структури кои имаат значително ниво на структурна сличност, но не мора да имаат значителна сличност во секвенцитенизите.
 
'''Склопот''' е сличен на структурниот мотив, вклучува поголема комбинација на единици на вторичната структура во истата конфигурација. На тој начин, белковините кои го споделуваат истиот склоп имаат иста комбинација на вторични структури кои се поврзани со слични петелки. Еден пример е [[Розманов склоп|Розмановиот склоп]], кој се состои од неколку наизменични α-завојници и паралелни β-нишки. Во базите на податоци SCOP, CATH и FSSP, познатите белковински структури се класифицирани во хиерархиски нивоа на структурна комплексност, каде склопот е основното ниво на класификација.
 
'''Хомологен домен''' (во контекст на секвенцинизи) е продолжен секвенцискинизен образец, кој најчесто се детектира со методите за порамнување на секвенцитенизите. Тој сигнализира заедничко еволутивно потекло на порамнетите секвенцинизи. Хомологниот домен генерално е подолг од мотивите. Доменот може да ја содржи целата дадена белковинска секвенцаниза или само дел од секвенцатанизата. Некои домени се комплексни и се состојат од неколку помали хомологни домени кои се здружиле за да формираат поголем во текот на еволуцијата. Домен кој ја покрива целата секвенцаниза се нарекува хомеоморфен домен од страна на PIR (од анг. Protein Information Resource - Белковински информативен ресурс).
 
'''Модул''' е регион на сочувани аминокиселински обрасци кои содржат еден или повеќе мотиви, а се смета за основна единица на структура или функција. Присуството на модул, исто така, се користи за класификација на белковините во семејства.
 
'''Мотив''' (во контекст на секвенцаниза) е сочуван образец на аминокиселини кој се наоѓа во две или повеќе белковини. Во каталогот [[PROSITE]], мотив е аминокиселински образец кој се наоѓа во група на белковини кои имаат слична биохемиска активност, а кој често е сместен во близина на активното место на белковината. Примери за бази на податоци за секвенцискинизни мотиви се каталогот PROSITE и базата на податоци Stanford Motifs Database.<ref>{{Наведено списание|last=Huang|first=JY.|last2=Brutlag|first2=DL.|date=Jan 2001|title=The EMOTIF database|journal=Nucleic Acids Res|volume=29|issue=1|pages=202–04|doi=10.1093/nar/29.1.202|pmc=29837|pmid=11125091}}</ref>
 
[[Структурен мотив|'''Мотив''']] (во контекст на структура) е комбинација на неколку елементи на вторичната структура создадени со склопување на соседни делови од полипептидниот синџир во специфична тридимензионална конфигурација. Еден пример е мотивот завојница-петелка-завојница. Структурните мотиви се нарекуваат и супервторични структури и склопови.
 
'''Матрица за бодување специфична за позиција''' (во контекст на секвенцаниза) претставува сочуван регион во повеќекратно порамнување на секвенцинизи без празнини. Секоја матриксна колона ја претставува варијацијата најдена во една колона од повеќекратното порамнување на секвенцинизи.
 
'''Матрица за бодување специфична за позиција—3D''' (во контекст на структура) претставува аминокиселинската варијација во порамнувањето на белковините кои спаѓаат во истата структурна класа. Матриксните колони ја претставуваат аминокиселинската варијација најдена во една аминокиселинска позиција во порамнетите структури.
 
'''[[Првична структура на белковините|Првична структура]]''' е линеарната аминокиселинска секвенцаниза на белковината, која од хемиска гледна точка е полипептидна низа составена од аминокиселини врзани со пептидни врски.
 
'''Профил''' (во контекст на секвенцаниза) е бодувачка матрица која претставува повеќекратно порамнување на секвенцитенизите на семејство на белковини. Профилот обично се добива од добро сочуван регион во повеќекратното порамнување. Профилот е во форма на матрица, каде секоја колона претставува позиција во порамнувањето, а секој ред е една од аминокиселините. Матриксните вредности ја даваат веројатноста за секоја аминокиселина на соодветната позиција во порамнувањето. Профилот се поместува по должината на целната секвенцаниза за да ги лоцира најдобро бодуваните региони со алгоритам за динамичко програмирање. СеквенцискиНизен профил може, исто така, да биде претставен со [[скриен модел на Марков]] (анг. HMM, Hidden Markov Model).
 
'''Профил''' (во контекст на структура) е бодувачка матрица која претставува кои аминокиселини треба добро да се вклопат и кои треба да се вклопат лошо во секвенцискинизни позиции на позната белковинска структура. Колоните на профилот претставуваат секвенцискинизни позиции во структурата, а редовите на профилот ги претставуваат 20-те аминокиселини. Како и со секвенцискиотнизниот профил, структурниот профил се поместува по целната секвенцаниза за да го пронајде највисокиот можен бод за порамнување, со алгоритам за динамичко програмирање. Празнините може да бидат вклучени и добиваат казнени бодови. Резултирачката оцена дава индикација за тоа дали целната белковина може да има таква структура или не.
 
'''[[Четвртична структура на белковините|Четвртична структура]]''' е тридимензионална конфигурација на белковинската молекула која содржи неколку независни полипептидни синџири.
Ред 78:
[[Вторична структура на белковините|'''Вторична структура''']] се интеракциите кои се одвиваат помеѓу C, O, и NH групите на аминокиселините во полипептидниот синџир за да формираат α-завојници, β-плочи, свиоци, петелки и други форми, и кои го олеснуваат склопувањето во тридимензионална структура.
 
[[Белковинско натсемејство|'''Натсемејство''']] е група на белковински семејства кои имаат мала но детектибилна сличност во секвенцитенизите. Припадниците на едно натсемејство имаат заедничко еволутивно потекло. Белковини со неколку идентитети во порамнувањето на секвенцитенизите, но со заеднички број на структурни и функционални карактеристики се класифицирани во истото натсемејство. На ниво на тридимензионална структура, белковините од исто натсемејство споделуваат заеднички структурни карактеристики, како што е заеднички склоп, но може да имаат разлики во бројот и распоредот на вторичните структури. PIR ресурсот го користи терминот хомеоморфни натсемејства за оние натсемејства кои се составени од секвенцинизи кои можат да бидат порамнети од крај до крај, што претставува споделување на единечен секвенцискинизен хомологен домен, регион на сличност кој се протега низ целото порамнување. Овој домен, исто така, може да содржи помали хомологни домени кои се споделуваат со други белковински семејства и натсемејства. Иако дадена белковинска секвенцаниза може да содржи домени кои се наоѓаат во неколку натсемејства, што укажува на комплексна еволутивна историја, секвенцитенизите ќе бидат доделени само на една хомеоморфно натсемејство врз основа на присуството на сличност низ повеќекратното порамнување на секвенцинизи. Порамнувањето кај натсемејствата може да вклучува региони кои не се порамнуваат ниту во средината ниту на краевите на порамнувањето. Спротивно на тоа, секвенцитенизите во рамките на исто семејство добро се порамнуваат по целата должина.
 
'''Супервторична структура''' е термин кој има слично значење со терминот структурен мотив.<ref name="Mount"/>
 
== Вторична структура ==
'''Предвидување на вторичната структура на белковините''' претставува збир на техники во [[биоинформатика]]та кои имаат за цел да ги предвидат локалните вторични структури на белковините врз основа на познавањето на нивната аминокиселинска секвенцаниза. Предвидување се состои од доделување на региони од аминокиселинската секвенцаниза можни структури на алфа-завојници, бета нишки (често именувани „издолжени“ конформации), или свиоци. Успехот на предвидувањето се одредува со негово споредување со резултатите на DSSP (анг. hydrogen bond estimation algorithm) алгоритмот (или некој сличен алгоритам, на пр. STRIDE ('''Str'''uctural '''ide'''ntification)) аплицирани на кристалната структура на белковината. Развиени се специјализирани алгоритми за детекција на специфични добро-дефинирани обрасци, како што се трансмембранските завојници и [[Намотана завојница|намотаните завојници]] во белковините.<ref name="Mount"/>
 
Најдобрите денешни методи за предвидување на вторичната структура на белковините достигнуваат точност од околу 80%;<ref>{{Наведено списание|last=Pirovano|first=W.|last2=Heringa|first2=J.|year=2010|title=Protein secondary structure prediction|journal=Methods Mol Biol|series=Methods in Molecular Biology|volume=609|issue=|pages=327–48|doi=10.1007/978-1-60327-241-4_19|isbn=978-1-60327-240-7|pmid=20221928}}</ref> оваа висока точност овозможува користење на предвидувањата како алатка за подобрување на препознавањето на склоповите (анг. fold recognition) и ''ab initio'' предвидувањето на структурата на белковините, класификација на структурните мотиви и подобрување на порамнувањето на секвенцитенизите. Точноста на денешните методи за предвидување на структурата на белковините се проценува со неделни [[Бенчмарк (информатика)|бенчмаркови]], како што се [[LiveBench]] и [[EVA (бенчмарк)|EVA]].
 
== Третична структура ==
Практичната примена на предвидувањето на белковинската структура денес е поважна од било кога. Постојано се продуцираат огромни количества на податоци за белковински секвенцинизи од проектите на ДНК секвенционирање, како што е [[Проект за човечкиот геном|Проектот за човечкиот геном]]. И покрај напорите на полето на [[Структурна геномика|структурната геномика]], создавањето на експериментално потврдени белковински структури (обично со помош на бавни и релативно скапи методи на [[рендгенска кристалографија]] или [[NMR спектроскопија]]) значително заостанува зад продукцијата на нови белковински секвенцинизи.
 
Предвидувањето на белковинската структура останува исклучително тежок и недоволно развиен потфат. Двата главни проблеми се пресметувањето на [[Гибсова слободна енергија|слободната енергија]] на белковините и наоѓањето на глобалниот минимум на оваа енергија. Методот за предвидување на структурата на белковините мора да го истражи просторот на можните белковински структури кој е [[Парадокс на Левинтал|астрономски голем]]. Овие проблеми можат делумно да се заобиколат со помош на „компаративното“ или хомологно моделирање и методите за препознавање на склопови, во кои просторот за пребарување е редуциран од претпоставката дека испитуваната белковина би заземал структура која е приближно иста со експериментално утврдената структура на друг хомологна белковина. Од друга страна, ''de novo'' или ''ab initio'' методите за предвидување на структурата на белковините мора експлицитно да ги решат овие проблеми. Напредокот и предизвиците во предвидувањата на структурата на белковините се разгледани во Zhang 2008.<ref name="zhang2008">{{Наведено списание|last=Zhang Y|year=2008|title=Progress and challenges in protein structure prediction|journal=Curr Opin Struct Biol|volume=18|issue=3|pages=342–8|doi=10.1016/j.sbi.2008.02.004|pmc=2680823|pmid=18436442}}</ref>