Предвидување на структурата на белковините: Разлика помеѓу преработките

[проверена преработка][проверена преработка]
Избришана содржина Додадена содржина
сНема опис на уредувањето
с Јазична исправка, replaced: серверите → опслужувачите using AWB
Ред 1:
 
[[Податотека:Protein-structure.png|мини|Составните аминокиселини на една белковина може да бидат анализирани за да се предвиди секундарната, терцијарната и квартерната структура на таа белковина.|алт=|336x336пкс]]
'''Предвидување на структурата на белковините''' — процес на изведување на тродимензионалната структура на [[Белковина|белковините]] од нивната [[Аминокиселина|аминокиселинска]] секвенца, т.е., предвидувањето на нивното [[Склопување на белковините|склопување]] и нивната [[Секундарна структура на белковините|секундарна]] и [[Терцијарна структура на белковините|терцијарна структура]] од нивната [[Примарна структура на белковините|примарна структура]]. Предвидувањето на структурата е фундаментално различен проблем од инверзниот проблем на [[дизајнирање на белковини]]. Предвидување на структурата е една од најважните дејности на [[Биоинформатика|биоинформатикатабиоинформатика]]та и [[Теоретска хемија|теоретската хемија]], која е мошне значајна во [[Медицина|медицинатамедицина]]та (на пример, за [[Дизајнирање на лекови|дизајнирање на нови лекови]]) и во [[Биотехнологија|биотехнологијатабиотехнологија]]та (за пример, за дизајнирање на нови [[Ензим|ензимиензим]]и). Секои две години, перформансите на постојните методи се оценуваат со [[CASP]] експериментот (од [[Англиски јазик|анг.]] Critical Assessment of Techniques for Protein Structure Prediction - критична процена на техники за предвидување на структурата на белковините). Континуирана проценка на веб серверитеопслужувачите за предвидувањето на структурата на белковините се врши од страна на проектот [[CAMEO3D]] (од анг. Continuous Automated Model EvaluatiOn).
 
== Структура на белковините и терминологија ==
Белковините (протеините) се [[Макромолекула|макромолекули]] изградени од [[Аминокиселина|аминокиселини]] поврзани меѓусебе со [[Пептидна врска|пептидни врски]] (наречени и [[Полипептид|полипептидиполипептид]]и). Постојат многу конформации кои може да ги заземе полипептидната верига поради нејзината ротација околу секој Cα атом. Овие конформациони промени се одговорни за разликите во тродимензионалната структура на протеините. Секоја аминокиселина во полипептидната верига е поларна, односно поседува одвоени позитивно и негативно наелектризирани региони, со слободна [[карбонилна група]], која може да игра улога на акцептор на [[водородна врска]], и [[Амин (хемија)|NH група]], која може да игра улога на донор на водородна врска. Затоа овие групи може да стапуваат во интеракција во склоп на протеинската структура. Дваестте природни аминокиселини може да се класифицираат според хемискиот состав на нивните странични ланци, кои исто така играат важна структурна улога. [[Глицин|Глицинот]]от зазема посебна позиција, бидејќи го има најмалиот страничен ланец, т.е. само еден водороден атом, па затоа може да ја зголеми локалната флексибилност во протеинската структура. [[Цистеин|Цистеинот]]от може да реагира со друг цистеински остаток и на тој начин да формира вкрстена врска која ја стабилизира целата протеинска структура.
 
Протеинската структура може да се смета како низа од елементи на [[Секундарна структура на белковините|секундарната структура]], како што се [[Алфа хеликс|α хеликсите]] и [[Бета плоча|β плочите]], кои заедно ја чинат целокупната тродимензионална конфигурација на полипептидниот синџир. Во овие секундарни структури се формираат правилни шеми на водородни врски помеѓу соседните аминокиселини, па затоа аминокиселините имаат слични Φ и Ψ агли.
Ред 12 ⟶ 11:
=== α-хеликс ===
{{Главна|Алфа хеликс}}
Алфа (α) хеликс е најзастапениот вид на секундарна структура кај протеините. Алфа хеликсот има 3,6 аминокиселински остатоци по едно свртување, со водородна врска која се формира помеѓу секој четврти остаток; просечната должина е 10 аминокиселини (3 свртувања) или 10 [[Ангстрем|Å]], но варира од 5 до 40 (1.5 до 11 свртувања). Порамнувањето на водородните врски создава диполен момент на хеликсот, што резултира со делумно позитивен полнеж на амино крајот на хеликсот. Бидејќи овој регион има слободни NH<small>2</small> групи, тој би стапувал во интеракција со негативно наелектризирани групи како што се [[Фосфорна киселина|фосфати]]. Најчестата локација на α хеликсите е површината на протеинското јадро, каде тие обезбедуваат интерфејс со водената средина. Внатрешно-ориентираните аминокиселини се хидрофобни, а надворешно-ориентираните се хидрофилни. На тој начин, секоја трета од четирите аминокиселини долж полипептидниот синџир ќе има тенденција да биде хидрофобна, а оваа шема може доста лесно да се детектира. Во мотивот [[леуцински патент]] има повторувачка шема на [[Леуцин|леуцинилеуцин]]и на контактните страни на два соседни хеликса. Оваа повторлива шема може да се прикаже со дијаграм на хеликсно тркало. Други α хеликси кои се наоѓаат во јадрото на протеинот или во [[Клеточна мембрана|клеточните мембрани]] имаат поголема и поредовна дистрибуција на хидрофобни аминокиселини. Хеликсите кои се изложени на протеинската површина имаат помал процент на хидрофобни аминокиселини. Аминокиселинската содржина на еден полипептид може да даде информации за α-хеликсните региони во молекулата. Регионите кои се побогати со [[аланин]] (А), [[глутаминска киселина]] (E), леуцин (Л) и [[метионин]] (М), а сиромашни со [[пролин]] (P), [[глицин]] (G), [[тирозин]] (Y) и [[серин]] (S) имаат тенденција да формираат α хеликс. Пролинот ги дестабилизира или ги нарушува α хеликсите, но може да биде присутен во подолгите хеликси, формирајќи искривување.
[[Податотека:Alpha_helix.png|мини|287x287px|Алфа хеликс со водородни врски (жолти точки)|алт=]]
 
Ред 20 ⟶ 19:
 
=== Петелка ===
Петелки се региони од полипептидната верига, кои: 1) се наоѓаат помеѓу α хеликсите и β плочите, 2) имаат различни должини и тродимензионални конфигурации и 3) се наоѓаат на површината на структурата.
 
Петелките на шнолите кои прават целосен пресврт во полипептидниот синџир поврзуваат две антипаралелни β-нишки и можат да бидат само две аминокиселини во должина. Петелките стапуваат во интеракција со околната водена средина и другите протеини. Бидејќи аминокиселините во петелките не се просторно ограничени, како аминокиселините во јадрото, и немаат ефект врз аранжманот на секундарните структури во јадрото, кај нив можат да настанат повеќе супституции, инсерции и делеции. Така, во порамнувањето на секвенците, присуството на овие особини може да биде показател за присуство на петелка. Позициите на [[Интрон|интронитеинтрон]]ите во геномската [[ДНК]] понекогаш одговараат на локациите на петелките во кодираниот протеин. Петелките, исто така, имаат тенденција да содржат поларни и наелектризирани аминокиселини и тие често се дел од активните места на [[Ензим|ензимитеензим]]ите. Деталниот преглед на структурите на петелките покажал дека тие припаѓаат на различни фамилии.
 
=== Навои ===
Регион од секундарната структура кој не е α-хеликс, β-плоча, или [[Свијок (биохемија)|свијок]] се нарекува навој.<ref name="Mount">{{Наведена книга|title=Bioinformatics: Sequence and Genome Analysis|last=Mount DM|publisher=Cold Spring Harbor Laboratory Press|year=2004|isbn=0-87969-712-1|volume=2}}</ref>
 
== Класификација на белковините ==
Белковините може да се класифицираат според нивната структурна и секвенциска сличност. Кај структурната класификација, големините и просторните аранжмани на секундарните структури се споредуваат со познати тродимензионални структури. Класификацијата врз основа на сличност на секвенците била историски првата која се користела. Најрано била направена сличност врз основа на порамнување на цели секвенци. Подоцна, протеините биле класифицирани врз основа на појавата на сочувани аминокиселини. Достапни се повеќе бази на податоци кои ги класифицираат протеините според една или повеќе од овие шеми. При разгледувањето на шемите за класификација на протеините, важно е да се имаат в предвид неколку набљудувања. Прво, две сосема различни протеински секвенци, со различно еволуционо потекло, може да се склопат во слична структура. Спротивно на тоа, секвенцата на античкиот [[ген]] за дадена структура може значително да дивергирала кај различни [[Вид (биологија)|видови]] на организми, а во исто време да ги одржала (сочувала) основните структурни карактеристики. Пронаоѓањето на било каква заостаната сличност во секвенците во вакви случаи може да биде многу тешка задача. Второ, два протеина кои имаат значителен степен на сличност во секвенците или меѓусебно или со трета секвенца, исто така, имаат заедничко еволутивно потекло и треба да споделуваат некои структурни карактеристики. Сепак, генските дупликации и генетските преуредувања за време на [[Еволуција|еволуцијатаеволуција]]та може да доведат до појава на нови генски копии, кои потоа може да еволуираат во протеини со нова функција и структура.<ref name="Mount">{{Наведена книга|title=Bioinformatics: Sequence and Genome Analysis|last=Mount DM|publisher=Cold Spring Harbor Laboratory Press|year=2004|isbn=0-87969-712-1|volume=2}}</ref>
 
=== Термини кои се користат за класификација на белковинските структури и секвенци ===
Ред 81 ⟶ 80:
[[Белковинска суперфамилија|'''Суперфамилија''']] е група на белковински фамилии кои имаат мала но детектибилна сличност во секвенците. Припадниците на една суперфамилија имаат заедничко еволутивно потекло. Протеини со неколку идентитети во порамнувањето на секвенците, но со заеднички број на структурни и функционални карактеристики се класифицирани во истата суперфамилија. На ниво на тродимензионална структура, протеините од иста суперфамилија споделуваат заеднички структурни карактеристики, како што е заеднички склоп, но може да имаат разлики во бројот и распоредот на секундарните структури. PIR ресурсот го користи терминот хомеоморфни суперфамилии за оние суперфамилии кои се составени од секвенци кои можат да бидат порамнети од крај до крај, што претставува споделување на единечен секвенциски хомологен домен, регион на сличност кој се протега низ целото порамнување. Овој домен, исто така, може да содржи помали хомологни домени кои се споделуваат со други белковински фамилии и суперфамилии. Иако дадена белковинска секвенца може да содржи домени кои се наоѓаат во неколку суперфамилии, што укажува на комплексна еволутивна историја, секвенците ќе бидат доделени само на една хомеоморфна суперфамилија врз основа на присуството на сличност низ повеќекратното порамнување на секвенци. Порамнувањето кај суперфамилиите може да вклучува региони кои не се порамнуваат ниту во средината ниту на краевите на порамнувањето. Спротивно на тоа, секвенците во рамките на иста фамилија добро се порамнуваат по целата должина.
 
'''Суперсекундарна структура''' е термин кој има слично значење со терминот структурен мотив.<ref name="Mount">{{Наведена книга|title=Bioinformatics: Sequence and Genome Analysis|last=Mount DM|publisher=Cold Spring Harbor Laboratory Press|year=2004|isbn=0-87969-712-1|volume=2}}</ref>
 
== Секундарна структура ==
'''Предвидување на секундарната структура на белковините''' претставува збир на техники во [[Биоинформатика|биоинформатикатабиоинформатика]]та кои имаат за цел да ги предвидат локалните секундарни структури на белковините врз основа на познавањето на нивната аминокиселинска секвенца. Предвидување се состои од доделување на региони од аминокиселинската секвенца можни структури на алфа хеликси, бета нишки (често именувани „издолжени“ конформации), или свијоци. Успехот на предвидувањето се одредува со негово споредување со резултатите на DSSP (анг. hydrogen bond estimation algorithm) алгоритмот (или некој сличен алгоритам, на пр. STRIDE ('''Str'''uctural '''ide'''ntification)) аплицирани на кристалната структура на протеинот. Развиени се специјализирани алгоритми за детекција на специфични добро-дефинирани обрасци, како што се трансмембранските хеликси и [[Намотан хеликс|намотаните хеликси]] во протеините.<ref name="Mount">{{Наведена книга|title=Bioinformatics: Sequence and Genome Analysis|last=Mount DM|publisher=Cold Spring Harbor Laboratory Press|year=2004|isbn=0-87969-712-1|volume=2}}</ref>
 
Најдобрите денешни методи за предвидување на секундарната структура на белковините достигнуваат точност од околу 80%;<ref>{{Наведено списание|last=Pirovano|first=W.|last2=Heringa|first2=J.|year=2010|title=Protein secondary structure prediction|journal=Methods Mol Biol|series=Methods in Molecular Biology|volume=609|issue=|pages=327–48|doi=10.1007/978-1-60327-241-4_19|isbn=978-1-60327-240-7|pmid=20221928}}</ref> оваа висока точност овозможува користење на предвидувањата како алатка за подобрување на препознавањето на склоповите (анг. fold recognition) и ''ab initio'' предвидувањето на структурата на белковините, класификација на структурните мотиви и подобрување на порамнувањето на секвенците. Точноста на денешните методи за предвидување на структурата на белковините се проценува со неделни [[Бенчмарк (информатика)|бенчмаркови]], како што се [[LiveBench]] и [[EVA (бенчмарк)|EVA]].