Предвидување на структурата на белковините: Разлика помеѓу преработките

[проверена преработка][проверена преработка]
Избришана содржина Додадена содржина
с Јазично подобрување, replaced: протеинска → белковинска (11), Протеинска → Белковинска, протеинско → белковинско, протеински → белковински
Ред 3:
 
== Структура на белковините и терминологија ==
Белковините (протеините) се [[Макромолекула|макромолекули]] изградени од [[Аминокиселина|аминокиселини]] поврзани меѓусебе со [[Пептидна врска|пептидни врски]] (наречени и [[полипептид]]и). Постојат многу конформации кои може да ги заземе полипептидната верига поради нејзината ротација околу секој Cα атом. Овие конформациони промени се одговорни за разликите во тродимензионалната структура на протеините. Секоја аминокиселина во полипептидната верига е поларна, односно поседува одвоени позитивно и негативно наелектризирани региони, со слободна [[карбонилна група]], која може да игра улога на акцептор на [[водородна врска]], и [[Амин (хемија)|NH група]], која може да игра улога на донор на водородна врска. Затоа овие групи може да стапуваат во интеракција во склоп на протеинскатабелковинската структура. Дваестте природни аминокиселини може да се класифицираат според хемискиот состав на нивните странични ланци, кои исто така играат важна структурна улога. [[Глицин]]от зазема посебна позиција, бидејќи го има најмалиот страничен ланец, т.е. само еден водороден атом, па затоа може да ја зголеми локалната флексибилност во протеинскатабелковинската структура. [[Цистеин]]от може да реагира со друг цистеински остаток и на тој начин да формира вкрстена врска која ја стабилизира целата протеинскабелковинска структура.
 
ПротеинскатаБелковинската структура може да се смета како низа од елементи на [[Секундарна структура на белковините|секундарната структура]], како што се [[Алфа-завојница|α хеликсите]] и [[Бета плоча|β плочите]], кои заедно ја чинат целокупната тродимензионална конфигурација на полипептидниот синџир. Во овие секундарни структури се формираат правилни шеми на водородни врски помеѓу соседните аминокиселини, па затоа аминокиселините имаат слични Φ и Ψ агли.
[[Податотека:Fipsi.png|мини|242x242px|Агли на врзување ψ и ω|алт=]]
Формирањето на овие структури ги неутрализира поларните групи на секоја аминокиселина. Секундарните структури густо се спакувани во јадрото на протеинскатабелковинската молекула каде владее хидрофобна средина. Секоја странична група на аминокиселините има ограничен волумен што може да го заземе и ограничен број на можни интеракции со другите соседни странични групи.<ref name="Mount">{{Наведена книга|title=Bioinformatics: Sequence and Genome Analysis|last=Mount DM|publisher=Cold Spring Harbor Laboratory Press|year=2004|isbn=0-87969-712-1|volume=2}}</ref>
 
=== α-завојница ===
{{Главна|Алфа-завојница}}
Алфа (α) хеликс е најзастапениот вид на секундарна структура кај протеините. Алфа-завојницаот има 3,6 аминокиселински остатоци по едно свртување, со водородна врска која се формира помеѓу секој четврти остаток; просечната должина е 10 аминокиселини (3 свртувања) или 10 [[Ангстрем|Å]], но варира од 5 до 40 (1.5 до 11 свртувања). Порамнувањето на водородните врски создава диполен момент на хеликсот, што резултира со делумно позитивен полнеж на амино крајот на хеликсот. Бидејќи овој регион има слободни NH<small>2</small> групи, тој би стапувал во интеракција со негативно наелектризирани групи како што се [[Фосфорна киселина|фосфати]]. Најчестата локација на α хеликсите е површината на протеинскотобелковинското јадро, каде тие обезбедуваат интерфејс со водената средина. Внатрешно-ориентираните аминокиселини се хидрофобни, а надворешно-ориентираните се хидрофилни. На тој начин, секоја трета од четирите аминокиселини долж полипептидниот синџир ќе има тенденција да биде хидрофобна, а оваа шема може доста лесно да се детектира. Во мотивот [[леуцински патент]] има повторувачка шема на [[леуцин]]и на контактните страни на два соседни хеликса. Оваа повторлива шема може да се прикаже со дијаграм на хеликсно тркало. Други α хеликси кои се наоѓаат во јадрото на протеинот или во [[Клеточна мембрана|клеточните мембрани]] имаат поголема и поредовна дистрибуција на хидрофобни аминокиселини. Хеликсите кои се изложени на протеинскатабелковинската површина имаат помал процент на хидрофобни аминокиселини. Аминокиселинската содржина на еден полипептид може да даде информации за α-завојницаните региони во молекулата. Регионите кои се побогати со [[аланин]] (А), [[глутаминска киселина]] (E), леуцин (Л) и [[метионин]] (М), а сиромашни со [[пролин]] (P), [[глицин]] (G), [[тирозин]] (Y) и [[серин]] (S) имаат тенденција да формираат α хеликс. Пролинот ги дестабилизира или ги нарушува α хеликсите, но може да биде присутен во подолгите хеликси, формирајќи искривување.
[[Податотека:Alpha_helix.png|мини|287x287px|Алфа-завојница со водородни врски (жолти точки)|алт=]]
 
Ред 27:
 
== Класификација на белковините ==
Белковините може да се класифицираат според нивната структурна и секвенциска сличност. Кај структурната класификација, големините и просторните аранжмани на секундарните структури се споредуваат со познати тродимензионални структури. Класификацијата врз основа на сличност на секвенците била историски првата која се користела. Најрано била направена сличност врз основа на порамнување на цели секвенци. Подоцна, протеините биле класифицирани врз основа на појавата на сочувани аминокиселини. Достапни се повеќе бази на податоци кои ги класифицираат протеините според една или повеќе од овие шеми. При разгледувањето на шемите за класификација на протеините, важно е да се имаат в предвид неколку набљудувања. Прво, две сосема различни протеинскибелковински секвенци, со различно еволуционо потекло, може да се склопат во слична структура. Спротивно на тоа, секвенцата на античкиот [[ген]] за дадена структура може значително да дивергирала кај различни [[Вид (биологија)|видови]] на организми, а во исто време да ги одржала (сочувала) основните структурни карактеристики. Пронаоѓањето на било каква заостаната сличност во секвенците во вакви случаи може да биде многу тешка задача. Второ, два протеина кои имаат значителен степен на сличност во секвенците или меѓусебно или со трета секвенца, исто така, имаат заедничко еволутивно потекло и треба да споделуваат некои структурни карактеристики. Сепак, генските дупликации и генетските преуредувања за време на [[еволуција]]та може да доведат до појава на нови генски копии, кои потоа може да еволуираат во протеини со нова функција и структура.<ref name="Mount"/>
 
=== Термини кои се користат за класификација на белковинските структури и секвенци ===
Најчесто користените термини за еволутивни и структурни односи помеѓу протеините се наведени подолу. Разни дополнителни термини се користат за различни видови на структурни карактеристики кои се среќаваат кај протеините. Описи на такви термини можат да се најде на [[CATH]] мрежното место, [[структурна класификација на белковините]] (SCOP) мрежното место, и Glaxo-Wellcome туторијалот на Swiss bioinformatics Expasy мрежното место.
 
'''[[Активно место]]''' е локализирана комбинација на аминокиселински странични групи во рамките на [[Терцијарна структура на белковините|терцијарната]] (тродимензионална) или [[Квартерна структура на белковините|квартерна]] (протеинскабелковинска подединица) структура која може да стапува во интеракција со хемиски специфичен [[супстрат]] и која ја дава биолошката активност на протеинот. Протеините со многу различни аминокиселински секвенци може да се склопат во структура со исто активно место.
 
'''Архитектура''' е релативната ориентација на секундарните структури во тродимензионалната структура, без разлика на тоа дали тие споделуваат слична структура на петелките или не.
Ред 42:
'''Класа''' е термин кој се користи за класификација на белковинските домени според нивната содржина на секундарни структури и организацијата. Левит и Чотиа (1976) првично навеле четири класи, а подоцна биле додадени уште неколку други во SCOP базата на податоци. CATH базата на податоци наведува три класи: доминантно-α, доминантно-β и α–β класи, со тоа што α–β класата ги вклучува α/β и α+β структурите.
 
'''Јадро''' е дел од склопената протеинскабелковинска молекула кое се состои од хидрофобна внатрешност на α-завојницаи и β-плочи. Оваа компактна структура ги доведува страничните групи на аминокиселините доволно блиску, така што тие можат да стапуваат во интеракција. Кога се споредуваат структурите на протеините, како што се врши во базата на податоци SCOP, јадрото е регионот кој е заеднички за повеќето структури кои имаат заеднички склоп или кои припаѓаат на истото натсемејство. Во предвидувањето на структурата, јадрото понекогаш се дефинира како распоредот на секундарните структури кои најверојатно е сочуван за време на еволутивната промена.
 
'''[[Белковински домен|Домен]]''' (во контекст на секвенци) е сегмент од полипептидниот синџир кој може да се склопи во тродимензионална структура без оглед на присуството на други сегменти од синџирот. Посебните домени на даден протеин може да стапуваат екстензивно во интеракција или може да бидат споени преку краток дел од полипептидниот синџир. Протеин со неколку домени (мултидоменски протеин) може да ги користи овие домени за функционални интеракции со различни молекули.
Ред 54:
'''Фамилија''' (во контекст на структура) е, како што се користи во FSSP базата на податоци (од анг. Families of Structurally Similar Proteins - Фамилии на структурно слични белковини) и на DALI/FSSP мрежното место, две структури кои имаат значително ниво на структурна сличност, но не мора да имаат значителна сличност во секвенците.
 
'''Склопот''' е сличен на структурниот мотив, вклучува поголема комбинација на единици на секундарната структура во истата конфигурација. На тој начин, протеините кои го споделуваат истиот склоп имаат иста комбинација на секундарни структури кои се поврзани со слични петелки. Еден пример е [[Розманов склоп|Розмановиот склоп]], кој се состои од неколку наизменични α-завојницаи и паралелни β-нишки. Во базите на податоци SCOP, CATH и FSSP, познатите протеинскибелковински структури се класифицирани во хиерархиски нивоа на структурна комплексност, каде склопот е основното ниво на класификација.
 
'''Хомологен домен''' (во контекст на секвенци) е продолжен секвенциски образец, кој најчесто се детектира со методите за порамнување на секвенците. Тој сигнализира заедничко еволутивно потекло на порамнетите секвенци. Хомологниот домен генерално е подолг од мотивите. Доменот може да ја содржи целата дадена протеинскабелковинска секвенца или само дел од секвенцата. Некои домени се комплексни и се состојат од неколку помали хомологни домени кои се здружиле за да формираат поголем во текот на еволуцијата. Домен кој ја покрива целата секвенца се нарекува хомеоморфен домен од страна на PIR (од анг. Protein Information Resource - ПротеинскиБелковински информативен ресурс).
 
'''Модул''' е регион на сочувани аминокиселински обрасци кои содржат еден или повеќе мотиви, а се смета за основна единица на структура или функција. Присуството на модул, исто така, се користи за класификација на протеините во фамилии.
Ред 72:
'''Профил''' (во контекст на секвенца) е бодувачка матрица која претставува повеќекратно порамнување на секвенците на фамилија на протеини. Профилот обично се добива од добро сочуван регион во повеќекратното порамнување. Профилот е во форма на матрица, каде секоја колона претставува позиција во порамнувањето, а секој ред е една од аминокиселините. Матриксните вредности ја даваат веројатноста за секоја аминокиселина на соодветната позиција во порамнувањето. Профилот се поместува по должината на целната секвенца за да ги лоцира најдобро бодуваните региони со алгоритам за динамичко програмирање. Секвенциски профил може, исто така, да биде претставен со [[скриен модел на Марков]] (анг. HMM, Hidden Markov Model).
 
'''Профил''' (во контекст на структура) е бодувачка матрица која претставува кои аминокиселини треба добро да се вклопат и кои треба да се вклопат лошо во секвенциски позиции на позната протеинскабелковинска структура. Колоните на профилот претставуваат секвенциски позиции во структурата, а редовите на профилот ги претставуваат 20-те аминокиселини. Како и со секвенцискиот профил, структурниот профил се поместува по целната секвенца за да го пронајде највисокиот можен бод за порамнување, со алгоритам за динамичко програмирање. Празнините може да бидат вклучени и добиваат казнени бодови. Резултирачката оцена дава индикација за тоа дали целниот протеин може да има таква структура или не.
 
'''[[Квартерна структура на белковините|Квартерна структура]]''' е тродимензионална конфигурација на протеинскатабелковинската молекула која содржи неколку независни полипептидни синџири.
 
[[Секундарна структура на белковините|'''Секундарна структура''']] се интеракциите кои се одвиваат помеѓу C, O, и NH групите на аминокиселините во полипептидниот синџир за да формираат α-завојницаи, β-плочи, свиоци, петелки и други форми, и кои го олеснуваат склопувањето во тродимензионална структура.
Ред 90:
Практичната примена на предвидувањето на белковинската структура денес е поважна од било кога. Постојано се продуцираат огромни количества на податоци за белковински секвенци од проектите на ДНК секвенционирање, како што е [[Проект за човечкиот геном|Проектот за човечкиот геном]]. И покрај напорите на полето на [[Структурна геномика|структурната геномика]], создавањето на експериментално потврдени белковински структури (обично со помош на бавни и релативно скапи методи на [[рендгенска кристалографија]] или [[NMR спектроскопија]]) значително заостанува зад продукцијата на нови белковински секвенци.
 
Предвидувањето на протеинскатабелковинската структура останува исклучително тежок и недоволно развиен потфат. Двата главни проблеми се пресметувањето на [[Гибсова слободна енергија|слободната енергија]] на протеините и наоѓањето на глобалниот минимум на оваа енергија. Методот за предвидување на структурата на протеините мора да го истражи просторот на можните протеинскибелковински структури кој е [[Парадокс на Левинтал|астрономски голем]]. Овие проблеми можат делумно да се заобиколат со помош на „компаративното“ или хомологно моделирање и методите за препознавање на склопови, во кои просторот за пребарување е редуциран од претпоставката дека испитуваниот протеин би заземал структура која е приближно иста со експериментално утврдената структура на друг хомологен протеин. Од друга страна, ''de novo'' или ''ab initio'' методите за предвидување на структурата на белковините мора експлицитно да ги решат овие проблеми. Напредокот и предизвиците во предвидувањата на структурата на протеините се разгледани во Zhang 2008.<ref name="zhang2008">{{Наведено списание|last=Zhang Y|year=2008|title=Progress and challenges in protein structure prediction|journal=Curr Opin Struct Biol|volume=18|issue=3|pages=342–8|doi=10.1016/j.sbi.2008.02.004|pmc=2680823|pmid=18436442}}</ref>
 
== Квартерна структура ==