Банка на податоци за белковини

Банка на податоци за белковини (англиски: Protein Data Bank, PDB) — база на податоци на тридимензионални структури на биолошки макромолекули, како што се белковините и нуклеинските киселини. Податоците главно се добиваат со рендгенска кристалографија, NMR спектроскопија или крио-електронска микроскопија и после поднесувањето од страна на истражувачите стануваат слободно достапни на Интернет преку мрежните места на организациите членки (PDBe,[1] PDBj,[2] и RCSB[3]). PDB е надгледувана од страна на организацијата наречена Worldwide Protein Data Bank, wwPDB.

Банка на податоци за белковини
Содржина
Опис
Контакт
Пристап
Податотечен форматPDB
Мреж. место
Алатки
Разно

PDB е клучен извор на информации во областа на структурната биологија, како што е структурната геномика. Повеќето големи научни списанија и некои донаторски агенции, бараат од научниците да ги поднесат структурите добиени од нивните истражувања на PDB. Многу други бази на податоци користат белковински структури депонирани во PDB. На пример, SCOP и CATH ги класифицираат белковинските структури, додека PDBsum обезбедува графички преглед на записите во PDB со користење на информации од други извори, како што е Онтологија на гени (анг. Gene ontology - GO).[4][5]

Историја

уреди

Иницијацијата на PDB се случила како резултат на конвергенцијата на две нешта: 1) мала, но растечка колекција на податоци за белковински структури добиени со дифракција на Х-зраци; и 2) новодостапното (1968 година) прикажување на молекуларна графика за визуелизација на овие структури во 3-D. Во 1969 година, со спонзорството на Волтер Хамилтон од Брукхејвенската национална лабораторија, Едгар Мејер (Тексашки А&М универзитет) започнал да пишува софтвер за складирање на податотеки со атомски координати во еден заеднички формат за да ги направи достапни за геометриска и графичка евалуација. До 1971 година, една од Мејеровите програми, SEARCH, им овозможила на истражувачите далечински пристап до информации од базата на податоци за офлајн проучување на белковински структури.[6] SEARCH бил инструментален во овозможувањето на вмрежувањето, а на тој начин го одбележал функционалниот почеток на PDB.

Банката на податоци за белковини, била објавена во октомври 1971 година во списанието Nature New Biology[7] како заеднички потфат на Кембричкиот центар за кристалографски податоци во Обединетото Кралство и Брукхејвенската национална лабораторија во САД.

По смртта на Хамилтон во 1973 година, Том Кецл го презел водството на PDB во следните 20 години. Во јануари 1994 година, Џоел Сусман од израелскиот Научен институт Вајзман бил назначен за раководител на PDB. Во октомври 1998 година,[8] PDB била префрлена на Истражувачката соработка за структурна биоинформатика (Research Collaboratory for Structural Bioinformatics - RCSB); трансферот завршил во јуни 1999 година. Нов директор била Хелен М. Берман од Рутгерс универзитетот (една од менаџерските институции на RCSB, а другата е Суперкомпјутерскиот центар во Сан Диего при Калифорнискиот универзитет во Сан Диего).[9] Во 2003 година, со формирањето на wwPDB (од анг. Worldwide Protein Data Bank), PDB станала меѓународна организација. Основачки членки се PDBe (Европа),[1] RCSB (САД) и PDBj (Јапонија).[2] Банката на податоци за биолошка магнетна резонанца (Biological Magnetic Resonance Data Bank - BMRB)[10] се приклучила во 2006 година. Секоја од четирите членки на wwPDB може да игра улога на центар за депонирање, центар за обработка на податоци и дистрибутивен центри за податоци на PDB. Обработката на податоците се однесува на фактот што персоналот на wwPDB го прегледува и анотира секој поднесен запис.[11] Потоа податоците автоматски се проверуваат за веродостојност (изворниот код[12] за овој софтвер за валидација е достапен за јавноста, без надомест).

Содржина

уреди
 
Примери за белковински структури од PDB (создадени со UCSF Chimera)
 
Стапка на одредување на белковински структури по метод и година

PDB базата на податоци се ажурира неделно (UTC+0 среда). Исто така, PDB листата[13] исто така се ажурира неделно. До 17 октомври 2018 година, тековната листа е следна:

Експериментален метод Белковини Нуклеински киселини Комплекси на

белковини/нуклеински киселини

Други Вкупно
Дифракција на Х-зраци 121935 1963 6289 4 130191
NMR 10872 1260 251 8 12391
Електронската микроскопија 1810 31 652 0 2493
Хибридни методи 123 5 2 1 131
Други 244 4 6 13 267
Вкупно: 134984 3263 7200 26 145473
120,052 структури во PDB имаат податотека за структурен фактор.
9,734 структури имаат NMR податотека.
3,486 структури во PDB имаат податотека за хемиски шифт.
2,531 структури во PDB имаат 3DEM мапна податотека депонирана во електронско-микроскопската банка на податоци (Electron Microscopy Data Bank - EMDB)

Овие податоци покажуваат дека повеќето структури се определени со дифракција на Х-зраци, но околу 10% од структурите сега се добиваат со јадрено магнетно резонантна спектроскопија на белковини. Кога се користи дифракција на Х-зраци, се добиваат приближни вредности за координатите на атомите на белковината, додека проценките за растојанијата помеѓу парови на атоми на белковината се добиваат со NMR експерименти. Затоа, конечната конформација на белковината се добива, во вториот случај, со решавање на геометриски проблем. Неколку структури на белковини се одредуваат со крио-електронска микроскопија.

Значењето на податотеките на структурниот фактор, споменато погоре, е дека, за PDB структурите определени со дифракција на Х-зраци кои имаат структурна податотека, може да се набљудува мапата на електронска густина. Податоците за таквите структури се складираат на „опслужувачот за електронска густина“.[14][15]

Во минатото, бројот на структури во PDB има пораснато со приближно експоненцијална стапка; во 1982 година биле надминати 100 регистрирани структури, во 1993 година биле надминати 1000 структури, во 1999 година 10,000 структури, а во 2014 година 100,000 структури.[16][17] Сепак, од 2007 година, стапката на акумулација на нови белковински структури се чини дека го достигнала своето плато.

Формат на податотека

уреди

Форматот на податотеката кој првично бил користен од PDB бил наречен формат на PDB-датотека (анг. Protein Data Bank (pdb) file format). Овој оригинален формат бил ограничен од ширината на компјутерските перфорирани картички до 80 карактери по линија. Околу 1996 година, форматот „макромолекуларен кристалографски информациски податотека“, mmCIF, кој е екстензија на CIF форматот, започнал постепено да се внесува. MmCIF сега е главниот формат на PDB архивата.[18] XML верзија на овој формат, наречена PDBML, била опишана во 2005 година.[19] Податотеките за структури можат да се преземат во кој било од овие три формати. Всушност, поединечните податотеки лесно се преземаат во графички пакети со користење на веб-адреси:

  • За PDB формат на податотеки се користи, на пример, http://www.pdb.org/pdb/files/4hhb.pdb.gz или http://pdbe.org/download/4hhb
  • За PDBML (XML) податотеки се користи, на пример, http://www.pdb.org/pdb/files/4hhb.xml.gz или http://pdbe.org/pdbml/4hhb

„4hhb“ е PDB назнака. Секоја структура објавена во PDB добива азбучнобројчена назнака со четири знаци, нејзината PDB ID. (Ова не може да се користи како назнака за биомолекули, бидејќи честопати неколку структури за истата молекула - во различни средини или конформации - се содржани во PDB со различни PDB IDs.)

Прикажување на податоците

уреди

Структурните податотеки може да се гледаат со користење на еден од неколкуте бесплатни и со отворен код компјутерски програми, вклучувајќи ги Jmol, Pymol, Visual molecular dynamics (VMD) и RasMol. Други неслободни шервер програми вклучуваат ICM-прелистувач,[20] MDL Chime, UCSF Chimera, Swiss-PDB Viewer,[21] StarBiochem[22] (интерактивен молекуларен прегледник заснован на Java со интегрирано пребарување на основа на податоци за белковини), Sirius visualization software и VisProt3DS (алатка за визуелизација на белковини во 3D стереоскопски преглед во анаглит и други режими) и Discovery Studio. Мрежната страница RCSB PDB содржи опсежна список на бесплатни и комерцијални програми за визуелизација на молекули и приклучоци за прелистувач.

Поврзано

уреди

Наводи

уреди
  1. 1,0 1,1 EMBL-EBI. „PDBe home < Node < EMBL-EBI“. www.pdbe.org.
  2. 2,0 2,1 „Protein Data Bank Japan - PDB Japan - PDBj“. www.pdbj.org.
  3. Bank, RCSB Protein Data. „RCSB PDB: Homepage“. www.rcsb.org.
  4. Berman, H. M. (January 2008). „The Protein Data Bank: a historical perspective“ (PDF). Acta Crystallographica Section A. A64 (1): 88–95. doi:10.1107/S0108767307035623. PMID 18156675.
  5. „PDBsum: a Web-based database of summaries and analyses of all PDB structures“. Trends Biochem. Sci. 22 (12): 488–90. December 1997. doi:10.1016/S0968-0004(97)01140-7. PMID 9433130.
  6. Meyer EF (1997). „The first years of the Protein Data Bank“. Protein Science. Cambridge University Press. 6 (7): 1591–1597. doi:10.1002/pro.5560060724. PMC 2143743. PMID 9232661.
  7. „Protein Data Bank“. Nature New Biology. 1971. doi:10.1038/newbio233223b0.
  8. Berman, H. M.; Westbrook, J.; Feng, Z.; Gilliland, G.; Bhat, T. N.; Weissig, H.; Shindyalov, I. N.; Bourne, P. E. (2000-01-01). „The Protein Data Bank“. Nucleic Acids Research. 28 (1): 235–242. ISSN 0305-1048. PMID 10592235.
  9. Bank, RCSB Protein Data. „RCSB PDB: RCSB PDB Newsletter Archive“. www.rcsb.org (англиски). Посетено на 2018-11-13.
  10. „BMRB - Biological Magnetic Resonance Bank“. www.bmrb.wisc.edu (англиски). Посетено на 2018-11-13.
  11. Wood, David (2010-11-10). Linking Enterprise Data (англиски). Springer Science & Business Media. ISBN 9781441976659.
  12. „PDB Validation Suite“. sw-tools.rcsb.org. Посетено на 2018-11-13.
  13. „PDB Current Holdings Breakdown“. RCSB. Архивирано од изворникот на 2007-07-04. Посетено на 2018-11-13.
  14. „The Uppsala Electron Density Server“. Uppsala University. Архивирано од изворникот на 2021-03-21. Посетено на 2013-04-06.
  15. „The Uppsala Electron-Density Server“. Acta Crystallogr D. 60 (Pt 12 Pt 1): 2240–2249. Dec 2004. doi:10.1107/S0907444904013253. PMID 15572777.
  16. Anon (2014). „Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures“. Nature. 509 (7500): 260. doi:10.1038/509260a. PMID 24834514.
  17. „Content Growth Report“. RCSB PDB. Архивирано од изворникот на 2007-04-28. Посетено на 2013-04-06.
  18. wwPDB.org. „wwPDB: 2013 News“. www.wwpdb.org (англиски). Посетено на 2018-11-13.
  19. Westbrook, John; Ito, Nobutoshi; Nakamura, Haruki; Henrick, Kim; Berman, Helen M. (2005-04-01). „PDBML: the representation of archival macromolecular structure data in XML“. Bioinformatics (Oxford, England). 21 (7): 988–992. doi:10.1093/bioinformatics/bti082. ISSN 1367-4803. PMID 15509603.
  20. „Molsoft L.L.C.: ICM-Browser“. www.molsoft.com. Посетено на 2018-11-13.
  21. „Swiss PDB Viewer - Home“. spdbv.vital-it.ch. Архивирано од изворникот на 2019-01-18. Посетено на 2018-11-13.
  22. „STAR: Biochem - Home“. star.mit.edu. Посетено на 2018-11-13.

Надворешни врски

уреди