Семантичка пајажина: Разлика помеѓу преработките
[непроверена преработка] | [непроверена преработка] |
Избришана содржина Додадена содржина
Нема опис на уредувањето |
|||
Ред 1:
{{вики}}
{{внимание}}
'''Семантички веб''' ([[англиски јазик|англсики]]: ''Semantic Web'') претставува "веб од податоци" што им овозможува на машините да ја разберат семантиката или значењето на информациите на вебот. Ја проширува мрежата од поврзаните веб страници разбирливи за човекот на тој начин што додава т.н. metadata (податоци за податоците) за страниците и за тоа како
[[Податотека:ТимБернерсЛи.png|thumb|right|Креаторот на семантичкиот веб- Тим Бернерс-Ли]]
Семантичкиот веб претставува визија за информација која е разбирлива за компјутерите, со што тие би го извеле поголемиот дел од работата потребна за барање, споделување и комбинирање на информациите на Вебот. Иако компјутерите се најважни за функционирањето како и за креирањето и одржувањето на вебот, тие самите не можат да најдат некаква смисла во сите тие информации. Тие не можат да ги прочитаат информациите, да најдат некаква релација или да донесат некакви одлуки врз основа на тие информации, како што може човекот. Семантичкиот веб е екстензија на [[World Wide Web]], во која се дефинираат семантиката на информацијата и сервисите на вебот, со што се овозможува вебот да ги разбере и задоволи барањата на корисниците, како и машините да ја користат Веб содржината. Обезбедува стандардизиран начин во изразувањето на релациите помеѓу веб страниците, дозволувајќи им на машините да го разберат значењето на хиперлинковите.
Терминот бил измислен од [[Тим Бернерс – Ли]],
Терминот ''Семантички веб'' почесто се однесува на неговите формати и технологии. Овие технологии го вклучуваат [[RDF|Resource Description Framework (RDF)]], голем број на податочни формати за разменување (пример [[RDF/XML]], N3, Turtle, N-Triples) и нотации како [[RDFS|RDF шемата (RDFS)]] и [[OWL|Web Ontology Language (OWL)]], сите со намера да овозможат формален опис на концептите, терминологијата и врските во границите на даден домен.
Многу од технологиите предложени од [[W3C]] веќе постојат и се користат во различен контекст, особено оние кои се справуваат со информација што опфаќа ограничен и дефиниран домен, и каде делењето податоци е неопходно, како што се научните истражувања или разменувањето на податоци помеѓу различните бизниси
==Семантика==
Ред 23 ⟶ 24:
==WWW наспроти Семантички веб==
Пребарувањето на информација со некое позадинско знаење , на пример на ваков начин: “животни кои користат сонар, но не се ни лилјаци ни делфини” е невозможно со сегашниот веб.
[[World Wide Web]] е главно базиран на документи напишани во [[HTML]]. Семантичкиот веб ги објавува податоците во јазик [[RDF]], така што со нив може да се манипулира слично како и со податочните датотеки во локалниот компјутер. [[HTML|HTML-от]] ги опишува документите и врските измеѓу нив. За разлика од него, [[RDF]] опишува произволни објекти како луѓе, средби или делови од авион. На пример со [[
Семантичкиот веб ги надминува овие пропусти, користејќи описни технологии како [[RDF]] и [[OWL]], флексибилниот [[XML]]. Овие технологии се комбинирани со цел да овозможат описи кои ја дополнуваат или заменуваат содржината на Веб документите. Така содржината може да биде претставена во вид на описни податоци зачувани во веб-достапни бази на податоци, или како [[markup]] во рамките на документите. Описите кои се читливи за машините овозможуваат
==Компоненти на семантичкиот веб==
[[Податотека:магацин.png|thumb|right|Архитектура на Семантичкиот веб]]
Архитектурата на Семантичкиот веб дава хиерархија на јазици, во облик на магацин, каде секој слој ги користи способностите на слоевите под него. Овој магацин покажува како технологиите кои се стандардизирани за Семантичкиот веб се организирани за да може тој да финкционира. Оваа илустрација е креирана од Тим Бернерс Ли. Треба да се напомене дека овој магацин ќе се менува и развива како што се менува и развива и самиот семантички веб.
Низ пример најдобро ќе ги објасниме
Анакин Скајвокер е татко на Лук Скајвокер.
За нас е многу лесно да заклучиме што значи прва реченица т.е. што некој сакал да каже со оваа реченица. Анакин и Лук се човешки суштества и има некаква врска помеѓу нив. Ние знаеме дека „татко“ е вид на родител и истата реченица исто така значи дека Лук му е син на Анакин, но компјутерот не може да разбере ништо од тоа без некаква помош. За да му се овозможи на компјутерот да разбере што значи таа реченица ќе треба да додадеме некои информации кои што ќе опишуваат кои се Анакин и Лук и кој е нивниот однос (релација). Тие дополнителни информации треба да можат да бидат прочитани од страна на компјутерот. За тоа се користат следниве две алатки : [[XML]] и [[RDF|RDF (Resource Description Framework)]].
[[XML]] е јазик за означување исто како и [[HTML]]. [[RDF]] го прави тоа што го иницира и неговото име т.е. преку користење на XML тагови, обезбедува модел (рамка) за да ги опише ресурсите. Од гледна точка на RDF, речиси се во светот претставува ресурс. Овој модел ги спојува ресурсите со конкретен предмет или локација на веб така што компјутерот знае што претставува изворот. Јасно е дека со идентификување на ресурсите, компјутерот нема да направи грешка помеѓу [[Анакин Скајвокер]] и [[Себастијан Шај]] или [[Хајден Кристијансен]].
За да го направи ова, [[RDF]] користи тројки (triples) напишани како [[XML]] тагови за да ја претстави оваа информација како [[граф]]. Овие тројки се состојат од предмет, својство и објект кои соодвестуваат на подмет, прирок и предмет во реченицата. Во овој пример, компјутерот знае дека има два ентитети во реченицата и дека постои некаква релација помеѓу нив, но не знае што се ентитетите и како се тие поврзани помеѓу себе.
Дури и со моделот кој што го обезбедуваат [[XML]] и [[RDF]], на компјутерот сеуште му е потребен многу директен и конкретен начин на разбирање на тоа кои или што се овие ресурси. За да го направи тоа, [[RDF]] користи униформен идентификатор на ресурси [[URI]] за да го упати компјутерот кон документ или објект кој што претставува ресурс. Најпозната форма на [[URI]] e униформниот локатор на ресурси [[URL]]. [[URI]] може да покажува на било што на вебот и исто така може да покажува кон објекти кои што не се дел од вебот. За нашиот пример ќе ги користиме официјалните веб страници за карактерите од триологијата “[[Војна на ѕвездите]]” како [[URI]] покажувачи:
Субјект(Anakin Skywalker) http://www.starwars.com/databank/character/anakinskywalker/index.html/
Својство (е татко на) http://howstuffworks.com/example/RDF/relationship#fatherof
Објект (Luke Skywalker) http://www.starwars.com/databank/character/lukeskywalker/index.html/
Компјутерот сега знае што се субјектот и објектот т.е. Анакин Скајвокер е ентитетот претставен со првото [[URI]] и [[Лук Скајвокер]] е ентитетот претставен со третото [[URI]] .
Друга пречка за семантичкиот веб е тоа што компјутерите немаат таков вокабулар како и луѓето. За да може да го разбере значењето и поврзаноста помеѓу зборовите, компјутерот мора да има некакви документи (описи) кои што ќе ги опишуваат сите зборови и целата логика за да може да ги направи потребните поврзувања.
Има две меѓусебно поврзани алатки кои му помагаат на компјутерот да го разбере човековиот јазик. Онтологијата е вид на речник кој што ги опишува објектите и нивната меѓусебна поврзаност. Шемата претставува метод за организирање на информациите (податоците). Референцирањето на онтологиите и шемата се врши од страна на креаторот на документот (ресурсот) со користење на мета податоци.
Ред 43 ⟶ 45:
[[OWL]] (Ontology Web Language) e најсложениот слој. Служи за формализација на онтологиите, ги опишува релациите (врските) помеѓу класите и користи логика за да донесе заклучоци. Може да конструира и нови класи базирани на веќе постоечките информации.
Проблемот со онтологиите е тоа што тие се многу тешки за креирање, имплементирање и оддржување. Зависно од нивниот поглед, тие можат да бидат огромни, дефинирајќи широк опсег на концепти и релации. Некои девелопери претпочитаат повеќе да се фокусираат на логика и правила отколку на онтологии токму поради овие тешкотии.
Една од целите на семантичкиот веб е да им дозволи на агентите, софтверските апликации и на веб апликациите да пристапат и да ги користат мета податоците. Клучната алатка која што е потребна за да се постигне ова е [[SPARQL|SPARQL – Simple Protocol and RDF Query Language]], јазик кој што сеуште е во фаза на
== URI - Униформен Идентификатор на Ресурси==
URI – Uniform resource identifier претставува низа од карактери користена да идентификува ресурс на [[Интернет]]. Таквата идентификација овозможува интеракција во презентирањето на еден ресурс над некоја мрежа (обично [[World Wide Web|WWW]]) користејќи специфични протоколи. URI може да биде класифициран како локатор [[URL|(URL)]], како име [[URN|(URN)]], или комбинација од двете. Со други зборови: [[URN]] го дефинира идентитетот на еден ресурс, додека [[URL]] овозможува метод за негово пронаоѓање.
Може да дадеме URI на било што, и секој ресурс што има URI може да се смета дека е дел од Вебот. Претставува основа на Вебот. Било кој друг дел може да биде заменет, освен URI-то : овој идентификатор го оддржува остатокот од Вебот заедно. Вебот е преголем за да може да се контролира од било која организација, затоа URI-ата се децентрализирани. Секој може да креира URI, па дури и за работи кои не ги
Во основа претставува име за некој ресурс. URI не претставува множество од правила кои му кажуваат на компјутерот како да пристапи да извесна датотека на Веб (иако може да го прави тоа). Тој ресурс може но и не мора да биде достапен преку Интернет. URI-то може но не мора да му овозможува на компјутерот повеќе информации околу ресурсот. Иако можноста “да се кажуваат некој работи” во однос на ресурсот претставен со извесно URI е битен дел од Семантичкиот Веб, но сепак во својата основа служи за идентификација на еден ресурс.
==XML - Проширлив означувачки јазик==
XML- Extensible Markup Language е множество на правила користено за енкодирање на документите во форма разбирлива за машините. XML цели кон едноставност, генерализација и корисност низ Интернетот. Стотици [[Програмски јазик|програмски јазици]] се развиени на основа на XML, меѓу кои : [[RSS]], [[Atom]], [[SOAP]] и [[XHTML]]. Претставува тексуален податочен формат со силна поддршка
<source lang="html4strict">
<h2>Nonmonotonic Reasoning: ContextDependent Reasoning</h2>
Ред 71 ⟶ 74:
</book>
Секој дел од информацијата е опишан. Преку вгнездувањето се дефинираат релациите. Така таговите <author> се појавуваат во рамките на <book> таговите, со што дознаваме дека опишуваат некое својство на некоја книга. Постои еден проблем во овој пристап на XML. Зборовите кои ги користиме во таговите може да се прилично чести ( како во нашиот пример со книга, автор, година) . Така и други корисници може да ги употребат истите зборови во нивниот XML, па дури и да им дадат поинакво значење ( пр. година на издаваштво и година на раѓање ). Заради тоа се користат [[Именски простор|XML именски простори (namespaces)]]. Со нив на секој елемент или атрибут користен, се доделува соодветен URI. На овој начин, секој може да креира свои тагови и да ги комбинира со тагови создадени од други.
==RDF - Рамка за опишување на ресурси==
RDF- претставува формат за дефинирање на информациите на веб. Маркирачки јазик за
<http://
<http://love.example.org/terms/
<http://www.w3.org/People/Berners-Lee/Weaving/>
Првото URI претставува субјект. Во овој исказ тоа е
Кога информацијата е во дадениот формат, лесно е истата да се процесира, затоа што RDF e генерички формат, кој веќе содржи многу парсери. Горниот пример е напишан во [[N-Triples]], јазик кој дозволува да напишете едноставни RDF искази. Официјалната RDF спецификација дефинира XML репрезентација на RDF, што е малку покомплицирана , но ја кажува истата работа:
<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#">
Ред 101 ⟶ 104:
==RDF шема==
RDF информациите се чуваат во [[База на податоци|бази на податоци]]. Шема претставува документ или парче код кој контролира множество термини во друг документ или парче код. Преку шеми и онтологии се врши опис на значењето и релациите помеѓу термините. RDF шемата е дизајнирана за да обезбеди едноставен datatyping модел за RDF. Со користење на шемата, можеме да кажеме дека на пример “Рекс” е вид на “Куче”, и дека “Куче” е подкласа на “Животно”. Служи за креирање на својства и класи, како и опсези и домени за својствата. Постојат три концепти кои треба да ги познаваме
Rdfs:Resource rdf:type rdfs:Class.
Ред 108 ⟶ 111:
rdf:type rdf:type rdf:Property .
ова кажува дека
RDF шемата нуди низа други својства кои може да се користат како rdfs:subClassOF или rdfs:subPropertyOf. Овие дозволуваат да кажеме дека една класа или својство е подкласа или подсвојство на друга.
Други корисни концепти кои вреди да се напоменат се опсег и домен. Тие ни дозволуваат да дефинираме во кои класи припаѓаат субјектот и објектот на секое својство. rfds:domain кажува во која класа припаѓа субјектот, a rdfs:range ја дефинира класата на припадност на објектот.
Шемата обезбедува брзо градење на бази на знаења во RDF.
==Дополнителни линкови==
*[http://www.w3.org/2001/sw/SW-FAQ#whatarebuildingblocks]
*[http://logicerror.com/semanticWeb-long]
*[http://semanticweb.org/wiki/Main_Page]
*[http://www.w3schools.com/semweb/default.asp]
== Наводи ==
|