Семантичка пајажина: Разлика помеѓу преработките

[непроверена преработка][непроверена преработка]
Избришана содржина Додадена содржина
Нема опис на уредувањето
Ред 1:
 
 
{{вики}}
{{внимание}}
'''Семантички веб''' ([[англиски јазик|англсики]]: ''Semantic Web'') претставува "веб од податоци" што им овозможува на машините да ја разберат семантиката или значењето на информациите на вебот. Ја проширува мрежата од поврзаните веб страници разбирливи за човекот на тој начин што додава т.н. metadata (податоци за податоците) за страниците и за тоа како се истите се заемно поврзани овозможувајќи им на автоматските агенти да пристапат до вебот на поинтелигентен начин и да извршат некоја задача наместо корисниците. Може да се дефинира како глобално поврзана [[База на податоци|база на податоци]], во која секој може да внесе или да добие каков било тип на податоци.
[[Податотека:ТимБернерсЛи.png|thumb|right|Креаторот на семантичкиот веб- Тим Бернерс-Ли]]
 
Семантичкиот веб претставува визија за информација која е разбирлива за компјутерите, со што тие би го извеле поголемиот дел од работата потребна за барање, споделување и комбинирање на информациите на Вебот. Иако компјутерите се најважни за функционирањето како и за креирањето и одржувањето на вебот, тие самите не можат да најдат некаква смисла во сите тие информации. Тие не можат да ги прочитаат информациите, да најдат некаква релација или да донесат некакви одлуки врз основа на тие информации, како што може човекот. Семантичкиот веб е екстензија на [[World Wide Web]], во која се дефинираат семантиката на информацијата и сервисите на вебот, со што се овозможува вебот да ги разбере и задоволи барањата на корисниците, како и машините да ја користат Веб содржината. Обезбедува стандардизиран начин во изразувањето на релациите помеѓу веб страниците, дозволувајќи им на машините да го разберат значењето на хиперлинковите.
 
Терминот бил измислен од [[Тим Бернерс – Ли]], инвентороткреатор на вебот и директорот на [[W3C|World Wide Web Consortium ("W3C")]], кој го контролира развојот на стандардите на семантичкиот веб. Тој го дефинира семантичкиот веб како веб од податоци што може да бидат процесирани директно или индиректно од машините.
 
Терминот ''Семантички веб'' почесто се однесува на неговите формати и технологии. Овие технологии го вклучуваат [[RDF|Resource Description Framework (RDF)]], голем број на податочни формати за разменување (пример [[RDF/XML]], N3, Turtle, N-Triples) и нотации како [[RDFS|RDF шемата (RDFS)]] и [[OWL|Web Ontology Language (OWL)]], сите со намера да овозможат формален опис на концептите, терминологијата и врските во границите на даден домен.
 
Многу од технологиите предложени од [[W3C]] веќе постојат и се користат во различен контекст, особено оние кои се справуваат со информација што опфаќа ограничен и дефиниран домен, и каде делењето податоци е неопходно, како што се научните истражувања или разменувањето на податоци помеѓу различните бизниси. Дополнително се појавија и други технологии со слични цели како што се микроформатите. Како и да е Семантичкиот Веб како што и е беше оригинално предвидено, е систем што им овозможува на машините да сфатат и одговорат на комплексните барања на човекот врз база на нивното значење и останаа нереализирани во голема мера оставајќи им на критичарите да се сомневаат во нивната брза реализација.
 
==Семантика==
Ред 23 ⟶ 24:
==WWW наспроти Семантички веб==
Пребарувањето на информација со некое позадинско знаење , на пример на ваков начин: “животни кои користат сонар, но не се ни лилјаци ни делфини” е невозможно со сегашниот веб.
[[World Wide Web]] е главно базиран на документи напишани во [[HTML]]. Семантичкиот веб ги објавува податоците во јазик [[RDF]], така што со нив може да се манипулира слично како и со податочните датотеки во локалниот компјутер. [[HTML|HTML-от]] ги опишува документите и врските измеѓу нив. За разлика од него, [[RDF]] опишува произволни објекти како луѓе, средби или делови од авион. На пример со [[HTMHTML]]L и алатка за рендерирање на [[HTML]], може да креираме и презентираме страница која листа производи за продажба. [[HTML|HTML-от]] на оваа страница може да даде едноставни тврдења, на ниво на документи, како: “насловот на документот е ‘Продажба на алат’ ”. Но во рамките на [[HTML]] нема можност недвосмислено да потврди дека на пример, предметот со број X586172 е бурмашинабoрмашина со цена од 200 евра, или дека е продукт за продажба. Наспроти , [[HTML]] може само да потврди дека [[span]] со текст “X586172” е нешто што би требало да се позиционира блиску до “бурмашина”“бoрмашина” и “200 евра”. Не постои начин да покаже дека се работи за каталог на производи или дека “бурмашина”“бoрмашина” е алат или “200 евра” е цена. Исто така не постои начин да се изрази дека овие информации заедно опишуваат еден дискретен поим, различен од останатите кои се постојат на страницата.
Семантичкиот веб ги надминува овие пропусти, користејќи описни технологии како [[RDF]] и [[OWL]], флексибилниот [[XML]]. Овие технологии се комбинирани со цел да овозможат описи кои ја дополнуваат или заменуваат содржината на Веб документите. Така содржината може да биде претставена во вид на описни податоци зачувани во веб-достапни бази на податоци, или како [[markup]] во рамките на документите. Описите кои се читливи за машините овозможуваат менаџерите на содржинидевелоперите да додаваат значење на содржината, т.е. да ја опишат структурата на знаењето која ја имаме за таа содржина. На овој начин, машините може самостојно да процесираат знаење, наместо обичен код, користејќи процеси слични на човековото дедуктивно резонирање, со што се стекнуваме со позначајни резултати и се овозможува автоматизирано збирање и пребарување на информациите кај компјутерите.
 
==Компоненти на семантичкиот веб==
[[Податотека:магацин.png|thumb|right|Архитектура на Семантичкиот веб]]
Најјасно да се разбере од кои компоненти се состои семантичкиот веб, прикажана е пирамида која се состои од блокови. Секој од блоковите претставува еден од слоевите од кои се состои семантичкиот веб. Треба да се напомене дека овој магацин ќе се менува и развива како што се менува и развива и самиот семантички веб.
Архитектурата на Семантичкиот веб дава хиерархија на јазици, во облик на магацин, каде секој слој ги користи способностите на слоевите под него. Овој магацин покажува како технологиите кои се стандардизирани за Семантичкиот веб се организирани за да може тој да финкционира. Оваа илустрација е креирана од Тим Бернерс Ли. Треба да се напомене дека овој магацин ќе се менува и развива како што се менува и развива и самиот семантички веб.
Низ пример најдобро ќе ги објасниме штоповажните значат секој од деловитеделови од кои е изграден семантичкиот веб. Да претпоставиме дека сакаме следнава реченица да биде разбирлива за копмјутероткомпјутерот:
Анакин Скајвокер е татко на Лук Скајвокер.
За нас е многу лесно да заклучиме што значи прва реченица т.е. што некој сакал да каже со оваа реченица. Анакин и Лук се човешки суштества и има некаква врска помеѓу нив. Ние знаеме дека „татко“ е вид на родител и истата реченица исто така значи дека Лук му е син на Анакин, но компјутерот не може да разбере ништо од тоа без некаква помош. За да му се овозможи на компјутерот да разбере што значи таа реченица ќе треба да додадеме некои информации кои што ќе опишуваат кои се Анакин и Лук и кој е нивниот однос (релација). Тие дополнителни информации треба да можат да бидат прочитани од страна на компјутерот. За тоа се користат следниве две алатки : [[XML]] и [[RDF|RDF (Resource Description Framework)]].
[[XML]] е јазик за означување исто како и [[HTML]]. [[RDF]] го прави тоа што го иницира и неговото име т.е. преку користење на XML тагови, обезбедува модел (рамка) за да ги опише ресурсите. Од гледна точка на RDF, речиси се во светот претставува ресурс. Овој модел ги спојува ресурсите со конкретен предмет или локација на веб така што компјутерот знае што претставува изворот. Јасно е дека со идентификување на ресурсите, компјутерот нема да направи грешка помеѓу [[Анакин Скајвокер]] и [[Себастијан Шај]] или [[Хајден Кристијансен]].
За да го направи ова, [[RDF]] користи тројки (triples) напишани како [[XML]] тагови за да ја претстави оваа информација како [[граф]]. Овие тројки се состојат од предмет, својство и објект кои соодвестуваат на подмет, прирок и предмет во реченицата. Во овој пример, компјутерот знае дека има два ентитети во реченицата и дека постои некаква релација помеѓу нив, но не знае што се ентитетите и како се тие поврзани помеѓу себе.
Дури и со моделот кој што го обезбедуваат [[XML]] и [[RDF]], на компјутерот сеуште му е потребен многу директен и конкретен начин на разбирање на тоа кои или што се овие ресурси. За да го направи тоа, [[RDF]] користи униформен идентификатор на ресурси [[URI]] за да го упати компјутерот кон документ или објект кој што претставува ресурс. Најпозната форма на [[URI]] e униформниот локатор на ресурси [[URL]]. [[URI]] може да покажува на било што на вебот и исто така може да покажува кон објекти кои што не се дел од вебот. За нашиот пример ќе ги користиме официјалните веб страници за карактерите од триологијата “[[Војна на ѕвездите]]” како [[URI]] покажувачи:
Субјект(Anakin Skywalker) http://www.starwars.com/databank/character/anakinskywalker/index.html/
Својство (е татко на) http://howstuffworks.com/example/RDF/relationship#fatherof
Објект (Luke Skywalker) http://www.starwars.com/databank/character/lukeskywalker/index.html/
Компјутерот сега знае што се субјектот и објектот т.е. Анакин Скајвокер е ентитетот претставен со првото [[URI]] и [[Лук Скајвокер]] е ентитетот претставен со третото [[URI]] . [[URI|URI-то]] кое што се наоѓа во средината на тројката (својството) не покажува кон страната на “[[Војна на ѕвездите]]” т.е. покажува кон некој трет документ (страница) во кој што е опишано својството помеѓу тие два ентитета. Доколку третиот документ (страница) навистина постои, тој ќе биде [[XML]] именски простор. [[XML]] и [[RDF]] се “официјалните јазици” на семантичкиот веб, но самите по себе не се доволни за да го направат целиот веб достапен за компјутерите.
Друга пречка за семантичкиот веб е тоа што компјутерите немаат таков вокабулар како и луѓето. За да може да го разбере значењето и поврзаноста помеѓу зборовите, компјутерот мора да има некакви документи (описи) кои што ќе ги опишуваат сите зборови и целата логика за да може да ги направи потребните поврзувања.
Има две меѓусебно поврзани алатки кои му помагаат на компјутерот да го разбере човековиот јазик. Онтологијата е вид на речник кој што ги опишува објектите и нивната меѓусебна поврзаност. Шемата претставува метод за организирање на информациите (податоците). Референцирањето на онтологиите и шемата се врши од страна на креаторот на документот (ресурсот) со користење на мета податоци.
Ред 43 ⟶ 45:
[[OWL]] (Ontology Web Language) e најсложениот слој. Служи за формализација на онтологиите, ги опишува релациите (врските) помеѓу класите и користи логика за да донесе заклучоци. Може да конструира и нови класи базирани на веќе постоечките информации.
Проблемот со онтологиите е тоа што тие се многу тешки за креирање, имплементирање и оддржување. Зависно од нивниот поглед, тие можат да бидат огромни, дефинирајќи широк опсег на концепти и релации. Некои девелопери претпочитаат повеќе да се фокусираат на логика и правила отколку на онтологии токму поради овие тешкотии.
Една од целите на семантичкиот веб е да им дозволи на агентите, софтверските апликации и на веб апликациите да пристапат и да ги користат мета податоците. Клучната алатка која што е потребна за да се постигне ова е [[SPARQL|SPARQL – Simple Protocol and RDF Query Language]], јазик кој што сеуште е во фаза на развивањеразвој. Целта на [[SPARQL]] е да ги извади податоците од [[RDF]] графовите. Тој може да бара податоци, да ги ограничи и подреди резултатите. Една од предностите на [[RDF]] структурата е тоа што овие прашања можат да бидат многу точни и можат да дадат многу прецизни резултати.
 
== URI - Униформен Идентификатор на Ресурси==
URI – Uniform resource identifier претставува низа од карактери користена да идентификува ресурс на [[Интернет]]. Таквата идентификација овозможува интеракција во презентирањето на еден ресурс над некоја мрежа (обично [[World Wide Web|WWW]]) користејќи специфични протоколи. URI може да биде класифициран како локатор [[URL|(URL)]], како име [[URN|(URN)]], или комбинација од двете. Со други зборови: [[URN]] го дефинира идентитетот на еден ресурс, додека [[URL]] овозможува метод за негово пронаоѓање.
Може да дадеме URI на било што, и секој ресурс што има URI може да се смета дека е дел од Вебот. Претставува основа на Вебот. Било кој друг дел може да биде заменет, освен URI-то : овој идентификатор го оддржува остатокот од Вебот заедно. Вебот е преголем за да може да се контролира од било која организација, затоа URI-ата се децентрализирани. Секој може да креира URI, па дури и за работи кои не ги поседувамепоседува. Оваа флексибилност од една страна го прави овој метод моќен, но истовремено создава извесни проблеми. Голема е веројатноста еден ресурс да биде повеќе пати идентификуван со различни URI-а. Уште полошо никогаш не може да дознаеме дали две URI-a се однесуваат на истиот ресурс. Но сите овие отстапки мора да бидат направени, за да може да се креира нешто толку големо како Семантичкиот Веб.
Во основа претставува име за некој ресурс. URI не претставува множество од правила кои му кажуваат на компјутерот како да пристапи да извесна датотека на Веб (иако може да го прави тоа). Тој ресурс може но и не мора да биде достапен преку Интернет. URI-то може но не мора да му овозможува на компјутерот повеќе информации околу ресурсот. Иако можноста “да се кажуваат некој работи” во однос на ресурсот претставен со извесно URI е битен дел од Семантичкиот Веб, но сепак во својата основа служи за идентификација на еден ресурс.
 
==XML - Проширлив означувачки јазик==
==XML==
XML- Extensible Markup Language е множество на правила користено за енкодирање на документите во форма разбирлива за машините. XML цели кон едноставност, генерализација и корисност низ Интернетот. Стотици [[Програмски јазик|програмски јазици]] се развиени на основа на XML, меѓу кои : [[RSS]], [[Atom]], [[SOAP]] и [[XHTML]]. Претставува тексуален податочен формат со силна поддршка преку Unicode за светските јазици преку Unicode. Дозволува секој да дизајнира свој формат и да напише документ во истиот формат. Овие формати треба да вклучуваат маркерозначувач за да се збогати значењето на содржината на документот. Овој маркер е читлив за машината т.е. програмитеПрограмите може да го прочитаат и разберат истиот.
 
<source lang="html4strict">
<h2>Nonmonotonic Reasoning: ContextDependent Reasoning</h2>
Ред 71 ⟶ 74:
</book>
 
Секој дел од информацијата е опишан. Преку вгнездувањето се дефинираат релациите. Така таговите <author> се појавуваат во рамките на <book> таговите, со што дознаваме дека опишуваат некое својство на некоја книга. Постои еден проблем во овој пристап на XML. Зборовите кои ги користиме во таговите може да се прилично чести ( како во нашиот пример со книга, автор, година) . Така и други корисници може да ги употребат истите зборови во нивниот XML, па дури и да им дадат поинакво значење ( пр. година на издаваштво и година на раѓање ). Заради тоа се користат [[Именски простор|XML именски простори (namespaces)]]. Со нив на секој елемент или атрибут користен, се доделува соодветен URI. На овој начин, секој може да креира свои тагови и да ги комбинира со тагови создадени од други.
 
==RDF - Рамка за опишување на ресурси==
==RDF==
RDF- претставува формат за дефинирање на информациите на веб. Маркирачки јазик за опишуваењопишување на информациите и ресурсите на веб. Со внесувањето на информации во RDF датотеки, се овозмоѓуваовозможува на компјутерите да пребаруваат, откриваат, земаат, анализираат и процесираат информации од вебот. Семантичкиот веб го користи RDF за да ги опише веб ресурсите. RDF обезбедува модел за податоци, и синтакса која може да биде разменувана и користена од различни страни. Дизајниран да биде разбирлив и читлив одза компјутерите, а не за луѓето. RDF исказот е доста сличен со обична проста реченица, со тоа што скоро сите зборови во неа се URIа. Секој RDF изказ има три дела : субјект, предикат и објект. Да погледнеме едноставен RDF исказ:
 
<http://aaronaron.com/>
<http://love.example.org/terms/reallyLikesнавистинаСака>
<http://www.w3.org/People/Berners-Lee/Weaving/>
 
Првото URI претставува субјект. Во овој исказ тоа е arronАрон. Второто URI претставува предикат. Го поврзува субјектот со објектот. Во овој пример предикатот е “reallyLikes”“навистинаСака”. Третото URI е објектот. Тука објект е книгата на [[Тим Бернерс Ли]] “Weaving the Web”. Со тоа овој исказ ни кажува дека aaronАрон навистина ја сака книгата “Weaving the Web”.
Кога информацијата е во дадениот формат, лесно е истата да се процесира, затоа што RDF e генерички формат, кој веќе содржи многу парсери. Горниот пример е напишан во [[N-Triples]], јазик кој дозволува да напишете едноставни RDF искази. Официјалната RDF спецификација дефинира XML репрезентација на RDF, што е малку покомплицирана , но ја кажува истата работа:
 
<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#">
Ред 101 ⟶ 104:
 
==RDF шема==
RDF информациите се чуваат во [[База на податоци|бази на податоци]]. Шема претставува документ или парче код кој контролира множество термини во друг документ или парче код. Преку шеми и онтологии се врши опис на значењето и релациите помеѓу термините. RDF шемата е дизајнирана за да обезбеди едноставен datatyping модел за RDF. Со користење на шемата, можеме да кажеме дека на пример “Рекс” е вид на “Куче”, и дека “Куче” е подкласа на “Животно”. Служи за креирање на својства и класи, како и опсези и домени за својствата. Постојат три концепти кои треба да ги познаваме “Resource”==Resource== (rdfs:Resource), “Class”==Class== (rdfr:Class) и “Property”==Property== (rdfr:Property). Сите овие се “класи”, односно терминитеTермините може да припаѓаат на овие три класи. На пример, сите термини во RDF се типови на ресурси. За да декларираме дека нешто е “тип” на нешто друго, го користиме rdf:type својството, така на пример:
 
Rdfs:Resource rdf:type rdfs:Class.
Ред 108 ⟶ 111:
rdf:type rdf:type rdf:Property .
 
ова кажува дека “Ресурсот“==Ресурсот== е вид на класа, ==класата== е вид на класа, ==својството== е вид на класа, и ==вид== е вид на својство”.
RDF шемата нуди низа други својства кои може да се користат како rdfs:subClassOF или rdfs:subPropertyOf. Овие дозволуваат да кажеме дека една класа или својство е подкласа или подсвојство на друга.
Други корисни концепти кои вреди да се напоменат се опсег и домен. Тие ни дозволуваат да дефинираме во кои класи припаѓаат субјектот и објектот на секое својство. rfds:domain кажува во која класа припаѓа субјектот, a rdfs:range ја дефинира класата на припадност на објектот.
Шемата обезбедува брзо градење на бази на знаења во RDF.
 
==Дополнителни линкови==
*[http://www.w3.org/2001/sw/SW-FAQ#whatarebuildingblocks]
*[http://logicerror.com/semanticWeb-long]
*[http://semanticweb.org/wiki/Main_Page]
*[http://www.w3schools.com/semweb/default.asp]
 
== Наводи ==