Семантичка пајажина: Разлика помеѓу преработките

[проверена преработка][проверена преработка]
Избришана содржина Додадена содржина
embed {{Нормативна контрола}} with wikidata information
с правописна исправка, replaced: сеуште → сè уште (2) using AWB
Ред 1:
{{вики}}
{{внимание}}
'''Семантичка пајажина''' ([[англиски јазик|англиски]]: ''Semantic Web'') претставува "пајажина од податоци" што им овозможува на машините да ја разберат семантиката или значењето на информациите на пајажината. Ја проширува мрежата од поврзаните мрежни страници разбирливи за човекот на тој начин што додава т.н. [[метаподатоци]] (податоци за податоците) за страниците и за тоа како истите се заемно поврзани овозможувајќи им на автоматските агенти да пристапат до пајажината на поинтелигентен начин и да извршат некоја задача наместо корисниците. Може да се дефинира како глобално поврзана [[База на податоци|база на податоци]], во која секој може да внесе или да добие каков било тип на податоци.
 
Семантичката пајажина претставува визија за информација која е разбирлива за сметачите, со што тие би го извеле поголемиот дел од работата потребна за барање, споделување и комбинирање на информациите на Пајажината. Иако сметачите се најважни за функционирањето како и за креирањето и одржувањето на пајажината, тие самите не можат да најдат некаква смисла во сите тие информации. Тие не можат да ги прочитаат информациите, да најдат некаква релација или да донесат некакви одлуки врз основа на тие информации, како што може човекот. Семантичката пајажина е додаток на [[Светска пајажина|Светската пајажина]], во која се дефинираат семантиката на информацијата и сервисите на пајажината, со што се овозможува пајажината да ги разбере и задоволи барањата на корисниците, како и машините да ја користат Пајажина содржината. Обезбедува стандардизиран начин во изразувањето на релациите помеѓу мрежните страници, дозволувајќи им на машините да го разберат значењето на хиперлинковите.
 
Терминот бил измислен од [[Тим Бернерс – Ли]], креатор на пајажината и директорот на [[W3C|World Wide Web Consortium ("W3C")]], кој го контролира развојот на стандардите на семантичката пајажина. Тој го дефинира семантичката пајажина како пајажина од податоци што може да бидат обработени директно или индиректно од машините.
 
Терминот ''Семантичка пајажина'' почесто се однесува на неговите формати и технологии. Овие технологии го вклучуваат [[RDF|Resource Description Framework (RDF)]], голем број на податочни формати за разменување (пример [[RDF/XML]], N3, Turtle, N-Triples) и нотации како [[RDFS|RDF шемата (RDFS)]] и [[OWL|Web Ontology Language (OWL)]], сите со намера да овозможат формален опис на концептите, терминологијата и врските во границите на даден домен.
 
Многу од технологиите предложени од [[W3C]] веќе постојат и се користат во различен контекст, особено оние кои се справуваат со информација што опфаќа ограничен и дефиниран домен, и каде делењето податоци е неопходно, како што се научните истражувања или разменувањето на податоци помеѓу различните бизниси. Како и да е Семантичката пајажина е и изворно предвидено, е систем што им овозможува на машините да сфатат и одговорат на сложените барања на човекот врз основа на нивното значење и останаа нереализирани во голема мера оставајќи им на критичарите да се сомневаат во нивната брза реализација.
 
==Семантика==
[[Семантика|Семантиката]]та е наука за значењето на зборовите. Семантичката пајажина е пајажина кој е способен да ги опише работите на начин кој сметачите може да го разберат. На пример да ги земеме следниве реченици :
 
[[Битлси]] се популарен бенд од [[Ливерпул]].
[[Џон Ленон]] беше член на [[Битлси]].
Песната “[[Hey Jude]]” е снимена од страна на [[Битлси]].
 
Овие реченици се разбирливи за луѓето. Но како да ги разберат сметачите? Речениците се градат со синтаксички правила. Но како може [[Синтакса|синтаксатасинтакса]]та да стане [[Семантика|семантика]]? Токму ова го разгледува семантичката пајажина. Тој ги опишува релациите помеѓу објектите (како: А е дел од Б или А припаѓа во Б ) и својствата на објектите (на пример: големина, тежина, возраст и цена).
 
==WWW наспроти Семантичка пајажина==
Пребарувањето на информација со некое позадинско знаење , на пример на ваков начин: “животни кои користат сонар, но не се ни лилјаци ни делфини” е невозможно со сегашниот пајажина.
[[World Wide Web]] е главно заснован на документи напишани во [[HTML]]. Семантичката пајажина ги објавува податоците во јазик [[RDF]], така што со нив може да се манипулира слично како и со податочните податотеки во локалниот сметач. [[HTML|HTML-от]] ги опишува документите и врските измеѓу нив. За разлика од него, [[RDF]] опишува произволни објекти како луѓе, средби или делови од авион. На пример со [[HTML]] и алатка за рендерирање на [[HTML]], може да креираме и презентираме страница која листа производи за продажба. [[HTML|HTML-от]] на оваа страница може да даде едноставни тврдења на ниво на документи, како: “насловот на документот е ‘Продажба на алат’ ”. Но во рамките на [[HTML]] нема можност недвосмислено да потврди дека на пример, предметот со број X586172 е бoрмашина со цена од 200 евра, или дека е продукт за продажба. Наспроти , [[HTML]] може само да потврди дека [[span]] со текст “X586172” е нешто што би требало да се позиционира блиску до “бoрмашина” и “200 евра”. Не постои начин да покаже дека се работи за каталог на производи или дека “бoрмашина” е алат или “200 евра” е цена. Исто така не постои начин да се изрази дека овие информации заедно опишуваат еден дискретен поим, различен од останатите кои се постојат на страницата.
Семантичката пајажина ги надминува овие пропусти, користејќи описни технологии како [[RDF]] и [[OWL]], флексибилниот [[XML]]. Овие технологии се комбинирани со цел да овозможат описи кои ја дополнуваат или заменуваат содржината на Пајажина документите. Така содржината може да биде претставена во вид на описни податоци зачувани во достапни бази на податоци, или како [[означувачки јазик]] во рамките на документите. Описите кои се читливи за машините овозможуваат програмерите да додаваат значење на содржината, т.е. да ја опишат структурата на знаењето која ја имаме за таа содржина. На овој начин, машините може самостојно да обработуваат знаења, наместо обичен код, користејќи постапки слични на човековото дедуктивно резонирање, со што се стекнуваме со позначајни резултати и се овозможува автоматизирано збирање и пребарување на информациите кај сметачите.
 
==Составни делови на семантичката пајажина==
Ред 33:
[[XML]] е јазик за означување исто како и [[HTML]]. [[RDF]] го прави тоа што го иницира и неговото име т.е. преку користење на XML тагови, обезбедува модел (рамка) за да ги опише ресурсите. Од гледна точка на RDF, речиси се во светот претставува ресурс. Овој модел ги спојува ресурсите со конкретен предмет или локација на пајажина така што сметачот знае што претставува изворот. Јасно е дека со идентификување на ресурсите, сметачот нема да направи грешка помеѓу [[Анакин Скајвокер]] и [[Себастијан Шај]] или [[Хајден Кристијансен]].
За да го направи ова, [[RDF]] користи тројки (triples) напишани како [[XML]] тагови за да ја претстави оваа информација како [[граф]]. Овие тројки се состојат од предмет, својство и објект кои соодвестуваат на подмет, прирок и предмет во реченицата. Во овој пример, сметачот знае дека има два ентитети во реченицата и дека постои некаква релација помеѓу нив, но не знае што се ентитетите и како се тие поврзани помеѓу себе.
Дури и со моделот кој што го обезбедуваат [[XML]] и [[RDF]], на сметачот сеуштесè уште му е потребен многу директен и конкретен начин на разбирање на тоа кои или што се овие ресурси. За да го направи тоа, [[RDF]] користи униформен идентификатор на ресурси [[URI]] за да го упати сметачот кон документ или објект кој што претставува ресурс. Најпозната форма на [[URI]] e униформниот локатор на ресурси [[URL]]. [[URI]] може да покажува на било што на пајажината и исто така може да покажува кон објекти кои што не се дел од пајажината. За нашиот пример ќе ги користиме официјалните страници за карактерите од триологијата “[[Војна на ѕвездите]]” како [[URI]] покажувачи:
Субјект(Anakin Skywalker) http://www.starwars.com/databank/character/anakinskywalker/index.html/
Својство (е татко на) http://howstuffworks.com/example/RDF/relationship#fatherof
Ред 43:
[[OWL]] (Ontology Web Language) e најсложениот слој. Служи за формализација на онтологиите, ги опишува релациите (врските) помеѓу класите и користи логика за да донесе заклучоци. Може да конструира и нови класи засновани на веќе постоечките информации.
Проблемот со онтологиите е тоа што тие се многу тешки за креирање, имплементирање и оддржување. Зависно од нивниот поглед, тие можат да бидат огромни, дефинирајќи широк опсег на концепти и релации. Некои девелопери претпочитаат повеќе да се фокусираат на логика и правила отколку на онтологии токму поради овие тешкотии.
Една од целите на семантичката пајажина е да им дозволи на агентите, програмската опрема и на пајажина програмие да пристапат и да ги користат метаподатоците. Клучната алатка која што е потребна за да се постигне ова е [[SPARQL|SPARQL – Simple Protocol and RDF Query Language]], јазик кој што сеуштесè уште е во фаза на развој. Целта на [[SPARQL]] е да ги извади податоците од [[RDF]] графовите. Тој може да бара податоци, да ги ограничи и подреди резултатите. Една од предностите на [[RDF]] структурата е тоа што овие прашања можат да бидат многу точни и можат да дадат многу прецизни резултати.
 
== URI==
Ред 51:
 
==XML - Проширлив означувачки јазик==
XML- Extensible Markup Language е множество на правила користено за енкодирање на документите во форма разбирлива за машините. XML цели кон едноставност, генерализација и корисност низ семрежјето. Стотици [[Програмски јазик|програмски јазици]] се развиени на основа на XML, меѓу кои : [[RSS]], [[Atom]], [[SOAP]] и [[XHTML]]. Претставува тексуален податочен формат со силна поддршка за светските јазици преку Unicode. Дозволува секој да дизајнира свој формат и да напише документ во истиот формат. Овие формати треба да вклучуваат означувач за да се збогати значењето на содржината на документот. Програмите може да го прочитаат и разберат истиот.
 
<source lang="html4strict">
Ред 75:
 
==RDF - Рамка за опишување на ресурси==
RDF- претставува формат за дефинирање на информациите на пајажина. [[Означувачки јазик]] за опишување на информациите и ресурсите на пајажина. Со внесувањето на информации во RDF податотеки, се овозможува на сметачите да пребаруваат, откриваат, земаат, анализираат и обработуваат информации од пајажината. Семантичката пајажина го користи RDF за да ги опише пајажина ресурсите. RDF обезбедува модел за податоци, и синтакса која може да биде разменувана и користена од различни страни. Дизајниран да биде разбирлив и читлив за сметачите, а не за луѓето. RDF исказот е доста сличен со обична проста реченица, со тоа што скоро сите зборови во неа се URIа. Секој RDF изказ има три дела : субјект, предикат и објект. Да погледнеме едноставен RDF исказ:
 
<http://aron.com/>
Ред 93:
</rdf:RDF>
 
Овој RDF ни кажува дека некој натпис има наслов “The Semantic Web: An introduction” и истиот е напишан од некој човек со име “Sean B. Palmer”. Овој RDF ги продуцира следниве тројки:
 
<> <http://purl.org/dc/elements/1.1/creator> _:x0 .
Ред 112:
RDF шемата нуди низа други својства кои може да се користат како rdfs:subClassOF или rdfs:subPropertyOf. Овие дозволуваат да кажеме дека една класа или својство е подкласа или подсвојство на друга.
Други корисни концепти кои вреди да се напоменат се опсег и домен. Тие ни дозволуваат да дефинираме во кои класи припаѓаат субјектот и објектот на секое својство. rfds:domain кажува во која класа припаѓа субјектот, a rdfs:range ја дефинира класата на припадност на објектот.
Шемата обезбедува брзо градење на бази на знаења во RDF.
 
== Надворешни врски ==
{{рв|Semantic Web}}
* [http://semanticweb.org/ Домашна страница на семантичката пајажина] {{en}}
 
 
{{ISO стандарди}}
Ред 125 ⟶ 124:
 
{{Нормативна контрола}}
 
[[Категорија:Семрежни услуги]]
[[Категорија:Семантичка пајажина| ]]