Xena е софтвер со отворен извор за употреба во дигитално зачувување. Xena е кратенка за електронско нормализирање на XML за архиви.

Xena е Java апликација која е развиена од Националниот архив на Австралија. Таа е достапна бесплатно според општата јавна лиценца на ГНУ.

Верзијата 6.1.0 е објавена на 31 јули 2013 година. Изворниот код и бинарните податоци за Linux, OS X и Windows се достапни од SourceForge. Сепак, од 2018 година, тој повеќе не се одржува или поддржува.

Начин на работа

уреди

Xena служи за избегнување дигитално застарување преку претворање на податотеки во отворено наведен формат, како што се ODF или PNG. Ако форматот на податотеката не е поддржан или е избрана опцијата за бинарно нормализирање, Xena ќе изврши кодирање ASCII Base64 на бинарни податотеки и ќе го завитка излезот во XML метаподатоци. Добиената податотека.xena е обичен текст, иако содржината на самите податоци не е читлива директно од човек. Точната оригинална податотека може да се добие со прераоботка на метаподатоците и одкодирање на Base64 енкрипцијата, користејќи внатрешен прегледувач.

Одлики

уреди

Платформите поддржани од Xena се Microsoft Windows, Linux и Mac OS X.

Xena користи серија додатоци за да ги идентификува форматите на податотеки и да ги претвори во соодветен отворено специфициран формат.

Xena има интерфејс за програмирање апликации што му овозможува на секој разумно квалификуван Java девелопер да развие приклучок (plugin) за да покрие нов тип на податотека.

Xena може да обработува одделни податотеки или цели директориуми. Кога обработувате цел директориум, тој може да ја зачува оригиналната структура на директориумот на претворените записи.

Xena може да создава верзии на обичен текст од формати на податотеки како што се TIFF, Word и PDF, со употреба на Tesseract (софтвер).

Интерфејсот Xena или Xena Viewer може да се користат за прегледување или експортирање на Xena-податотека (наставка.xena) во целниот формат на податотека. Овие податотеки ја содржат нормализираната податотека, како и сите дополнителни информации релевантни за процесот на нормализација. Xena Viewer поддржува најголем експорт на Xena податотеки во одредени формати на податотеки.

Xena може да се користи преку неговиот графички кориснички интерфејс или командната линија.

За Xena да биде целосно функционален, потребна е локална инсталација на следниот надворешен софтвер:

  • Пакет LibreOffice - за претворање на Office документи во формат OpenDocument
  • Tesseract - за создавање верзии на обичен текст од други формати на податотеки
  • ImageMagick - за претворање на подмножество на податотеки со слики во PNG
  • Readpst - за претворање PST-податотеки на Microsoft Outlook во XML. Readpst е дел од open-source libpst софтвер пакетот.
  • FLAC - за претворање на аудио податотеки во FLAC формат. Ова е исто така потребно за репродукција на аудио податотеки со употреба на Xena.

Поддржани типови на податотеки

уреди

Xena може да ги препознае и обработи типовите на податотеки наведени подолу, плус неколку други помалку битни. Неподдржаните типови на податотеки автоматски ќе претрпат бинарна нормализација.

Формати на Office податотеки:

  • Податотеките на Microsoft Office (вклучително и MS Office XML, табеларни пресметки SYLK и Rich Text формат) се претвораат во соодветните податотеки OpenDocument
  • Microsoft Outlook PST- податотеките се парсираат за нивните поединечни пораки, кои се претвораат во XML-податотеки и се создава податотека со индекс Xena
  • Податотеките MPP на Microsoft Project се претвораат во XML
  • XML- податотеките на OpenOffice.org (SXC, SXI, SXW) се претвораат во соодветните формати на OpenDocument
  • Податотеките WordPerfect WPD се претвораат во OpenDocument ODT
  • Документите на OpenDocument (ODT, ODS, ODB, ODP) се зачувани непроменети
  • PDF-податотеките Acrobat се зачувуваат како бинарни
  • Mailbox податотеките (MBX) се претвораат во поединечни XML-податотеки

Графика:

  • BMP, GIF, PSD, PCX, RAS и X Window System XBM и XPM битмапа-податотеките се претвораат во PNG; TIFF- податотеките дополнително добиваат вградени метаподатоци зачувани во Xena XML. Ако е инсталиран софтверот Tesseract OCR, текстот ќе се извлече од податотеките TIFF.
  • Цртежите на OpenDocument (ODG) и SVG- податотеките се завиткани во Xena XML
  • Податотеките JPG и PNG се чуваат непроменети

Архива на податотеки:

  • Податотеките се извлекуваат од архивите (ZIP, GZIP, TAR / TAR.gz, JAR, WAR, Mac binary) и се нормализираат во посебна Xena-податотека. Се создава податотека со индекс Xena, која кога ќе се отвори во внатрешниот прегледувач на Xena, ќе ги прикаже податотеките во табела.

Аудио-податотеки:

  • Форматите MP3, WAV, AIFF и OGG се претвораат во FLAC- податотеки.

Бази на податоци:

  • SQL- податотеките се обработуваат како обичен текст завиткан во XML

Други типови на податотеки:

  • HTML е претворен во XHTML
  • Текстуалните податотеки TXT се зачувуваат како обичен текст завиткан во XML; CSS-податотеките се зачувуваат како обичен текст завиткан во XML

Осврти

уреди

Прегледот на 22 април 2010 година во Практични е-записи ја оцени Ксена на 82/100 бода. Во моментов Xena нема формат за зачувување на видео податотеките.[1]

Наводи

уреди
  1. „Review of XENA Normalization Software“. 2010-04-22. Архивирано од изворникот на 2012-07-08.

Надворешни врски

уреди