Článek vychází jako součást zkoušky v rámci předmětu „Knihovnické technologie a procesy“. Jeho originál s pravděpodobnými dalšími zásahy komunity lze nalézt na portálu Wikisofie, odkaz je na konci článku.
XML, neboli Extensible Markup Language (česky rozšiřitelný značkovací jazyk) je všeobecný značkovací jazyk, který je standardizován organizací W3C (ta standardizuje například i HTML). XML je primárně určeno pro serializaci dat a jejich výměnu.
XML je tedy možné využívat jako univerzální výměnný formát (jako je například UNIMARC, MARC21 či BIBFRAME).
Je důležité si hned v začátku říci, že XML NENÍ vhodný formát pro ukládání práci s daty přímo v AKS (automatizovaném knihovním systému). XML JE URČEN pro přenos dat mezi informačními systémy.
Aktuální využití v knihovních aplikacích
OAI-PMH
Protokol OAI-PMH je výměnný metadatový systém založený na kombinaci HTML a XML. Jedná se o obecný protokol, formát je navržen tak aby bylo možné jej flexibilně upravovat pro komunitu, která jej využívá. V prostředí českého knihovnictví využívá protokolu OAI například harvester SKČR (Souborný katalog České republiky – Caslin, http://www.caslin.cz/). Dalším nově vzniklým systémem, který využívá protokolu OAI-PMH je Centrální portál knihoven (https://www.knihovny.cz). Oba projekty využívají OAI-PMH ke sběru nových a upravených titulů v partnerských knihovnách, aby bylo možné tituly vystavit na jednotném místě (globálním online katalogu). Protokol jednou za čas zažádá server (knihovnu) o určitý metadatový set (souhrn nový či změněných dat) za určité období, tento set stáhne a vystaví či aktualizuje svůj katalog. OAI-PMH v českých knihovnách slouží ke stahování datových balíků s bibliografickými záznamy. Data pro harvester OAI-PMH jsou vystavována pomocí HTTP protokolu, nejčastěji pomocí katalogů typu OPAC.[4]
Sdílení záznamů IS
Některé moderní AKS (Automatizované knihovní systémy) umí využívat přenosu XML souborů z jiných IS (Informační systémy). Například AKS Tritius v rámci svých RESTových služeb umí stahovat či nabízet studentské práce[5].
Migrace, konverze a přenos dat
Při změně AKS či při konverzi záznamů (např. v roce 2015/2016 docházelo ke konverzím z UNIMARC na MARC21) je vhodné umístit záznamy mimo databázi, kde bude možné s nimi pracovat. Zde se jeví použití XML formátu jako naprosto vhodné. Díky systému a struktuře XML, včetně možnosti zavedení vlastních značek, je možné záznamy uložit mimo databázi AKS, zde je zpracovat přímo v AKS formátu a poté nahrát zpět do databáze.
Dříve se poměrně běžně užíval export knihovních jednotek, které spadali do tzv. výměnných souborů. Export proběhl ve formátu XML do souboru ISO a byl odeslán do jiné knihovny či pobočky mateřské knihovny. Takto fungoval (a na některých místech stále funguje) i systém, kdy ke katalogizaci jednotek docházelo v centrálních (krajských či městských) knihovnách, které distribuovali fyzické knihy i jejich metadatové záznamy do dalších, výrazně menších, knihoven. Jednalo se o spolupráci především mezi velkými profesionálními knihovnami a malými neprofesionálními (často obecními) knihovnami. Díky této spolupráci mohla velká knihovna nabízet ve svém katalogu knihy malé knihovny a malá knihovna nebyla administrativně zatížena katalogizací titulů.
Aplikované XML, projekty
The Washington Research Library Consortium
WRLC využívá XML k zpřístupnění částí svých databází (knihovní katalogy, digitální kolekce dat, atd.) pro komerční i Open Source aplikace a platformy třetích stran. Systém nazvali ALADIN (Access to Library And Database Information Network).
Library of Congress, MARC XML
V roce 2002 zveřejnila Library of Congress specifikace formátu MARC XML[7]. Specifikovány jsou čísti MODS (Metadata Object Description Schema, metadatové popisné údaje), MADS (metadatové autoritní záznamy) a XML DTD (Document Type Definition, definice typu dokumentu – odkaz na konkrétní schéma pro strukturu dat).
The eScholarship initiative v California Digital Library[editovat | editovat zdroj]
California Digital Library využívá XML k ukládání celých knih ve své digitální databázi. Využívají flexibility XML i k tomu, aby si uživatel sám mohl vytvořit preferovaný typ zobrazení záznamu i knihy.
Budoucnost
XML je velice flexibilní formát, díky MARC XML specifikaci, jednoduchosti implementace a šíření dat pomocí protokolu HTTP je dost pravděpodobné, že se formát rozšíří hlavně jako zdroj dávkových dat (plánovaný/pravidelný sběr většího množství dat). Díky možnostem komprese a On Demand (na vyžádání) systémům je možné, že XML či MARC XML vstoupí i do protokolů pro okamžitou výměnu dat (kooperace při katalogizaci, sdílená katalogizace bibliografických a autoritních záznamů). Došlo by tak k nahrazení protokolu Z39.50 a jemu podobných.
Wikisofia publikace: https://wikisofia.cz/wiki/Vyu%C5%BEit%C3%AD_form%C3%A1tu_XML_v_knihovnick%C3%BDch_aplikac%C3%ADch.
Zdroje:
- PŘISPĚVATELÉ, Wikipedie. Extensible Markup Language. Wikipedie: Otevřená encyklopedie, 2016. Dostupné také z: https://cs.wikipedia.org/wiki/Extensible_Markup_Language
- HANOUSEK, Tomáš. OAI-PMH pro začátečníky: Příloha č. 4 k výzkumné zprávě projektu VE20072009004. Národní archiv České Republiky, 21 s.
- THE, Library of Congress. Sample OAI-PMH requests: Sample Requests Using the Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH v 2.0). The Library of Congress. Dostupné také z: https://memory.loc.gov/ammem/oamh/oai_request.html
- Koha: česká komunita, OAI-PMH. Koha, česká komunita. Dostupné také z: http://www.knihovni-system-koha.cz/index.php/funkce/oai-pmh
- Tritius: Open Tritius. Tábor: LANius a.s, 2016. Dostupné také z: http://www.tritius.cz/open-tritius
- BANERJEE, Kyle. How Does XML Help Libraries?. Computers in Libraries, 2002. Dostupné také z: http://www.infotoday.com/cilmag/sep02/banerjee.htm
- MARC in XML. Library of Congress, 2008. Dostupné také z: https://www.loc.gov/marc/marcxml.html