Nejen wikidatisté slaví, že Národní knihovna zpřístupnila své databáze pod licencí CC0
Národní knihovna zatím pod volnou licencí CCO zpřístupnila Českou národní bibliografii, Databázi národních autorit a Centrální adresář knihoven a informačních institucí. Tato licence umožňuje nejširší možné užití databází, a to jak pro nekomerční, tak komerční účely, bez nutnosti uvedení autorství. Jak se na tom podílela Wikimedia ČR a co to bude znamenat pro wikipedisty, jsme se ptali wikidatisty Mgr. Vojtěcha Dostála a wikidatistky a zároveň zaměstnankyně Národní knihovny PhDr. Lindy Jansové, Ph.D.
Jak se zpřístupněná data promítnou do Wiki projektů, potažmo do životů uživatelů Wikipedie?
„Otevírá se tak přístup ke katalogům knižních děl, ale i k informacím o jejich autorech a dalším ‚metadatům‘, která knihovníci používají, když knihy popisují. Pro wikipedisty a zejména pro wikidatisty je to velký krok kupředu, protože donedávna jsme tento přístup měli jen k Databázi národních autorit, a to ještě jen k jejich části, která se věnuje osobám.
Nyní je těch dat mnohem více a můžeme se pustit do práce na jejich propojování a využívání. Než se to projeví na Wikipedii, tak to ještě chvíli potrvá, ale časem bychom se mohli dočkat třeba automatizovaných přehledů děl u autorů, o nichž máme článek. Neřekl bych ale, že přínos pro Wikipedii je to stěžejní. Celkově jsou to prostě užitečná data, z nichž budou čerpat různé databáze a externí služby,“ popisuje Vojtěch Dostál.
Kolik subjektů na uvolnění dat spolupracovalo, jak dlouho celý proces trval?
„V rámci Národní knihovny ČR na zpřístupnění dat spolupracovala řada organizačních složek (od vedení knihovny přes právní oddělení až po IT) a jednotlivců,“ říká Linda Jansová.
„Koordinaci aktivit zajišťovala Mgr. Lenka Maixnerová, náměstkyně pro knihovní fondy a služby. Lenka zároveň vede Pracovní skupinu pro poskytování databází NK ČR externím subjektům, jež byla ustavena začátkem léta 2021. Mimo Národní knihovnu jsme spolupracovali s celkem třemi ministerstvy – kultury, vnitra a financí. Zde šlo především o konzultace vztahující se k praktickému postupu při otevírání dat a možnosti použití nejvolnější možné licence, tedy CC0.
Pokud jde o časové vymezení, počátky úvah o otevírání dat spadají do let 2018 a 2019, kdy jsme zahájili užší spolupráci s Wikidaty, konkrétně v souvislosti s propojováním a přidáváním položek z České terminologické databáze knihovnictví a informační vědy (TDKIV) a následně se zpracováváním autoritních záznamů.“
Jakou úlohu v tom všem hrála Wikimedia ČR?
„Spolupráce se spolkem Wikimedia ČR pro nás byla a stále je velkou podporou. Jednak jsme mohli čerpat z dříve zahájených projektů, jmenovitě ze spolupráce v oblasti zpřístupňování autoritních záznamů ve Wikibase. A také nám pomohly jejich přehledně zpracované informace o otevírání dat nebo jimi pořádané diskusní či vzdělávací akce, jako byla například lednová diskuse ve Skautském institutu.
„Veškeré pomoci ze strany spolku Wikimedia ČR si velmi vážíme a doufáme, že tato spolupráce bude pokračovat i do budoucna. Námětů na společné projekty a aktivity je zatím – zdá se – víc než dost,“ doplňuje Linda.
Jaké výhody má pro instituce spolupráce na zpřístupňování dat a archiválií s WMČR?
„Myslím, že to přináší institucím celou řadu výhod, i když pominu to, že pomáhají dobré věci, na níž spolupracují lidé po celém světě a která slouží milionům uživatelů internetu každý den k získávání informací,“ říká Vojtěch.
„Zaprvé se jejich data zviditelní – z Wikidat čerpá třeba Wikipedie, jeden z nejnavštěvovanějších webů na světě. Instituce tak pomohou lidem najít správnou odpověď na jejich otázku, a navíc zvýší návštěvnost své databáze, protože údaje ve Wikidatech jsou vždy opatřené referencí. Databáze se fakticky posune o několik stupínků výše v kvalitě, neboť její napojení na Wikidata fakticky znamená vstupenku do vesmíru propojených dat. To umožňuje kontrolu správnosti jejich dat – porovnáním s jinými databázemi můžeme zjistit různé nesrovnalosti,“ dodává.
Linda kromě zviditelnění a propojení klade důraz právě na kontrolu: „Výrazným přínosem pro instituce je samozřejmě možnost díky této konfrontaci vlastních dat s vnějším světem zjišťovat nesrovnalosti a opravovat je. Na řadu chyb v praxi nelze snadno přijít a ukáží se až při podrobném zpracovávání a porovnávání stejných typů údajů z různých záznamů a zdrojů. Spolupráce se spolkem Wikimedia ČR tak vlastně Národní knihovně ČR pomáhá neustále zlepšovat svá data a tím poskytovat stále kvalitnější službu veřejnosti a lépe naplňovat své poslání.“
Muzea, galerie, vědecké knihovny nebo umělecké sbírky rádi přivítáme na Wikidatech
Na otázku, na jaké další instituce wikidatisté číhají, odpovídá Vojtěch:
„Wikidata jsou specifická tím, že shromažďují data především z různých znalostních databází. Třeba data Českého statistického úřadu jsou velmi podrobná, obsahují různé číselné statistiky z různých úhlů pohledu, ale to není úplně náš šálek kávy. Jdeme většinou po obecnějších konceptech. Wikidata tak myslím nejvíce baží po spolupráci s vědeckými a kulturními institucemi. V hledáčku máme různá česká muzea, galerie, různé vědecké knihovny, ale i třeba geografické, přírodovědné nebo umělecké sbírky. Zajímavé jsou také historiografické databáze, v poslední době se někteří wikidatisté věnují třeba mapování obětí 2. světové války a podobně.“
Pokud patříte mezi takové instituce a chtěli byste pomoci s rozhodováním, jestli je uvolnění databází pro vás správnou volbou nebo podporu v tomto procesu, můžete se obrátit na manažerku Programů pro partnerství Evu Vele na e-mailu eva.vele@wikimedia.cz, nebo si přečíst více na stránkách projektu GLAM.