První český wikidatista-rezident: Institut umění – Divadelní ústav vykročil k otevřeným propojeným datům

Divadelní budovy, divadelní organizace a divadelní soubory. Přestože se vše často v češtině označuje slovem „divadlo“, v databázi je potřeba různé významy tohoto slova odlišovat. Nejúplnější databází těchto subjektů v Česku disponuje Institut umění – Divadelní ústav (IDU), který před časem část svých dat otevřel a nabídl je komunitě Wikidat. Porozumět celé datové sadě a zpracovat ji však vyžaduje obrovské množství práce a dobrou znalost oboru, takže se Divadelní ústav po dohodě s Wikimedia Česká republika rozhodl najmout tzv. wikidatistu „in residence“, tedy zaměstnance zodpovědného za Wikidata v dané instituci.

První český wikidatista-rezident, Jan Purkert (licence CC-BY-SA 4.0, autor: Purkii)

Historicky první česká pozice wikidatisty-rezidenta byla vytvořena 9. ledna 2020 a obsadil ji Jan Purkert, programátor a spolupracovník Divadelního ústavu, který se podílel na vzniku databáze Evropské divadelní architektury EUTA. Jan na sebe vzal náročný úkol zorientovat se v divadelních datech, a to jak v těch, které už ve Wikidatech jsou, tak v těch, které zatím leží v tzv. Virtuální studovně Divadelního ústavu a čekají na propojení s Wikidaty.

Hned od začátku jsme si vyjasnili terminologii. „Divadlo“ může znamenat divadelní budovu, pro tu je ve Wikidatech vyhrazena položka Q24354. Také se tím však může myslet instituce či organizace, pro tu se zpravidla používá položka Q11812394. Samostatný termín je divadelní soubor (Q742421); v některých případech však soubor může s divadelní organizací splývat. Dále v divadelní terminologii existuje výraz „scéna“, který je zpravidla významově podobný termínu „divadelní budova“, ale může být menší a specializovanější či např. tvořit jen sál v rámci rozsáhlejší budovy.

Díky tomuto vyjasnění se nový český wikidatista-rezident mohl pustit do práce. Jeho prvním úkolem je opatřit existující položky divadel identifikátory, které umožní automatizovat přebírání obsahu. U divadelních budov představuje hlavní autoritu již zmíněná databáze EUTA, u divadelních organizací to je Virtuální studovna Divadelního ústavu. Obě již mají zavedené tzv. Wikidata vlastnosti (properties), které umožňují správu identifikátorů jednotlivých záznamů. Skutečnou přidanou hodnotu však bude představovat propojení položek divadelních budov s položkami organizací pomocí různých dalších vlastností – hodit se budou hlavně vlastnosti „uživatel budovy“, „používá“, „provozovatel“ a další. Vzniknou tím velmi hodnotná propojená data, která integrují obě hlavní české databáze divadel, což umožní jejich vzájemnou komunikaci a spolupráci.

Pro náš spolek Wikimedia je tato spolupráce důležitým pilotním projektem, který ukáže, jak mohou najatí wikidatisté-rezidenti pomoci institucím v proměně jejich databází do podoby otevřených strukturovaných dat, které komunikují s Wikidaty – databází všeho, kterou může kdokoliv svobodně používat ve výzkumu, ve vývoji softwaru nebo při obohacování databází o nová data. Pokud budou naše zkušenosti z tohoto projektu dobré, použijeme jen jako vzor pro další české instituce, jež se na nás budou obracet.

Děkujeme Mgr. Ondřeji Svobodovi, zástupci ředitelky IDU, za iniciování spolupráce na tomto poli. Podrobnější informace o spolupráci českých institucí s Wikidaty naleznete formou otázek a odpovědí na stránce https://databaze.wikimedia.cz.

Napsat komentář

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..