Spolupráce s Institutem umění-Divadelním ústavem – aneb proč by každá instituce měla mít wikidatistu-rezidenta

Na počátku tohoto roku jsme zde psali o tom, že Institut umění – Divadelní ústav (IDU) zaměstnal historicky prvního českého wikidatistu-rezidenta, Jana Purkerta. O co se jedná? Tzv. wikidatista-rezident (překlad z anglického Wikidatist-in-Residence) je zaměstnanec zodpovědný za nastavování spolupráce mezi danou institucí – muzeem, galerií, vlastně jakýmkoliv správcem veřejné databáze – a Wikidaty. Ve světě se tento typ spolupráce poměrně rychle etabluje, ale v českém prostředí se jedná o relativní novinku, a tak bych chtěl tento příspěvek využít ke shrnutí výhod, které přináší. A uděláme to na zcela konkrétním příkladu výše zmíněného IDU, který v rámci své Virtuální Studovny (ViS) provozuje databázi s dokumentací českého divadla po roce 1945.

První, co wikidatista-rezident může pro svou mateřskou instituci udělat, je zprostředkovávat kontakt mezi ní a Wikidaty. Jan je zodpovědný za to, aby se spolupráce hýbala a aby docházelo k vyměňování informací mezi Wikidaty a IDU. Zatímco my jsme odborníci na budování největší svobodné databáze všech dob, zaměstnanci IDU jsou experty na divadlo a znají také zákulisí svých nejrůznějších databází a registrů.

Příklad schématu propojených dat ve Wikidatech – položky propojené se záznamem „budova Národního divadla“. Kolečkem myši si můžete data přiblížit.

Asi nejdůležitějším úkolem Jana jako wikidatisty-rezidenta je zorientovat se v jednotlivých datových sadách a vymyslet způsob, jakým mohou být propojeny s Wikidaty či do nich importovány. Vlastní import není jednoduchá záležitost – většinou se nestaví na „zelené louce“, takže některé záznamy už ve Wikidatech jsou přítomné. Před vlastním importem je tedy potřeba nejprve propojit ekvivalentní záznamy z obou databází. Například je-li ve Wikidatech položka Jiřina Bohdalová (Q468412) a ve Virtuální studovně IDU záznam 6752 příslušející dotyčné herečce, je potřeba oba záznamy propojit. Ve skutečnosti Janovi nejvíce času zabere právě tato přípravná fáze. Až následně proběhl import chybějících záznamů – ve Wikidatech máme díky tomu nyní 2500 záznamů divadel propojených s Virtuální studovnou IDU (více než polovina z nich má přidanou i adresu sídla) a 16 500 propojených osob. Velkým ulehčením pro Janovu práci byl fakt, že měl přístup i k neveřejným údajům, které má Virtuální studovna k dispozici, ale nemůže je kvůli ochraně osobních údajů uvolnit k všeobecnému užití; tyto údaje se však velice hodily k spárování záznamů mezi Wikidaty a Virtuální studovnou.

A konečně: pozice wikidatisty-rezidenta by pro instituci, která jej zaměstnala, neměla smysl, kdyby z této práce neměla žádný prospěch. Jan je tedy také pověřený tím, aby své instituci zprostředkovával výhody, které z propojení s Wikidaty vyplývají. Již před časem jsme například zjistili, že ve Virtuální studovně nebylo možné odkázat pomocí trvalého URI na záznam osoby. Nyní už to díky naší spolupráci možné je (ve formátu https://vis.idu.cz/Persons.aspx?personId=$1). Tím však teprve výstupy pro instituci teprve začínají. Jan totiž také připravil srovnání některých údajů, které eviduje IDU, s informace ve Wikidatech. Nalezené chyby ve formě tabulky jsou předány IDU, který jejich kontrolou a opravováním plánuje pověřit své zaměstnance. Ti se budou věnovat také dalšímu ručnímu párování osob s Wikidaty na základě vytipovaných dvojic, u nichž si nejsme jistí identitou a musí nastoupit lidská kontrola; podobně funguje také nástroj Mix’n’Match, kde na totožném párování mohou už nyní pracovat wikidatisté.

Další výhodou pro IDU je i to, že Virtuální studovna může být nyní obohacena daty z Wikidat. Může například k divadlům či divadelníkům uvádět obrázky, odkazy na Wikipedii, Národní knihovnu a další internetové zdroje, personálie, jako jsou data narození a úmrtí, a další rozšiřující informace. Do konce roku navrhneme IDU nejvhodnější způsoby, jak by toto šlo implementovat. Zároveň IDU plánuje na základě existujících propojení ve Wikidatech doplnit do své databáze identifikátor Národních autorit (o kterém jsme psali nedávno), který umožní kontakt mezi záznamy osob ve Virtuální studovně s příslušnými záznamy v knihovním systému IDU.

Data narození osob ve Virtuální studovně IDU importovaných do Wikidat – barevné zvýraznění odpovídá státům narození osob. Je to příklad toho, jak si mohou databáze obohacovat a vizualizovat data pomocí Wikidat. Upozornění: načtení trvá asi 45 vteřin a může v některých případech selhat – v tom případě aktualizujte stránku a zkuste to znovu.

Zaměstnávání wikidatistů-rezidentů je pro mnoho organizací, které spravují složité datové sady, zcela zásadní pro postupný průnik Wikidat do světa českých paměťových institucí. To je i případ IDU – na složité datové sady si často dobrovolník netroufne, pokud tedy shodou okolností není nadšencem v daném oboru. Česká muzea, galerie, knihovny, ale i další veřejné instituce tak budou v příštích letech využívat tzv. wikidatistů-rezidentů v čím dál větší míře.

Mohlo by se vám líbit…

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..