Wikidata slaví 10 let. Znáte techničtějšího sourozence Wikipedie?

Wikidata byla spuštěna 29. října 2012, takže právě dnes slaví své desáté narozeniny. Během té doby na ně „geekové“ nahráli téměř 500 milionů položek. Zlepšují tak spolehlivost Wikipedie a ač to možná nevíte, z Wikidat čerpáte dennodenně i vy. Pojďme se na deset let kolektivního úsilí wikidatistů a wikidatistek podívat blíže.

Wikidata najdete v 81 % všech článků na české Wikipedii

Wikimedia Foundation, CC BY-SA 3.0, via Wikimedia Commons

Wikidata jsou centralizovaným propojeným úložištěm dat pro všechny projekty Wikimedia. To znamená, že například Wikimedia Commons a všech 300 jazykových verzí Wikipedie díky nim může čerpat informace ze stejného zdroje. Wikidata mají velký potenciál zlepšit přístup k informacím, zajistit větší konzistenci v různých jazycích a umožnit všem přispívat informacemi i do Wikipedií, jejichž jazyk neovládají.

„Baví mě přispívat na Wikidata, protože to má smysl, baví mě obohacovat svět o to, co na české Wikipedii asi nikdy nebude. Wikidata pomohou, zvlášť v regionech Asie či Afriky, vzdělávat a poskytovat informace. A to různými formami,“ říká wikidatista Jiří Sedláček.

Informace z Wikidat využívá 81 % všech článků na české Wikipedii, na anglické je to 67 %. Je to způsobení tím, že anglická Wikipedie informacím ve Wikidatech dlouhodobě věří spíše méně. Komunita zastává názor, že články si proti vandalismu je schopná ochránit lépe, než Wikidata komunita je schopná ochránit Wikidata položky. Drtivá většina všech článků (99,9 %) je prostřednictvím Wikidat propojena s články o tomtéž na jiných jazykových verzích.

Wikidata jsou bezplatná, kolaborativní, vícejazyčná, sekundární databáze, která shromažďuje strukturovaná data pro podporu Wikipedie, Wikimedia Commons, dalších projektů hnutí Wikimedia a také pro kohokoli na světě.

– Wikidata

Co všechno můžete zjistit na Wikidatech o Albertu Eisteinovi

Co všechno ví WikiData o Albertu Einsteinovi? Foto: ASSOCIATED PRESS, CC0, via Wikimedia Commons

Co přesně se tedy skrývá pod pojmem „nahrané položky“? Slavné osobnosti, druhy zvířat, vědní obory, emoce, roční období… Téměř cokoliv na světě může mít svou Wikidata položku. Kouzlo přichází ve chvíli, když jednotlivé položky propojíte.

Například položka Albert Einstein (Q937) je propojená s položkou místo úmrtí Princeton (Q138518), otec Hermann Einstein (Q88665), rodný jazyk němčina (Q188), 1921 Nobelova cena za Fyziku (Q38104), s audiostopou výslovnosti jeho jména a dalšími desítkami položek.

Po prostudování této stránky budete jednoznačně o Albertu Einsteinovi vědět víc než váš profesor fyziky se střední.

Wikidata používá Siri i Alexa

Wikidata jsou navržena tak, aby je mohli číst a přispívat do nich nejen lidé, ale také počítače.

„Jazyk je závislý na ‚selském rozumu‘, ke kterému počítače nemají přístup.“ To jsou slova chorvatského počítačového vědce Dennyho Vrandečiće, který v roce 2012 Wikidata založil. Vrandečić, programátor a wikipedista, chtěl vytvořit místo, kde budou lidé a stroje moci sdílet vědomosti za příznivějších podmínek.

Apple Inc., Public domain, via Wikimedia Commons

Jak jste viděli na příkladu Alberta Einsteina, každé položce je přidělen jedinečný trvalý identifikátor, kladné celé číslo s předponou velkého písmene Q, známé jako „QID“. To umožňuje přeložit základní informace potřebné k identifikaci tématu, kterého se položka týká, aniž by byl upřednostněn jakýkoli jazyk.

Jak informoval časopis Wired, díky Wikidatům mohou virtuální asistentky jako Siri a Alexa odvádět lepší práci, když jim řeknete požadavek nebo položíte otázku. Vyhledávače jako Google čerpají z Wikipedie, a ta čerpá z Wikidat. Studie, v níž bylo analyzováno 1 000 vyhledávaných výrazů (vybraných pomocí generátoru náhodných podstatných jmen), ukázala, že Wikipedie se v 99 % případů umístila na první stránce.

Čím dál tím častěji se stává, že ve spolupráci s wikidatisty svá data na Wikidata nahrávají vědecké kulturní instituce, nedávno některé své databáze pod licencí CC0 zveřejnila například Národní knihovna. Jejich data se díky tomu zviditelní a umožní jim to jejich kontrolu díky porovnání s jinými databázemi.

Jaká je budoucnost Wikidat? Svůj pohled nám poskytl český Wikipedista JAn Dudík. „Databáze, ve které se najde vše důležité s odkazy na relevantní zdroje. Dnes umíme z Wikidat generovat infoboxy, časem třeba i pahýlky (článků, pozn. red.) Ze je úskalí jazyků, které skloňují, v angličtině už tomu moc nechybí. Pokud se někdy podaří vytvořit generátor článků v přirozeném jazyce, pomůže to regionům s malou wikikomunitou ke vzniku použitelné encyklopedie,“ říká.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..