Jsou soutěže pro Wikipedii přínosem, nebo zátěží?

Ještě se ani neusadil prach na naší úspěšné soutěži Popiš památku, ale to mi nezabrání v tom, abych zanalyzoval některá zajímavá data, která ze soutěže vypadla. Takové ty základní věci už padly v příspěvku Honzy Loužka: vzniklo 150 nových článků, přidáno bylo cca 175 tisíc slov. Pojďme se teď ale podívat pod povrch celé soutěže.

Z prvního grafu (nahoře) je velmi dobře vidět, že v období, kdy se konala soutěž, skutečně vzrostl počet článků napsaných o kulturních památkách (bez ohledu na to, zda do soutěže byly přihlášeny nebo ne). Na ose x je období od začátku ledna do konce února; oranžovým pruhem je vyznačeno trvání soutěže. Na ose y je počet článků o památkách vytvořených v daném dni. Soutěž tedy prokazatelně zvyšuje kvalitu obsahu na téma, které je soutěží pokryto.



Druhý graf se na počet vytvořených článků dívá v kontextu veškerých nových článků na české Wikipedii. Ty jsou opět zobrazeny den po dni, přičemž výška sloupce udává počet napsaných článků za daný den (na ose y). Oranžová část sloupců představuje články o památkách. Z grafu je patrné, že články o památkách tvoří mimo soutěž jen menšinu celkové sumy nových článků; během soutěže podíl památkových článků roste, ale nikdy netvoří významnější podíl. Pokud soutěž zvyšuje počet nových článků na české Wikipedii, pak jen velmi mírně a růst se ztratí v celkovém šumu. Z dat také není možné pozorovat pokles psaní článků na nepamátková témata (což by znamenalo, že se komunita přesměrovává na psaní článků o památkách) – na to je asi naše soutěž příliš „malá“. Přesto některé zajímavé tendence vidíme. V 14 dnech před soutěží činil podíl článků o památkách asi 1,01 % celkového počtu nových článků, v průběhu soutěže to bylo 5 % nových článků a v 14 dnech po soutěži 1,77 % nových článků. Bude zajímavé měřit, zda vzestup zájmu o psaní článků o památkách bude pokračovat i nadále, či se jedná o statistickou odchylku.



Třetí graf (či spíše trojice tří podobných grafů) se věnuje vítězům soutěže Popiš památku – kolegům Petrovi Kinštovi, Ikcurovi a Luborovi Ferencovi. Na časové ose jsou vyneseny jednotlivé týdny od konce roku 2013 (kdy napsal první článek Lubor Ferenc) až do současnosti. Vidíme, že v průběhu roku 2014 napsal svůj první článek Petr Kinšt a posléze se přidal i Ikcur. Osa x vynáší počet nových článků napsaných těmito supervýkonnými wikipedisty v daném týdnu; modře jsou památky a oranžově jiné nové články (velice se omlouvám za změnu barevného kódování). Je zajímavé sledovat rozdíly mezi těmito třemi wikipedisty. Petr Kinšt (nahoře) odjakživa psal články o památkách a byl v tom velmi výkonný. Během soutěže sice skutečně napnul své síly, ale to už udělal předtím několikrát i bez soutěže. Ikcur obvykle články o památkách nepíše, i když na začátku roku 2017 už jedno památkové období měl. Během soutěže se do psaní článků o památkách opřel a psal tolik článků, jako ještě nikdy nenapsal. Je zajímavé, že Ikcurovo zvýšené tempo začalo už před soutěží (nepamátkovými články) a pravděpodobně s naší výzvou nesouvisí. Lubor Ferenc je z oněch tří nejzkušenějším wikipedistou, ač méně výkonným; střídají se u něj období intenzivního psaní nových článků s obdobími klidu. O památkách skoro nepíše, ale soutěž ho, zdá se, stimulovala k napsání vysokého počtu článků po delší době nižší aktivity. Je vidět, že se vliv soutěže na wikipedisty nedá zobecňovat a liší se případ od případu.


Shrnuto a podtrženo: soutěž generuje velké množství nových článků na zvolené téma, ačkoliv v moři nových článků se stále jedná o kapku či maximálně louži. K podrobnějšímu zhodnocení by bylo nutné měřit i rozsah článků či dokonce kvalitu. Nezdá se, že by wikipedisté hromadně přepínali z psaní „svých“ témat; někdy to tak trochu je, ale situace se liší případ od případu.
 
Data pochází z nástrojů: Quarry (seznam článků vzniklých v rámci soutěže s daty jejich vzniku a celkové počty nových den po dni), Wikidata Query (seznam všech českých článků o památkách v Česku), X’s Tools (články vytvořené jednotlivými wikipedisty). Analýza i vizualizace byly kompletně provedeny v Excelu. Za data z Quarry děkuji Martinovi Urbancovi.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..