Dolovaním dát k prelomovým objavom

data mining, copyright, Digital Single Market

(zdroj: Marcie Casas/Flickr)

Minulú stredu, keď Jean-Claude Juncker prednášal v Štrasburgu svoj prejav o stave Európskej únie, komisári zodpovední za vytvorenie jednotného digitálneho trhu zverejnili podstatnú časť očakávaných reforiem. Jedna zo zmien v autorskom práve má výrazne pomôcť špičkovej vede a prelomovým objavom.

Výskumní pracovníci v celej EÚ dostanú výnimku na využívanie technológie ťaženia z textu a údajov známu ako „text and data mining“ (TDM). Cieľom výnimky je právna istota a rovné podmienky pre výskumných pracovníkov. Európska komisia sa v tomto kontexte smelo vyjadrila o „rýchlejšom a efektívnejšom nachádzaní prelomových riešení na najväčšie výzvy, akými sú globálne epidémie a klimatické zmeny“.

Technológia TDM by sa mohla uplatniť v boji proti vírusu Zika. Pomohla by analyzovať dáta, ktoré sa objavili v minulom i paralelne prebiehajúcom výskume na celom kontinente.

Tento inovatívny prístup k analýze veľkého množstva dát sa doteraz mohol dostávať do stretu pravidlami na ochranu copyrightu. Celoeurópska úprava umožní dosiahnuť na informácie, ktoré sú dnes uzamknuté v tisíckach článkov v elektronickej podobe.

Výskum, ktorý si prečíta len stroj

Časopis Horizon, ktorý Európska komisia využíva na propagáciu vedy a výskumu, upozornil na niekoľko zaujímavých štatistík. Podľa jednej z nich sa každú polhodinu publikuje jeden nový odborný článok. Jeden jediný proteín zaujal vedcov natoľko, že o ňom existuje 70 tisíc štúdií. Iná štatistika zase tvrdí, že 50 % prác prečítajú iba ich autori, recenzenti a vydavatelia. Drvivú väčšinu z nich nikdy nikto neodcituje.

Najnovšia iniciatíva rozvíja ideu, že výskum nájde kvalitnú oporu v množstve predchádzajúcich prác. Vďaka automatizovanému vyhľadávaniu bude možné odhaliť informácie a trendy, ktoré by bežný čitateľ z enormného množstva údajov nedokázal odhaliť.

Text and data mining nadviaže na aprílové ohlásenie európskeho vedeckého cloudu. Jeho súčasťou bola tiež podmienka, že od roku 2020 budú poznatky z verejne financovaných vedeckých prác voľne dostupné na ďalšie spracovanie. V máji toto opätovné využitie dát podporili ministri školstva dvadsaťosmičky.