Otvorené dáta a FAIR dáta

Otvorené dáta

  • údaje, ktoré môže ktokoľvek slobodne používať a následne aj redistribuovať, no s výhradnou podmienkou priznania autorstva a citácie;
  • digitálne informácie (dáta, obsah), ktoré sú voľne prístupné bez akýchkoľvek obmedzení akémukoľvek používateľovi. 
Kľúčové vlastnosti otvorených dát:
  • dostupnosť a prístup: dáta musia byť dostupné, v maximálne možnej miere zrozumiteľné a ľahko stiahnuteľné.
  • opätovné použitie a redistribúcia: dáta musia byť dostupné pod podmienkou opätovného použitia a redistribúcie.
  • univerzálna participácia: každý musí byť schopný využívať a redistribuovať dáta bez diskriminácie.

Princípy FAIR a FAIR dáta

S pojmom otvorené dáta sa spájajú aj princípy FAIR, ktoré sú podstatnou súčasťou otvorenej vedy a popisujú niektoré z centrálnych zásad dobrého manažmentu dát a otvoreného prístupu k výskumným dátam.

Tieto princípy sa zameriavajú hlavne na strojovú čitateľnosť dát, ale aj na ľudské pochopenie výskumných dát s cieľom umožniť ich opätovné použitie. Princípy FAIR  boli prvýkrát zverejnené v roku 2016. Prijala ich Európska únia, ale aj množstvo ďalších organizácií vrátane univerzít a rôznych výskumných inštitúcií.

Princípy FAIR definujú práve to, že nie všetky sa musia sprístupniť, ale že dáta majú otvorené tak ako, je to možné a zatvorené (nedostupné), tak, ako je to potrebné. 

FAIR je skratka pozostávajúca zo štyroch slov, ktoré znamenajú, že dáta musia byť:

Prvým krokom pri využívaní je dát je ich vyhľadateľnosť. Metadáta a dáta by mali byť jednoducho vyhľadateľné pre človeka, aj pre počítač.

  • Dátam (metadátam) by mal byť priradený trvalý identifikátor. Trvalý identifikátor napomáha odstrániť nejednoznačnosť publikovaných dát.
  • Dáta by mali byť popísané metadátami, ktoré zahŕňajú informácie o kontexte, kvalite a podmienkach alebo charakteristike dát. Toto napomáha k lepšej lokalizácii dát a k ich opätovnému použitiu a vyššej citovanosti.
  • Metadáta by mali byť registrované alebo indexované v nájditeľnom zdroji, pretože identifikátory a metadátové popisy samotné, nezaručujú ich jednoduchú vyhľadateľnosť na internete.

Ak používateľ nájde požadované dáta, potrebuje vedieť, ako sú prístupné.

  • Dáta (metadáta) je možné nájsť podľa ich identifikátora a získať prístup k nim pomocou štandardizovaného komunikačného protokolu (http). Tento protokol je otvorený a univerzálne implementovateľný.
  • Metadáta by mali byť dostupné, aj keď dáta už nie sú k dispozícií. Dátové súbory môžu v priebehu času degradovať alebo zmiznúť a uchovávanie metadát je vo všeobecnosti jednoduchšie a lacnejšie.
  • Dáta (metadáta) by mali využívať formálny, dostupný, zdieľaný a široko aplikovateľný jazyk pre znalostnú reprezentáciu. Aby bolo možné zabezpečiť automatickú vyhľadateľnosť a interoperabilitu dátových súborov, je potrebné využívať ontológie, tezaury a dátové modely.
  • Dáta (metadáta) by mali zahŕňať aj odkazy na iné dáta (metadáta). Cieľom vytvárania spojení medzi metadátovými zdrojmi je lepšie pochopenie dátového kontextu.

Hlavným cieľom princípov FAIR je optimalizovať opätovné použitie dát. Preto by mali byť dáta aj metadáta dobre popísané.

  • Dáta (metadáta) by mali byť bohato popísané presnými a relevantnými atribútmi, aby sa dali využiť v danom konkrétnom kontexte. Jedným z dôležitých atribútov sú jasné a dostupné licencie o použití dát. Aby ostatní mohli dáta (metadáta) opätovne využívať, aby vedeli, odkiaľ dáta prišli a ako ich citovať, je podstatnou aj presná informácia o pôvode dát.
  • Ak sú dáta podobné, tak je aj jednoduchšie ich opätovne využívať. To znamená rovnaký typ dát, dáta organizované v štandardizovanej podobe, zavedené a udržateľné formáty a využívanie kontrolovaných slovníkov. Preto, ak existujú „komunitné“ štandardy alebo príklady dobrej praxe, mali by sa dodržiavať.
Obrazok-principy-FAIR
Biomeris: úvod do princípov FAIR

Obmedzenie prístupu k dátam

Výstupy vedeckého výskumu majú byť otvorené tak, ako je možné a zároveň tak zatvorené, ako je nutné.

V niektorých prípadoch môže byť prístup k dátam obmedzený z dôvodu národnej bezpečnosti, dôvernosti dát, ochrany súkromia alebo rešpektu k objektu štúdia. To zahŕňa napríklad právne procesy, výrobné tajomstvá, práva duševného vlastníctva, osobné údaje, ochranu ľudských subjektov či ohrozených a vzácnych druhov (UNESCO Recommendation 2020).

Obrazok-vzťah-FAIR-data-a-otvorené-data
Vzťah medzi FAIR dátami a otvorenými dátami.
Zdroje/na štúdium

1. FAIR Principles – GO FAIR

2. https://www.dcc.ac.uk/news/new-dcc-paper-open-and-fair

3. https://www.biomeris.it/en/introduction-fair-principles/

4. Európska komisia, Generálne riaditeľstvo pre výskum a inováciu, Turning FAIR into reality : final report and action plan from the European Commission expert group on FAIR data, Publications Office, 2018, https://data.europa.eu/doi/10.2777/1524

5. https://lib.uct.ac.za/digitalservices/documentation/what-are-data