Manažment výskumných dát

Veľké dáta, údaje, svet. Obrázok od Tumisu z PixabayČo sú výskumné dáta?

Dáta sú vo všeobecnosti informácie, ktoré sa zbierajú a zaznamenávajú na ďalšie použitie alebo analýzu.

Výskumné dáta sú „zaznamenaný faktografický materiál všeobecne akceptovaný vo vedeckej komunite ako potrebný na overenie výsledkov výskumu vrátane súborov dát používaných na podporu vedeckých publikácií.“(4)

Klasifikácia výskumných dát (5):

  1. Pôvodné dáta a dátové súbory (raw data) – nie sú spracované a zvyčajne sa uchovávajú na harddiskoch a zariadeniach v inštitúcii.
  2. Spracované dáta (curated data) – napríklad kolekcie dát, štruktúrované databázy (uložené v repozitároch a dátových centrách, inštitucionálnych aj odborových), ako aj príslušné pracovné postupy a protokoly.
  3. Podkladové dáta k publikácii (data underlying publications) – dáta potrebné na validáciu zistení predložených vo vedeckej publikácii („obohatené publikácie“ s odkazmi na dáta).
  4. Metadáta (bibliografické údaje, ktoré popisujú dáta) – metadáta je možné nájsť v online katalógoch, archívoch, repozitároch atď.

Čo je manažment výskumných dát?

Manažment výskumných dát alebo v angličtine RDM z Research Data Management (RDM) je širší pojem, ktorý

  • zahŕňa súbor činností, ktoré sa viažu so životným cyklom výskumu či výskumných dát – organizáciu, ukladanie, uchovávanie a zdieľanie dát zhromaždených a použitých vo výskumnom projekte;
  • každodenný manažment výskumných dát počas životného cyklu (trvania) výskumu (napríklad pomenovávanie súborov);
  • rozhodovanie o tom, ako sa budú dáta uchovávať a zdieľať po ukončení projektu (napríklad uloženie dát v repozitári na dlhodobé uchovávanie a sprístupňovanie)

OtaznikPrečo je dobré investovať čas a zdroje do manažmentu vedeckých dát?

Vďaka dobre premyslenej, štruktúrovanej a zdokumentovanej stratégii manažmentu výskumu bude výskum časovo efektívny, reprodukovateľný a bezpečný.

Niektoré z výhod dobrého manažmentu výskumných dát:

  • umožňuje predchádzať strate dát – dáta (najmä digitálne) sú krehké a ľahko sa strácajú;
  • šetrí čas a zdroje z dlhodobého hľadiska;
  • umožňuje predchádzať chybám a zvyšuje kvalitu analýz;
  • umožňuje ostatným overovať a replikovať zistenia;
  • uľahčuje zdieľanie výskumných dát, čo môže viesť k cenným objavom iných subjektov mimo pôvodného výskumného tímu (zvýšenie dosahu a opakovaného použitia dát);
  • uľahčuje dodržiavanie požiadaviek financujúcich subjektov (napr. Európska komisia v rámci programu Horizont Európa, European Research Council (ERC), Narodowe centrum nauki (Národné centrum vedy) v Poľsku a i.).

Čo treba zobrať do úvahy pri plánovaní manažmentu výskumných dát?

Prvý dôležitý krok pri manažmente výskumných dát je plánovanie.

Otázky, ktoré treba zvážiť súvisia s jednotlivými fázami životného cyklu výskumných dát.

Medzi dôležité otázky, ktoré si treba položiť ešte pred realizáciou výskumu, patria:

  • Aké sú očakávania a zásady vašej inštitúcie a financujúcej agentúry?
  • Zhromažďujete nové dáta alebo opätovne používate existujúce dáta?
  • Aký druh dát zbierate a v akom formáte?
  • Aké množstvo dát plánujete získať?
  • Ako budete uchovávať a zálohovať aktívne dáta?
  • Ako budete riešiť dlhodobé uchovávanie a archiváciu dát?
  • Aká bude organizácia dát? Ako ich budete popisovať a označovať?
  • Ako bude zabezpečený prístup k dátam a zdieľanie?
  • Ako bude zabezpečená ochrana osobných údajov, súhlasy, duševné vlastníctvo a iné bezpečnostné otázky?
  • Ako budú rozdelené úlohy a zodpovedností za manažment dát vo výskumnom tíme?
  • Akú budú finančné zdroje a rozpočet?

Plán manažmentu dát-schémaPlán manažmentu dát

Plán manažmentu dát (DMP, data managment plan) je nástroj, ktorý môže pomôcť pri plánovaní a riadení výskumu a výskumných dát.

Viac o pláne manažmentu dát a nástrojoch na jeho tvorbu na stránke Plán manažmentu dát.

data-processingSpracovávanie výskumných dát

Dáta sa počas čas rôznych fáz projektu často editujú, preto je dôležité počas tohto procesu zachovať autentickosť výskumných informácií obsiahnutých v dátach a zabrániť ich strate alebo

 znehodnoteniu. Súčasťou procesu spracovania dát je zadávanie dát do počítača a zachovanie integrity dát, kvantitatívne a kvalitatívne kódovanie, formátovanie dát a ich konverzia, čistenie, analýza, vizualizácia a i.

Podrobnejšie informácie o spracovaní dát nájdete aj v online príručkách manažmentu výskumných dát uvedených v zdrojoch.

Ďalšie odporúčané zdroje:

Moodle NTK-printscreen

Kurz v anglickom jazyku vytvorený v rámci projektu DocEnhance zameraný na posilnenie zručností doktorandov v oblasti manažmentu výskumných dát. Kurz Data Stewardship vytvorili špecialisti z nórskej univerzity UiT The Arctic University of Norway a je dostupný pod verejnou licenciou  CC BY 4.0 . Kurz poskytuje Národní technická knihovna v rámci 3-modulového programu pre doktorandov ako prvý modul. Je sprístupnený na platforme Moodle NTK v časti kurzov pre začínajúcich výskumníkov. Modul Data Stewardship – Module 1: MOOC je dostupný online bezplatne. Podrobné informácie o čistení, analýze a vizualizácii dát nájdete v 6. časti.

SRN-logo-printscreen

Workshopy a materiály v slovenskom ale aj anglickom jazyku na stránke Slovak Reproducibility Network/Spoločenstvo otvorenej vedy. Stránka je zameraná na oblasť psychológie a psychológov, ale prináša aj všeobecné užitočné informácie ako záznamy workshopov a webináre na témy ako Čo so štatisticky nevýznamnými výsledkami, Základy práce v štatistickom softvéri R pre začiatočníkov, Odhad veľkosti výskumného súboru či Predregistrácia.

Webinár o dátovom manažmente od Research Data Alliance a katalóg materiálov.

 

Ďalšie odporúčané materiály na štúdium

Webové stránky:

Otvorená veda v programe horizont Európa

European Open Science Cloud

ERA portál – kancelária programu Horizont Európa

Zdroje:

  1. Research Data Management @ Pitt. [Citované dňa 11.1.2024]. Dostupné na https://pitt.libguides.com/managedata
  2. Kurz: DocEnhance Data Stewardship – Module 1. [Citované dňa 11.1.2024]. Obsah kurzu DocEnhance Data Stewardship od univerzity UiT The Arctic University of Norwayje zverejnený pod licenciou  CC BY 4.0, pokiaľ nie je uvedené inak. Dostupné na https://moodle.techlib.cz/course/view.php?id=179#section-0.
  3. CESSDA Training Team (2017 – 2022). CESSDA Data Management Expert Guide. Bergen, Norway: CESSDA ERIC. Dostupné z https://dmeg.cessda.eu/. Data Management Expert Guide od CESSDA ERIC je zverejnený pod licenciou Creative Commons Attribution-ShareAlike 4.0 International License. [Citované dňa 11.1.2024].
  4. Imed Bouchrika. What Is Research Data Management (RDM) in 2024? [Citované dňa 12.1.2024]. Dostupné na https://research.com/education/research-data-management
  5. Spichtinger, Daniel & Siren, Jarkko. (2017). 1. The Development of Research Data Management Policies in Horizon 2020. 10.1515/9783110365634-002. [Citované dňa 12.1.2024]. Dostupné z: https://www.researchgate.net/publication/321169300_1_The_Development_of_Research_Data_Management_Policies_in_Horizon_2020

Zdroje obrázkov:

  1. Obrazok „Veľké dáta, údaje, svet“: Image ge by Tumisu from Pixabay
  2. Obrázok „DATA MANAGEMENT“: An introduction to Research Data Management zverejnený pod licenciou CC-BY 4.0.
  3. Obrázok „Otáznik“: Image by Peggy und Marco Lachmann-Anke from Pixabay
  4. Obrázok „The Research Data Management (RDM) lifecycle at the University of Cape Town (UCT)“ by Gaelen Pinnock, CC BY-SA 4.0 via Wikimedia Commons
  5. Obrázok „Plán manažmentu dát“: Obrázok adaptovaný podľa pôvodného obrázku od UiO: University of Oslo Library
  6. Obrázok Data processing icons created by Eucalyp – Flaticon
  7. Logá v časti Spracovávanie výskumných dát – printscreeny z webových stránok