Plán manažmentu dát
Prečo manažovať výskumné dáta?
Zodpovedný manažment dát prospieva vedcom a vede:
- Zdieľanie dát zvyšuje dosah výskumu a prestíž výskumníka aj výskumnej organizácie, pre ktorú pracuje.
- Zdieľanie dát zvyšuje ekonomickú efektivitu výskumu (pridaná hodnota opätovného zdieľania + možnosť zabrániť zbytočnému duplikovaniu).
- Zdieľanie dát tiež prispieva k transparentnosti a reprodukovateľnosti výskumu a pôsobí ako prevencia „sloppy science“ (nedbalej vedy), pretože si podkladové údaje môže každý skontrolovať (recenzent v rámci recenzného konania, iný vedec z danej oblasti v rámci prieskumu literatúry, aj spätne po rokoch) a vidieť, čo s nimi výskumník robil.
Viac o manažmente výskumných dát na stránke Manažment výskumných dát.
Plán manažmentu dát (DMP, z angl. Data Management Plan)
Nástroj, ktorý umožňuje vedcovi:
- systematicky premýšľať o dátovom manažmente,
- robiť strategické rozhodnutia v správnom čase,
- ujasniť si so spolupracovníkmi očakávania ohľadom projektu,
- zjednotiť si so spolupracovníkmi postupy a spôsob dokumentácie.
O dátach treba rozmýšľať (a rozhodovať sa) PRED, POČAS aj PO uskutočnení výskumu. DMP sa vypracováva na úplnom začiatku, ale v priebehu výskumu sa môže modifikovať podľa aktuálneho vývoja situácie.
Postupné presadzovanie politiky povinných DMP
- povinný pri žiadosti o grant z programu Horizont Európa,
- povinný v Poľsku (Národné centrum vedy),
- Slovensko – v rámci implementácie Národnej stratégie pre otvorenú vedu plánuje sa postupne zaviesť povinný DMP v agentúre APVV podľa poľského vzoru.
Niektoré grantové agentúry a donori (napr. ERC) majú vzory plánov manažmentu dát, do ktorých výskumník vyplní údaje špecifické pre projekt. Výskumné inštitúcie vo vyspelých krajinách už majú vo vnútorných predpisoch povinnosť vypracovávať DMP a majú aj pracovné pozície ako „podpora manažmentu dát“.
Obsah plánu manažmentu dát
- Aký druh dát sa bude zbierať počas výskumu? (dotazníky, merania, texty, fotografie, skeny…)
- Budú medzi nimi špeciálne, citlivé kategórie dát? (osobné údaje, biologické vzorky, komerčné údaje, ktoré by mohli ovplyvniť obchodnú súťaž…)
- Treba pred začatím projektu žiadať o súhlas (osoby – napr. pacientov, alebo organizácie, napr. Štátnu veterinárnu a potravinovú správu, Štátnu ochranu prírody, Etickú komisiu…)?
- Treba pred začatím projektu splniť nejaké právne povinnosti?
- Aké sú práva a povinnosti pri používaní dát iných strán (napr. z komerčných databáz – niektoré môžu mať v zmluvách zákaz zdieľania podkladových dát po ukončení projektu, alebo obmedzenie objemu dát, ktoré môže výskumník extrahovať)?
- V akých formátoch sa budú dáta ukladať?
- Aký je predpokladaný objem získaných dát?
- Máte stratégiu pomenovávania súborov a adresárov?
- Ako budete dáta dokumentovať, opisovať? Metadát je veľa – ale ktoré budú kľúčové pre váš projekt?
- Ako zabezpečíte, že budú vaše dáta zrozumiteľné pre iných?
- Ako zabezpečíte svoje dáta (aby k nim nemali prístup neoprávnené osoby – napr. dáta sú chránené heslom na univerzitnom serveri, citlivé dáta v papierovej podobe zamknuté v skrinke)?
- Ako zaistíte zálohovanie dát?
- Akým spôsobom budete zdieľať dáta, ktoré majú byť zverejnené (napr. v repozitári)?
- Ako zabezpečíte dlhodobé uchovávanie? Ako dlho (napr. minimum 5 rokov pre dáta, ktoré sú podkladom pre publikácie)?
- Ktoré z množstva získaných dát majú byť uchovávané dlhodobo a ktoré majú byť zničené/vymazané?
Nástroje a príručky na tvorbu DMP
Pokyny na manažment dát pri projektoch Horizont Europe nájdete na v príručke HE Programme Guide
Viac informácií aj na stránke Otvorená veda v Európe.
Nástroje:
Príklady plánov manažmentu dát
Príklady DMP z jednotlivých vedných odborov
Prírodné vedy
Biodiversity loss in freshwaters under changing environment – lessons from island diatoms
- analýza zozbieraných kvantitatívnych dát o rozsievke, dát o charaktere prostredia a kvantitatívnych dát o ekosystéme v exceli (xls),
- veľkosť dát do 50 MB,
- dáta možno publikovať na základe princípov FAIR.
Technické vedy
Design of a low-cost 3D head scanner
- analýza dát z 3D skenovania (stl), dát o pacientoch (csv), foto a video zdroje (jpeg, mp4),
- veľkosť dát do 250 GB,
- citlivé dáta (zahrňujúce pohlavie, vek a ochorenie) budú so súhlasom účastníka projektu zverejnené alebo budú po skončení projektu zničené. Ostatné dáta budú verejne dostupné.
Lekárske a zdravotnícke vedy
- analýza zozbieraných klinických dát (sav), obrázky z MRI (jpeg) a iné dokumenty (doc),
- citlivé dáta nebudú pri zverejnení použité, ostatné budú otvorene prístupné.
Pôdohospodárske vedy
- analýza zozbieraných dát od producentov kráv (napr. dáta o antimikrobiálnych látkach), vzorky výterov, dáta od veterinárov,
- dáta budú v textových (xls), obrazových (jpeg) alebo v numerických (xls) formátoch,
- veľkosť dát do 1 GB,
- citlivé dáta (údaje o chovateľoch) budú po 1 roku zničené, ostatné budú zverejnené po publikovaní štúdie otvorene pod licenciou CC BY SA.
Spoločenské vedy
Worlding Public Cultures: The Arts and Social Innovation
- analýza textových (pdf, docx), obrazových (png) a audio-vizuálnych materiálov (mp3, mp4),
- dáta, ktoré nemožno publikovať kvôli ochrane súkromia (GDPR) publikované nebudú, ostatné budú uložené v archíve na základe princípov FAIR a s licenciou CCBY.
Humanitné vedy
The Italian saxophone – a new instrument for an old musical tradition
- analýza dát zhromaždených z hudobných partitúr, článkov, kníh a geografické a chronologické dáta zhromaždené v súlade s autorskými právami,
- všetky dáta budú zdieľané otvorene po zverejnení a recenznom konaní.
Príklady DMP Technickej univerzity v Gdaňsku
Humanitné vedy (humanities)
Technické vedy (engineering and technology)
Lekárske vedy (medical and health sciences)
Spoločenské vedy (social sciences)
Zdroje a ďalšie odporúčané materiály na štúdium
- Ako vytvoriť plán manažmentu vedeckých dát. Prezentácia je dostupná na Zenode.
- Zefektívni svoj výskum: manažment výskumných dát. Prezentácia je dostupná na Zenode.
- Manažment vedeckých dát a príklad dobrej praxe na Slovensku: digitálny repozitár Katedry mediamatiky a kultúrneho dedičstva na Žilinskej univerzite. Prezentácia je dostupná na Zenode.
- University of Oslo Library. Data management planning.
- Dánsky online kurz o dôležitosti dobrého manažmentu dát v anglickom jazyku – kurz je rozdelený do troch nezávislých modulov. Každý modul pozostáva z 20-minútového videozáznamu (vrátane animácií a rozhovorov), ktorý môžu účastníci absolvovať vlastným tempom a ktoré môže byť doplnený osobným školením. Cieľovou skupinou kurzu sú doktorandi, výskumní pracovníci a pracovníci podpory výskumu, ktorí sa chcú oboznámiť so všeobecnými pojmami a termínmi používanými pri manažment výskumných údajov. Kurz však môžu absolvovať aj iní záujemcovia, je otvorený pre všetkých.
- Research Data Management – RDM – Maastricht University.
- Otvorená veda v Európe
Obrázky – zdroje
- Obrázok „Otáznik“: Image by Peggy und Marco Lachmann-Anke from Pixabay
- Obrázok „Plán manažmentu dát“: Obrázok adaptovaný podľa pôvodného obrázku od UiO: University of Oslo Library
- Obrázok „Výkričník“: zdroj
- Obrázok „Thought-symbol-blackboard-think-business-lamp-1379760-pxhere.com“: zdroj, CC0 Public Domain
- Obrázok „Tools icon“: Manjiro5, CC0, via Wikimedia Commons
- Obrázok „Example“: Example icons created by Freepik – Flaticon
- Obrázok „Webinar“: Webinar icons created by nawicon – Flaticon
- Logá v časti Nástroje a príručky na tvorbu DMP – printscreeny z webových stránok