Biblioteka Otwarte dane badawcze
- Definicja
- Korzyści udostępniania danych badawczych
- Zasady FAIR
- Plan zarządzania danymi badawczymi
- Plan zarządzania danymi badawczymi - wytyczne
- Repozytoria danych badawczych
- Materiały dodatkowe
- Najważniejsze pojęcia
Definicja
Dane badawcze to wszystkie dane wytworzone podczas projektu badawczego, którego celem było uzyskanie oryginalnych wyników naukowych. Dane badawcze (w zależności od dyscypliny której dotyczą) mogą być bardzo różnorodne, są to np.: dokumenty tekstowe, ankiety, dane liczbowe, modele matematyczne, nagrania audio i video, zdjęcia, algorytmy, wyniki symulacji komputerowych, protokoły laboratoryjne, opisy metodologiczne itp.
Otwarte dane badawcze to dane dostępne za pośrednictwem internetu, upowszechniane bez żadnych ograniczeń. Oznacza to, że możne je wykorzystywać bez ponoszenia opłat oraz bez istotnych ograniczeń technicznych i prawnych. Dane powinny być tak otwarte, jak to możliwe i na tyle zamknięte, na ile to jest konieczne.
Otwieranie danych daje możliwość weryfikacji wyników oraz powtórnego ich wykorzystania. Należy pamiętać, że udostępnienie danych badawczych nie jest tożsame z opublikowaniem pracy, w której zostały opisane wyniki badań/eksperymentu.
Nie wszystkie zbiory danych mogą posiadać otwarty charakter, w szczególności dotyczy to danych osobowych, komercjalizacji wyników badań oraz bezpieczeństwa narodowego.
Informacja o istnieniu danych zawsze powinna być publicznie dostępna, co pozwala uniknąć duplikacji badań.
Korzyści udostępniania danych badawczych
• lepsza komunikacja i wymiana informacji pomiędzy specjalistami reprezentującymi różne dyscypliny nauki;
• możliwość przeprowadzania analiz opartych o unikalne dane, których nie można ponownie zebrać;
• zwiększenie liczby cytowań zarówno samych danych, jak i publikacji na nich opartych;
• wzrost wiarygodności i transparentności naukowca;
• możliwość oceny rzetelności prowadzonych badań;
• możliwość wykorzystania istniejących zasobów i obniżenia kosztów badań.
Zasady FAIR
Opracowano wytyczne odpowiedniego opracowania i udostępniania danych, które powinny być:Findable – możliwe do odnalezienia (łatwo wyszukiwane i znajdowane),
Accessible – dostępne (np. w repozytorium danych),
Interoperable – interoperacyjne (opisane w odpowiednim standardzie oraz z zastosowaniem prawidłowej metodologii),
Reusable – możliwe do ponownego użycia (udostępnione do wielokrotnego użycia na odpowiedniej licencji).
Zasady FAIR zostały stworzone aby uczynić dane dostępnymi zarówno dla użytkowników jak i oprogramowania komputerowego przeszukującego bazy danych bez udziału człowieka.
**********
Więcej o FAIR Data: Inicjatywa FAIRdata.
Plan zarządzania danymi badawczymi
Plan można sporządzić na podstawie dostępnego wzoru. Powinien uwzględniać zasady FAIR oraz odnosić się do następujących elementów:
- opis danych badawczych,
- standardy i metadane,
- trwałe identyfikatory,
- organizacja i przechowywanie danych,
- udostępnianie danych,
- zarządzanie innymi rezultatami badań,
- koszty i zespół zaangażowany w zarządzanie danymi.
**********
NCN udostępnia wytyczne, instrukcję, odpowiedzi na pytania odnośnie przygotowania DMP.
DMPTool - narzędzie online służące tworzeniu planów zarządzania danymi wraz z przykładami (dostosowane do wymagań amerykańskich grantodawców).
DMPonline - kreator planów zarządzania danymi badawczymi zawierający bazę instytucji finansującej naukę z Wielkiej Brytanii.
Checklist for a Data Management Plan – lista kontrolna ułatwiająca sprawdzenie poprawności przygotowanego DMP.
Programme Guide - Przewodnik Horyzont Europa z dnia 11.04.2022
AGA Annotated Model Grant Agreement EU Funding Programmes 2021-2027 - Szczegółowa umowa o dotację 2021-2027
Plan zarządzania danymi badawczymi-wytyczne
Wytyczne do Planu zarządzania danymi badawczymi - Akademia Morska w SzczeciniePrzykładowy plan zarządzania danymi badawczymi
Repozytoria danych badawczych
Dane badawcze udostępne są poprzez różne repozytoria (dziedzinowe, instytucjonalne itd.), np.:
- RepOD – repozytorium Otwartych Danych opracowane przez ICM UW. W ramach działań Platformy Otwartej Nauki archiwizuje i udostępnia wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone dla tzw. małych danych.
- Zenodo – międzynarodowe repozytorium danych badawczych. Umożliwia naukowcom ze wszystkich obszarów wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi. Przeznaczone dla tzw. małych danych. Opracowane dzięki inicjatywie OpenAIRE i CERN.
- Repozytoria danych badawczych NIH – amerykański National Institutes of Health współtworzy i promuje wiele specjalistycznych repozytoriów danych badawczych, spośród których wiele udostępnia tzw. duże dane zebrane w ramach konkretnych projektów. Na stronie NIH znajduje się tabela opisująca poszczególne repozytoria, informująca o ich stopniu otwartości i procedurach umieszczania w nich danych.
- Most Danych – przedsięwzięcie, w ramach którego na Politechnice Gdańskiej utworzone zostanie instytucjonalne repozytorium otwartych danych badawczych, które służyć będzie nie tylko PG, ale także konsorcjantom: Uniwersytetowi Gdańskiemu oraz Gdańskiemu Uniwersytetowi Medycznemu. Możliwe będzie rozszerzenie dostępu do platformy na inne uczelnie w regionie i kraju.
Wyszukiwarki ułatwiające wybór odpowiedniego repozytorium:
- re3data.org (Registry of Research Data Repositories) to globalna wyszukiwarka repozytoriów danych badawczych. Gromadzi dane badawcze ze wszystkich dyscyplin akademickich. Umożliwia wyszukiwanie repozytoriów według dziedziny wiedzy, kraju oraz typu danych badawczych.
- OpenDOAR – międzynarodowa baza indeksująca biblioteki cyfrowe, repozytoria instytucjonalne i repozytoria danych badawczych. Baza umożliwia wyszukiwanie samych repozytoriów, jak i przeszukiwanie ich zasobów.
- Repository Finder Tool - wyszukiwarka stworzona w ramach projektu: AGU’s Enabling FAIR Data Project. Rozwijana przez zespoły DataCite i re3data.org,
Materiały dodatkowe
Broszura informacyja "Otwarte Dane Badawcze" (Akademia Morska w Szczecinie)Plan zarządzania danymi badawczymi - najczęściej zadawane pytania (Narodowe Centrum Nauki)
Przewodnik praktyczny dotyczący ujednoliconych europejskich praktyk związanych z zarządzaniem danymi naukowymi (Science Europe). Przewodnik polecany przez NCN.
Przewodnik opracowany przez europejskie konsorcjum CESSDA (Consortium of European Social Science Data Archives)
Podręcznik on-line o zarządzaniu danymi badawczymi
Podręcznik on-line o otwartym dostępie i zarządzaniu danymi badawczymi
Ramowy Program Horyzont Europa - pierwsze kroki
Horyzont Europa - kolejny program inwestycyjny UE w zakresie badań naukowych i innowacji 2021-2027
Otwarta nauka w programie Horyzont Europa - umowa grantowa
Przewodniki Komisji Europejskiej:
Programme Guide - Przewodnik Horyzont Europa z dnia 11.04.2022
Poradniki i prezentacje Platformy Otwartej Nauki (ICM UW):
- Selekcja i przygotowanie danych badawczych do udostępniania (CC-BY Wojciech Fenrich)
- Jak korzystać z zasobów w repozytoriach danych (CC-BY Natalia Gruenpeter)
- Prawne aspekty otwierania danych badawczych – poradnik (CC-BY Krzysztof Siewicz, Nikodem Rycko)
- Udostępnianie danych badawczych – zagadnienia prawne (CC-BY Nikodem Rycko)
- Zarządzanie danymi badawczymi (CC-BY Natalia Gruenpeter)
- Dane badawcze w pigułce - poradnik (CC-BY Opracowanie: zespół PPM)
Kursy online:
MANTRA – darmowy kurs dla studentów, naukowców i bibliotekarzy stworzony w Uniwersytecie w Edynburgu,
Modele metadanych:
Research Data Alliance (RDA) Metadata Standards - katalog standardów metadanych RDA.
FAIRsharing - wyszukiwarka standardów i metadanych powiązana z repozytoriami dziedzinowymi
Digital Curation Centre Standards - lista szeroko stosowanych standardów metadanych.
Najważniejsze pojęcia
Data management plan – zob. plan zarządzania danymi.
DMP – zob. plan zarządzania danymi.
FAIR – akronim słów „findable” , „accessible” , „interoperable” i „reusable”, określający wymogi, jakie powinny spełniać udostępnione dane badawcze.
Licencja – upoważnienie do korzystania w określony sposób z utworu lub bazy danych. Przedmiotem licencji może być na przykład zbiór danych badawczych.
Licencje Creative Commons – popularne wzory licencji opracowane przez organizację Creative Commons.
NCN - Narodowe Centrum Nauki.
ORCID (Open Reserch and Contributor ID) - cyfrowy identyfikator służący do jednoznacznej identyfikacji autorów publikacji naukowych.
Repozytorium - system informatyczny umożliwiający przechowywanie publikacji naukowych lub danych badawczych oraz ich udostępnianie przez Internet.