Séminaire Scientifique et Technique de l’UR PROSE
June 30, 2023
In the past Science today
Baker (2016)
According to the UNESCO Recommendation, open science is a set of principles and practices that aim to make scientific research from all fields accessible to everyone for the benefit of scientists and society as a whole. The Recommendation aims to ensure not only that scientific knowledge is accessible but also that the production of that knowledge itself is inclusive, equitable and sustainable.
By promoting science that is more accessible, inclusive and transparent, open science furthers the right of everyone to share in scientific advancement and its benefits, as stated in Article 27.1 of the Universal Declaration of Human Rights.
Following this approach, we found that the annual cost of not having FAIR research data costs the European economy at least €10.2bn every year
European Commission and Directorate-General for Research and Innovation (2019)
Factual records
Primary sources for scientific research
Necessary to validate research findings
This Recommendation principally concerns research data in a digital, computer-readable format.
OL
★ : Open LicenseRE
★ : machine REadableOF
★ : Open FormatURI
★ : Uniform Resource IdentifierLD
★ : Linked DataKeep track of your experiments and collaborate with your team easily!
In essence, a standard is an agreed way of doing something. A standard provides the requirements, specifications, guidelines or characteristics that can be used for the description, interoperability, citation, sharing, publication, or preservation of all kinds of digital objects such as data, code, algorithms, workflows, software, or papers.
Open File Formats are file formats that are published and freely available for anyone to use. A file format is a standard way of encoding storage of computer information. Open file formats can be contrasted with proprietary, protected file formats. Open file formats are often recommended for preservation purposes because they typically do not require special software to open.
Open | Closed | |
---|---|---|
Textes | txt , odf , rtf |
doc , pages |
Images | png , jpg , gif , svg |
tiff |
Spreadsheets | csv , ods |
xls |
Archives | tar , zip |
rar |
Not all proprietary formats are closed. For example, Adobe’s
Personal data is “any information relating to an identified or identifiable person”.
The spreadsheet software Microsoft Excel, when used with default settings, is known to convert gene names to dates and floating-point numbers. A programmatic scan of leading genomics journals reveals that approximately one-fifth of papers with supplementary Excel gene lists contain erroneous gene name conversions.
md5sum
)Explaining to justify and understand
Redo to check, correct and reuse
git
)The two major use cases and drivers for what to keep are Research Integrity and Reproducibility (availability of the data supporting the findings in research) ; and the Potential for Reuse (availability of data for sharing with other users)
Beagrie (2019)
[I.]
Lorsqu’un écrit scientifique issu d’une activité de recherche financée au moins pour moitié par des dotations de l’État, (…) son auteur dispose, (…) du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, sous réserve de l’accord des éventuels coauteurs, la version finale de son manuscrit acceptée pour publication, (…) à l’expiration d’un délai courant à compter de la date de la première publication. Ce délai est au maximum de six mois pour une publication dans le domaine des sciences, de la technique et de la médecine (…).
[II.]
Dès lors que les données issues d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, (…) ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques (…) leur réutilisation est libre.
[Art. 1]
L’intégrité scientifique se définit comme l’ensemble des règles et valeurs qui doivent régir les activités de recherche pour en garantir le caractère honnête et scientifiquement rigoureux.
[Art. 2]
Les établissements publics et fondations reconnues d’utilité publique promeuvent la diffusion des publications en accès ouvert et la mise à disposition des méthodes et protocoles, des données et des codes sources associés aux résultats de la recherche afin d’en garantir la traçabilité et la reproductibilité.
[Art. 6]
Ils veillent à la mise en œuvre par leur personnel de plans de gestion de données et contribue aux infrastructures qui permettent la conservation, la communication et la réutilisation des données et des codes sources.
Olivier et al. (2022)
Without a licence, data is not truly open.
HAL INRAE is the open access repository, visible by everyone, for depositing and consulting the scientific production.
Un Data Management Plan (DMP) est un document formalisé explicitant la manière dont seront obtenues, documentées, analysées, disséminées et archivées les données produites au cours et à l’issue d’un processus ou d’un projet de recherche.
Il est un outil pour gérer les données tout au long du projet en intégrant la notion de cycle de vie.
La gestion des données n’est pas une fin en soi, mais le moyen de conduire à la découverte de connaissances et d’innovations par l’intégration et la réutilisation des connaissances produites.
Reymonet et al. (2018)
PGD
Plan de Gestion de Données
PGD
Pour Générer du Dialogue
OpenScience & OpenData – 2023-06-30