[Esip-soil-informatics] FW: Launching the BIODIVERSITY THESAURUS version 2.0

Todd-Brown, Kathe kathe.toddbrown at essie.ufl.edu
Tue Aug 9 10:46:49 EDT 2022


FYI This biodiversity resource sounds neat!
-Kathe

----
Kathe Todd-Brown
(she/they)
Assistant Professor
Environmental Engineering Sciences
University of Florida

From: agroportal-users-request at lirmm.fr <agroportal-users-request at lirmm.fr> on behalf of VACHEZ, Dominique <Dominique.VACHEZ at inist.fr>
Date: Tuesday, August 9, 2022 at 09:49
To: [[removed for brevity]]
Subject: [agroportal-users] Launching the BIODIVERSITY THESAURUS version 2.0
Dear users and specialists in semantics for ecology and biodiversity,

We are pleased to announce the release of the new edition 2.0 of the Biodiversity Thesaurus. It is the result of a complete revision of the previous version 1.2 (managed with VocBench3 editor), and is still fully bilingual.
The 827 concepts are grouped in 82 collections, by semantic categories, thematic fields and EBV classes (essential biodiversity variables) and concern all terrestrial and aquatic ecosystems.
Version IRI: http://data.loterre.fr/ark:/67375/BLH/2.0  ; permalink (SKOS): https://www.loterre.fr/biodiversite-2/

Compared to the 2020 version, it has been enriched by 212 concepts, 1000 alternative/synonymous terms and 2450 hidden terms, with a redesigned hierarchical structure, reducing the number of top-level concepts by half. Sources of definitions have been checked and updated, with additional notes for polysemous terms or emerging concepts. Alignments (made with OnAGUI) were completed with recent versions of AGROVOC (2022) and GEMET (2021)] and achieved with two new semantic resources: ENVTHES thesaurus and ENVO ontology.
The thesaurus V.2.0 is freely browsable and downloadable (SKOS-RDF/XML, SKOS-Turtle, CSV<https://www.loterre.fr/science-de-la-vie-sante/biodiversite/>, PDF<https://www.loterre.fr/wp-content/uploads/2022/07/Biodiversite_eng.pdf>) on Loterre<https://skosmos.loterre.fr/BLH/en/> platform (Linked open terminology resources) with multilingual Skosmos UI displaying groups/collections.
It is made available (BIODIVTHES) on AgroPortal<http://agroportal.lirmm.fr/ontologies/BIODIVTHES> (English search only) and LifeWatch EcoPortal<http://ecoportal.lifewatch.eu/ontologies/BIODIVTHES> (English/French search), both showing hidden labels but not displaying collections.
The metadata are also accessible via FAIRsharing<https://fairsharing.org/FAIRsharing.A29ckB>, BARTOC and the I-ADOPT Catalogue of Terminologies<https://i-adopt.github.io/terminologies/>.
This new version has been recorded as a lexical/conceptual resource in the European Language Grid<https://live.european-language-grid.eu/catalogue/lcr/13067> platform and added in Ortolang<https://hdl.handle.net/11403/tbiodiversite> repository.

As a domain-specific terminology  with an interdisciplinary scope, Biodiversity Thesaurus is positioned at an intermediate level between general multilingual vocabularies and specialized/monolingual databases vocabularies. For this reason, it can constitute a bridge of thematic/overarching concepts contributing towards harmonization and mapping of semantic assets on ecology and biodiversity, and thus fostering semantic annotation and data integration.
Leveraging its bilingualism and synonymic richness, this could be done through alignment functionalities with other environmental terminologies in EcoPortal or AgroPortal.
The hierarchical relationships between concepts are intended to be only generic, partitive or instantial (in accordance with ISO 25964), which brings it closer to a knowledge organization system or an onto-terminology.

Initially, Biodiversity Thesaurus is a linked open terminology resource facing semantic heterogeneity of biodiversity databases and information systems. It is intended to enrich data description, focusing on the basic key concepts of ecological and environmental entities or parameters related to biodiversity conservation, from gene level to global scale of Earth system. On the other hand, it is not addressing geographical, chemical, soil or taxonomical nomenclatures.
An associated documentation has been archived in HAL: https://hal.archives-ouvertes.fr/hal-02907484v2
(in related file, the recently updated inventory of "Semantic and Terminology Resources in Environmental and Biodiversity Sciences<https://hal.archives-ouvertes.fr/hal-02907484v2/file/RESSOURCES%20SEMANTIQUES%20ET%20TERMINOLOGIQUES%20EN%20SCIENCES%20DE%20L%27ENVIRONNEMENT%20ET%20DE%20LA%20BIODIVERSITE_28.07.2022.pdf>").

The objective is therefore to promote semantic interoperability ("I" of FAIR) and knowledge representation through the use of a controlled vocabulary which itself complies with the FAIR principles (I2 FAIR sub-principle), as defined by the RDA I-ADOPT working group, AgroPortal (Ontology FAIRness evaluator), EcoPortal (S4BioDiv 2021) or by the eLTER network for the FAIRer description of environmental datasets.
See also: https://hal.archives-ouvertes.fr/hal-03264850

Don't hesitate to send us your remarks if you notice any inconsistency or anomaly, so that we can take them into account in a future version and improve its FAIRness.

Kind regards.


Nous avons le plaisir d'annoncer la parution de la nouvelle édition 2.0 (2022) du Thésaurus de la Biodiversité. Elle est le résultat d'une révision complète de la précédente version 1.2. , gérée avec VocBench3, et toujours entièrement bilingue.
Les 827 concepts sont regroupés en 82 collections, par catégories sémantiques, domaines thématiques et classes de VEB (variables essentielles de biodiversité) et concernent tous les écosystèmes terrestres et aquatiques, de l'échelle du gène à celle de l’écosphère.
URI : http://data.loterre.fr/ark:/67375/BLH ; permalien SKOS : https://www.loterre.fr/biodiversite-2/

Par rapport à la version 2020, elle s'est enrichie de 212 concepts, 1000 termes alternatifs/synonymes et 2450 termes cachés supplémentaires, avec une structure hiérarchique refondue, réduisant de moitié le nombre de concepts de plus haut niveau. Les sources des définitions ont été vérifiées et actualisées, accompagnées de notes pour certains termes polysémiques ou des concepts émergents. Les alignements (effectués avec OnAGUI) ont été mis à jour avec les versions récentes d'AGROVOC (2022) et GEMET (2021)] et réalisés avec deux nouvelles ressources sémantiques : ENVTHES et ENVO.
Le thésaurus est librement consultable (interface multilingue Skosmos avec affichage des groupes/collections) et téléchargeable sur la plateforme Loterre<https://skosmos.loterre.fr/BLH/fr/> (formats SKOS-RDF/XML, SKOS-Turtle, CSV<https://www.loterre.fr/science-de-la-vie-sante/biodiversite/>, PDF<https://www.loterre.fr/wp-content/uploads/2022/07/Biodiversite_fre.pdf>).
Il est par ailleurs publié (BIODIVTHES) sur AgroPortal<http://agroportal.lirmm.fr/ontologies/BIODIVTHES> (recherche en anglais) et LifeWatch EcoPortal<http://ecoportal.lifewatch.eu/ontologies/BIODIVTHES> (recherche en français/anglais), tous deux montrant les termes cachés mais sans affichage des collections.
Les métadonnées sont également accessibles sur FAIRsharing<https://fairsharing.org/FAIRsharing.A29ckB>, BARTOC et le catalogue de terminologies I-ADOPT<https://i-adopt.github.io/terminologies/>.
Cette nouvelle version a été enregistrée dans la plateforme de ressources lexicales/conceptuelles European Language Grid<https://live.european-language-grid.eu/catalogue/lcr/13067>, et ajoutée dans le réservoir Ortolang<https://hdl.handle.net/11403/tbiodiversite>.

En tant que thésaurus de domaine à visée interdisciplinaire, il se situe à un niveau intermédiaire entre les vocabulaires généralistes multilingues et ceux des bases de données spécialisées et peut servir de passerelle entre différentes communautés, faciliter l'accès aux portails de métadonnées, favoriser l’annotation et l’intégration des données d’écologie et de biodiversité ou l’indexation sémantique de publications scientifiques.
Il constitue de ce fait une couche de concepts-clés ou généraux susceptibles de contribuer à l'harmonisation et à l’échange de données ouvertes relatives à l’environnement. De plus, en exploitant son bilinguisme et sa richesse synonymique, il est possible de mettre à profit les fonctionnalités d'alignement avec d’autres ressources terminologiques présentes sur EcoPortal ou AgroPortal.
Les relations hiérarchiques entre concepts se veulent uniquement de type générique, partitif ou instance (conformément à ISO 25964), ce qui le rapproche d’un système d’organisation des connaissances ou d’une onto-terminologie.

Ce thésaurus a antérieurement été évalué par le CEFE (INEE) et le CESAB (FRB) au sein du GDR SémanDiv, présenté à divers séminaires et réunions (IndexMed, SIST, LIBER, Agence Française pour la Biodiversité,e-ENVIR) et proposé comme vocabulaire contrôlé dans différents guides de saisie de métadonnées : MITI du CNRS, Data InDoRES (MNHN /BBEES) ou encore le réseau des Zones Ateliers (BED-RZA, Zone Atelier Armorique).
Une documentation associée est déposée dans HAL : https://hal.archives-ouvertes.fr/hal-02907484v2
(en annexe l’inventaire 2022 des « Ressources sémantiques et terminologiques en sciences de l’environnement et de la biodiversité<https://hal.archives-ouvertes.fr/hal-02907484v2/file/RESSOURCES%20SEMANTIQUES%20ET%20TERMINOLOGIQUES%20EN%20SCIENCES%20DE%20L%27ENVIRONNEMENT%20ET%20DE%20LA%20BIODIVERSITE_28.07.2022.pdf> » vient d’être mis à jour).

Le but est donc de favoriser l'interopérabilité sémantique ("I" de FAIR) et la représentation des connaissances, par l'usage d’un référentiel terminologique respectant lui-même les principes FAIR, tels que définis entre autres par le groupe de travail RDA I-ADOPT pour les propriétés observables, AgroPortal (Ontology FAIRness evaluator), EcoPortal (S4BioDiv 2021) ou par le réseau eLTER pour l'annotation des jeux de données environnementales.
(voir aussi : https://hal.archives-ouvertes.fr/hal-03264803)

A ce titre, le thésaurus pourrait s'inscrire dans la démarche du projet GAIA Data visant à développer un dispositif global d’accès à des données, produits et services FAIR, et qui englobera Data Terra ainsi que le PNDB (Pôle national de données sur la biodiversité).
Il peut également intéresser d'autres infrastructures telles que le Système d'information sur la biodiversité (SIB), l’OFB, l’OSU OREME, GBIF-France, ou BiodiFAIRse (GO FAIR).

Enfin, n'hésitez pas à nous transmettre vos remarques si, en tant que spécialistes du domaine ou du web sémantique, vous constatez des incohérences ou des anomalies, de manière à pouvoir en tenir compte dans une prochaine version.

Bien à vous.
Dominique



[cid:image003.jpg at 01D8AC07.234FA3C0]
M. Dominique Vachez
Service Ingénierie terminologique / Terminology Engineering Unit
Département Analyser et fouiller l'information scientifique
Institut de l’Information Scientifique et Technique du CNRS
Inist – CNRS
2, rue Jean Zay
54519 Vandoeuvre-lès-Nancy (France)



-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.esipfed.org/pipermail/esip-soil-informatics/attachments/20220809/75f166d4/attachment-0001.htm>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: image003.jpg
Type: image/jpeg
Size: 2080 bytes
Desc: image003.jpg
URL: <https://lists.esipfed.org/pipermail/esip-soil-informatics/attachments/20220809/75f166d4/attachment-0001.jpg>


More information about the Esip-soil-informatics mailing list