Une nouvelle ressource sémantique répondant aux principes de la science ouverte : le thésaurus de la viande comme outil informatique de dialogue entre les acteurs de la filière.
INTRODUCTION
I. MATERIELS & METHODES
Le passage du dictionnaire de sa forme documentaire au thésaurus sous une forme structurée a été réalisé en trois phases : 1) l’analyse des données aboutissant au choix du standard pour représenter les informations contenues dans le thésaurus, à savoir le modèle SKOS, 2) la transformation des données, réalisée de manière semi-automatique, et 3) un travail intellectuel et manuel d’organisation des concepts au sein des hiérarchies.
I.1. Choix du modèle SKOS (standard pour représenter les systèmes simples d’organisations des connaissances).
La création du Thésaurus de la viande s’appuie sur les termes du Dictionnaire de la Viande de l’Académie de la viande. Le fichier des données sources est un document Word qui contient 1357 entrées et des encadrés. Ces derniers ne sont pas conservés dans le thésaurus car ils ne contiennent pas de définitions. La structure pour décrire une entrée du dictionnaire est plutôt régulière (Figure 3), ce qui permet d’automatiser une partie des traitements, travail rendu cependant difficile par la présence d’un grand nombre d’éléments facultatifs. Le terme est suivi de ses caractéristiques grammaticales (sa nature, son genre et son nombre) et d’une définition comme dans l’exemple montré Figure 4. Certaines entrées présentent un ou plusieurs Synonymes, des Notes, ou encore un renvoi vers une ou plusieurs autres entrées indiquées par la mention Voir.
Figure 3 : Structure d'une entrée du dictionnaire
terme (obligatoire) nature.genre.nombre (facultatif) I définition (facultatif) | Pour aller plus loin : (facultatif) | Synonyme : (facultatif) | Notes : (facultatif) | Voir : nom (facultatif, plusieurs valeurs possibles séparées par des virgules ou des points) |
Figure 4 : Exemple d'une entrée du dictionnaire : emboucheur
emboucheur n.m. I Éleveur ou marchand qui pratique l’engraissement du bétail à l’herbe sur des pâtures. I Synonyme : herbager. I Voir : Embouche. |
Cette analyse des données textuelles nous a conduits à choisir le modèle SKOS (Simple Knowledge Organisation System), un standard du W3C (https://www.w3.org/) utilisé pour représenter des systèmes d’organisation des connaissances simples, typiquement les thésaurus. Ce modèle s’appuie sur RDF (Resource Description Framework), un cadre de description de données structuré sous forme de graphes, qui permet de faire des assertions de la forme [Sujet – Prédicat – Objet] comme montré dans la Figure 5 (ou par exemple, le concept « C1 » "est désigné par" le terme « emboucheur »).
Figure 5 : Exemples de représentation d’informations sous la forme [Sujet – Prédicat – Objet] ou triplets RDF
Un identifiant unique appelé URI permet de faire référence à chaque élément décrit dans la base de données. Cet identifiant est composé d’un préfixe unique pour le thésaurus (ici http://opendata.inrae.fr/ThViande/) et d’un suffixe unique pour chaque ressource décrite (par exemple C1 pour le concept 1). L’URI est un identifiant global, i.e. unique dans tout l’espace du web. Comme le montre la Figure 6, l’objet central de notre modèle est le concept (skos:Concept) qui peut être vu comme une unité de pensée correspondant à un type d’objet du monde réel (ex : troupeau) ou à une entité abstraite (ex : transhumance). Il est désigné par un terme préférentiel (skos:prefLabel) dans une ou plusieurs langues et éventuellement des synonymes (skos:altLabel). La langue des termes est identifiée. Pour indiquer une définition, on utilise la propriété skos:definition. Les mentions « Voir » entre deux entrées du dictionnaire source sont traduites par la relation skos:related entre les deux concepts dans le thésaurus, par exemple [emboucheur] skos:related [embouche]. Au sein du thésaurus (skos:ConceptScheme), les concepts sont organisés sous la forme d’une hiérarchie au moyen des relations skos:narrower (concept plus spécifique) et skos:broader (concept plus générique). On aura par exemple : [éleveur] skos:narrower [emboucheur]. Cette structuration hiérarchique n’existait pas dans le dictionnaire et a fait l’objet d’un travail que nous décrivons ultérieurement. Le modèle SKOS présente d’autres propriétés et relations non utilisées que nous ne détaillons pas ici.
Figure 6 : Modèle des données du thésaurus basé sur SKOS, SKOS-XL et LexInfo
I.2. Conversion du dictionnaire de sa forme textuelle en une ressource structurée et formalisée.
I.3. Structuration et hiérarchisation des données
Cette partie entièrement manuelle du travail a consisté à passer d’une représentation centrée sur les termes (dictionnaire) à une structuration centrée sur les concepts (thésaurus), et à en proposer une organisation thématique. Cette tâche nécessitait des connaissances approfondies du domaine qui ont été apportées par quatre experts, deux étant de l’Académie de la Viande et deux autres d’INRAE. Les experts de l’Académie de la Viande ont apporté des connaissances sur les découpes, les cuissons, les métiers et les spécificités de la filière ainsi que sur les différentes races d’animaux de boucherie. Les experts INRAE ont apporté des connaissances sur la biologie des muscles. Environ 32 réunions de 2 heures chacune se sont tenues pour ce travail. Dans certains cas, les experts se sont appuyés sur d’autres sources de connaissances telles que l’ontologie AHOL (Salaun et al., 2020) ou le dictionnaire du CIRAD (https://opendata.inra.fr/AHOL/page/AHOL_0005001).
Dans un thésaurus, et plus généralement en SKOS, un concept ne représente qu’une notion explicitée dans la définition. Dans le dictionnaire au contraire, l’entrée est centrée sur le terme qui peut correspondre à plusieurs notions et donc avoir plusieurs définitions. Ainsi, par exemple, alors que « charcuterie » est un commerce sous le concept « métier de la filière viande », il peut aussi être une déclinaison du concept « préparation culinaire des viandes ». Pour répondre à la contrainte d’univocité de SKOS, certaines entrées du dictionnaire ont dû être scindées en 2 concepts et leur définition modifiée en conséquence. Dans ce cas, il a fallu faire une distinction entre les 2 concepts en apportant des précisions entre parenthèses : « charcuterie (commerce) » et « charcuterie (salaison) ».
A l’inverse, certaines entrées du dictionnaire n’ont pas été reprises comme par exemple les termes VOF (Viande Ovine Française), VBF (Viande Bovine Française), VPF (Viande Porcine Française) pour ne garder que des labels officiels reconnus par l’INAO (https://www.inao.gouv.fr/Les-signes-officiels-de-la-qualite-et-de-l-origine-SIQO).
D’autres concepts ont été introduits pour répondre aux besoins de la hiérarchisation et assurer une certaine cohérence au sein du thésaurus. En particulier, les concepts de premier niveau (appelés « top concept » en SKOS) devaient être assez génériques pour constituer des catégories thématiques comme élevage ou métiers de la filière viande. Les ontologies AHOL - Animal Health Ontology for Livestock (https://www.atol-ontology.com/en/a-ahol/) et ATOL - Animal Trait Ontology for Livestock (Le Bail et al., 2014) ont été utilisées comme sources pour la création de concepts initialement absents du dictionnaire de la viande.
Afin d’organiser les concepts sous forme de hiérarchie au sein de chaque branche, les experts se sont basés sur les termes génériques mentionnés dans les définitions ou ont mobilisé leur propre expertise. Dans certains cas, le concept pouvait être placé à plusieurs endroits de la hiérarchie, comme par exemple le concept quartier pouvant être considéré comme spécifique de découpe ou demi-carcasse. Dans ce cas, il a été décidé qu’il était plus pertinent de le positionner comme un spécifique de demi-carcasse afin de rendre sa sémantique plus explicite. Dans d’autres cas, le concept le plus générique a été choisi. Par exemple, la branche « animal de boucherie » a été choisie pour englober tous les animaux abattus pour leur viande. Pour cette première version du thésaurus, nous avons choisi de ne pas introduire de polyhiérarchie, organisation dans laquelle un concept peut avoir plusieurs génériques. Si ce choix rend le travail de classification plus difficile (parce qu’il faut trancher), il le rend aussi plus précis (parce qu’il faut trouver la place la plus optimale).
Le travail de hiérarchisation a été complété par une révision de certaines définitions qui contenaient des éléments superflus ou sujets à évolution, ou encore contraires aux bonnes pratiques de rédaction des définitions (Vézina, 2009). Suite à la hiérarchisation, les relations skos:related (« Voir ») présentes dans le dictionnaire papier ont été supprimées entre les concepts entretenant dès lors une relation hiérarchique.
II.1. Un thésaurus couvrant les grands domaines de la filière viande.
II.2. Une ressource FAIR
Afin de permettre sa réutilisation par des tiers, le thésaurus de la Viande est mis à la libre disposition de la communauté sur un portail public, Agroportal, et dans un format ouvert : http://agroportal.lirmm.fr/ontologies/MEAT-T (onglet Classes pour voir la hiérarchie). Il s’inscrit dans la démarche FAIR (Tableau 1) dont les principes offrent un cadre pour s’assurer qu’une ressource numérique puisse être réutilisée par d’autres (humains et machines). Des solutions proposées par le service Vocabulaires Ouverts de la DipSO INRAE ont été combinées afin que le thésaurus de la viande soit autant que possible conforme aux principes FAIR.
L’analyse proposée dans le Tableau 1 a été réalisée dans le cadre du projet ANR FooSIN (https://foosin.fr/) et du questionnaire développé par le groupe de travail RDA SHARC (David et al., 2020).
Tableau 1 : le thésaurus de la Viande au crible des principes FAIR et solutions adoptées
III.1. Le thésaurus de la viande pour l’indexation des bases de données
III.2. Utilisation du thésaurus pour la construction d’une ontologie
III.3. Enrichissement de l’ontologie par les spécificités françaises
Le thésaurus de la viande représente chaque dimension de la filière viande et ceci présente de nombreux avantages pour toutes les personnes voulant l’exploiter ; notamment des professionnels, des consommateurs ou encore des chercheurs. Il ne permettra pas seulement d’avoir des définitions précises des différents concepts mais aussi de trouver la relation entre eux en fonction des différentes catégories de concepts. Ceci permettra de contribuer à diffuser une meilleure connaissance de la filière, de ses organisations, de ses produits, de sa politique etc. L’avantage de ce thésaurus est de pouvoir également indexer des bases de données et des ressources bibliographiques.
Ce thésaurus englobe différents aspects de la viande : les animaux de boucherie, l’abattage et les découpes, la commercialisation, les préparations culinaires ainsi que la consommation. Les usagers de ce thésaurus peuvent donc avoir des profils différents ; les professionnels de la filière, les chercheurs, les journalistes, les étudiants ou alors les simples consommateurs voulant s’enquérir des spécificités françaises de la filière viande. Toutefois, il devra régulièrement être mis à jour pour une meilleure représentation de la filière qui évolue avec le temps.
Le contenu anglais de ce thésaurus est en cours d’intégration et il servira également de base pour une ontologie. Plus formelle et plus précise que le thésaurus, l’ontologie de la viande permettra de faire un raisonnement sur un aspect particulier de la viande, comme par exemple sur la qualité de la viande.
Références bibliographiques :
AGROVOC. URL http://www.fao.org/agrovoc/fr (consulté le 5.26.21).
Ahol – Livestock Ontologies, URL https://www.atol-ontology.com/en/a-ahol/ (consulté le 1.27.21).
Amdouni E. et Jonquet C. (2021). Une méthodologie et un outil d'évaluation du niveau de " FAIRness " pour les ressources sémantiques : le cas d'AgroPortal. Journées Francophones d’Ingénierie des Connaissances (IC 2021) Plate-Forme Intelligence Artificielle (PFIA'21), Bordeaux, France. 11-19.
Animal Health Ontology for Livestock. URL https://opendata.inra.fr/AHOL/page/AHOL_0005001 (consulté le 6.20.21).
Aubin S., Caracciolo C., Zervas, P. (2017). Landscaping the Use of Semantics to Enhance the Interoperability of Agricultural Data. RDA Agrisemantics Working Group. https://doi.org/10.5281/zenodo.3697332
Baker T., Whitehead B., Musker R., Keizer J. (2019). Global agricultural concept space: lightweight semantics for pragmatic interoperability. Npj Science of Food, 3, 16. https://doi.org/10.1038/s41538-019-0048-6
Blake J.A., Bult C.J., 2006. Beyond the data deluge: Data integration and bio-ontologies. Journal of Biomedical Informatics, 39, 314–320. https://doi.org/10.1016/j.jbi.2006.01.003
Chaudieu G. (1970). Le petit dictionnaire de boucherie et de boucherie-charcuterie. Ed. J. Peyronnet, 1970. 193 p
Chriki S., Picard B., Faulconnier Y., Micol D., Brun J.-P., Reichstadt M., Jurie C., Durand D., Renand G., Journaux L., Hocquette J.-F. (2013). A Data Warehouse of Muscle Characteristics and Beef Quality in France and A Demonstration of Potential Applications. Italian Journal of Animal Science, 12, e41. https://doi.org/10.4081/ijas.2013.e41
Chriki S., Hocquette J.-F. (2020). The Myth of Cultured Meat: A Review. Frontiers in Nutrition, 7, 7. https://www.frontiersin.org/articles/10.3389/fnut.2020.00007/full
David R., Mabile L., Specht A., Stryeck S., Thomsen M., Yahia M., Jonquet C., Dollé L., Jacob D., Bailo D., Bravo H., Gachet S., Gunderman H., Hollebecq J.-E., Ioannidis V., Le Bras Y., Lerigoleur E., Cambon-Thomsen A., Community S. (2020). Templates for FAIRness evaluation criteria - RDA-SHARC ig. https://doi.org/10.5281/zenodo.3922069
Dikeman M., Devine C. (Eds.), (2014). Encyclopedia of meat sciences, 2. ed. Elsevier, Amsterdam.
Dooley D.M., Griffiths E.J., Gosal G.S., Buttigieg P.L., Hoehndorf R., Lange M.C., Schriml L.M., Brinkman F.S.L., Hsiao W.W.L. (2018). FoodOn: a harmonized food ontology to increase global food traceability, quality control and data integration. Npj Science of Food, 2, 23. https://doi.org/10.1038/s41538-018-0032-6
Encyclopedia of Genetics, Genomics, Proteomics and Bioinformatics., Wiley Anal. Sci. URL https://analyticalscience.wiley.com/do/10.1002/sepspec.9780470849743 (consulté le 9.7.21).
FoodOn - Summary | LIRMM AgroPortal., URL http://agroportal.lirmm.fr/ontologies/FOODON (consulté le 6.22.21).
Glatre, E. (2008). Dictionnaire de la viande. BPI, Clichy.
Health T.L.P. (2019). More than a diet. Lancet Planet. Health 3, e48. https://doi.org/10.1016/S2542-5196(19)30023-3
Hocquette J. F., Ellies-Oury M. P., Legrand I., Pethick D., Gardner G., Wierzbicki J. & Polkinghorne R. (2020). Research in Beef Tenderness and Palatability in the Era of Big Data. Meat and Muscle Biology, 4(2), 1-13.
Hocquette J.F., Ellies-Oury M.P., Lherm M., Pineau C., Deblitz C., Farmer L. (2018). Current situation and future prospects for beef production in Europe. Asian-Australasian Journal of Animal Science, 31, 1017-1035.
Hughes L.M., Bao J., Hu Z.-L., Honavar V., Reecy, J.M. (2008). Animal trait ontology: The importance and usefulness of a unified trait vocabulary for animal species. Journal of Animal Science, 86, 1485–1491. https://doi.org/10.2527/jas.2008-0930
IMR3G FOUNATION https://imr3g.org/ (consulté le 6.19.21).
Jonquet C., Toulet A., Arnaud E., Aubin S., Dzalé Yeumo E., Emonet V., Graybeal J., Laporte M.-A., Musen M.A., Pesce V., Larmande P. (2018). AgroPortal: A vocabulary and ontology repository for agronomy. Computers and Electronics in Agriculture, 144, 126–143. https://doi.org/10.1016/j.compag.2017.10.012
LanguaLTM - an international framework for food description - Thesaurus 2014. URL https://www.langual.org/langual_thesaurus.asp?termid=C0120&haschildren=False&owner=C0173&openstr=00000_A0361_A0356_C0116_C0164_C0127_C017 3 (consulté le 5.10.21).
Lauser B., Johannsen G., Caracciolo C., Keizer J., van Hage W.R., Mayr P. (2008). Comparing human and automatic thesaurus mapping approaches in the agricultural domain 10.
Le Bail, P.-Y., Bugeon J., Dameron, O., Fatet, A., Golik, W., Hocquette, J.F., Hurtaud, C., Hue, I., Jondreville, C., Joret, L., Meunier-Salaun, M.C., Vernet, J., Nédellec, C., Reichstadt, M., Chemineau, P., 2014. Un langage de référence pour le phénotypage des animaux d’élevage : l’ontologie ATOL. INRA Productions Animales, 27 (3), 195-208.
Liang A.C., Sini M. (2006). Mapping AGROVOC and the Chinese Agricultural Thesaurus: Definitions, tools, procedures. New Review of Hypermedia and Multimedia, 12, 51–62. https://doi.org/10.1080/13614560600774396
Møller A., Ireland J. (2018). LanguaLTM 2017 - Multilingual Thesaurus. https://doi.org/10.13140/RG.2.2.13274.64964
Nair M.N., Canto A.C.V.C.S., Rentfrow G., Suman S.P. (2019). Muscle-specific effect of aging on beef tenderness. LWT Food Science and Technology, 100, 250–252. https://doi.org/10.1016/j.lwt.2018.10.038
Ontology - an overview | ScienceDirect Topics. URL https://www.sciencedirect.com/topics/computer-science/ontology (consulté le 11.26.20).
Pizzuti T., Mirabelli G. (2013). FTTO: An example of Food Ontology for traceability purpose. https://doi.org/10.1109/IDAACS.2013.6662689
Pizzuti T., Mirabelli G., Grasso G., Paldino G., (2017). MESCO (MEat Supply Chain Ontology): An ontology for supporting traceability in the meat supply chain. Food Control, 72, 123–133. https://doi.org/10.1016/j.foodcont.2016.07.038
Pizzuti T., Mirabelli G., Sanz-Bobi M.A., Goméz-Gonzaléz F. (2014). Food Track & Trace ontology for helping the food traceability control. Journal of Food Engineering 120, 17–30. https://doi.org/10.1016/j.jfoodeng.2013.07.017
Salaun M.-C., Yon J., Le Bail, P.-Y., Reichstadt M. (2020). Animal Health Ontology for Livestock. https://doi.org/10.15454/KKZ3TS
Seman D.L., Boler D.D., Carr C.C., Dikeman M.E., Owens C.M., Keeton, J.T., Pringle, T.D., Sindelar, J.J., Woerner, D.R., de Mello, A.S., Powell, T.H. (2018). Meat Science Lexicon. Meat and Muscle Biology, 2, 1. https://doi.org/10.22175/mmb2017.12.0059
Shrestha R., Matteis L., Skofic M., Portugal A., McLaren G., Hyman G., Arnaud E. (2012). Bridging the phenotypic and genetic data useful for integrated breeding through a data annotation using the Crop Ontology developed by the crop communities of practice. Frontiers in Physiology, 3. https://doi.org/10.3389/fphys.2012.00326
Trypuz R., Piotr K. P., Wierzbicki J., Woźniak A., Carlhian B. (2014). Vers des standards automatisés dans la production de viande ? Utilisation de l’ontologie pour la présentation et l’implantation des standards dans la production de viande. Viandes & Produits Carnés, VPC-2014-30-4. http://www.viandesetproduitscarnes.fr/phocadownload/vpc_vol_30/3041_kulicki_standards_automatises_production_
Vézina R., Office québécois de la langue française. (2009). La rédaction de définitions terminologiques. Office québécois de la langue française, Québec.
Welcome to the Thesaurus and Glossary | NAL Agricultural Thesaurus and Glossary. URL https://agclass.nal.usda.gov/ (consulté le 6.20.21a).
Welcome to the Thesaurus and Glossary | NAL Agricultural Thesaurus and Glossary. URL https://agclass.nal.usda.gov/ (consulté le 6.24.21b).
Wilkinson M.D., Dumontier M., Aalbersberg Ij.J., Appleton G., Axton M., Baak A., Blomberg N., Boiten J.-W., da Silva Santos L.B., Bourne P.E., Bouwman J., Brookes A.J., Clark T., Crosas M., Dillo I., Dumon O., Edmunds S., Evelo C.T., Finkers R., Gonzalez-Beltran A., Gray A.J.G., Groth P., Goble C., Grethe J.S., Heringa J., ’t Hoen P.A.C., Hooft R., Kuhn T., Kok R., Kok J., Lusher S.J., Martone M.E., Mo,ns A., Packer A.L., Persson B., Rocca-Serra P., Roos M., van Schaik R., Sansone S.-A., Schultes E., Sengstag T., Slater T., Strawn, G., Swertz, M.A., Thompson, M., van der Lei, J., van Mulligen, E., Velterop, J., Waagmeester A., Wittenburg P., Wolstencroft K., Zhao, J., Mons B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientic Data 3, 160018. https://doi.org/10.1038/sdata.2016.18
World Wide Web Consortium (W3C). URL https://www.w3.org/ (consulté le 6.20.21).