Revue Française de la recherche
en viandes et produits carnés

ISSN  2555-8560

Le Thésaurus de la viande : un nouvel outil accessible à tous

 

Une nouvelle ressource sémantique répondant aux principes de la science ouverte : le thésaurus de la viande comme outil informatique de dialogue entre les acteurs de la filière.
 
elevage agroecologie
Le dictionnaire de la viande (incluant les spécificités de la filière viande française) a servi de base pour construire un thésaurus qui est un outil informatique pour la science ouverte permettant le dialogue et les échanges de données entre les scientifiques mais aussi avec et entre tous les autres acteurs de la filière viande.
 

INTRODUCTION

De par le monde, les filières viande se sont hautement diversifiées par de nouveaux produits et de nouvelles technologies. Malgré une baisse de la consommation en Europe, la production de viande continue de croître au niveau mondial en lien avec une augmentation de la consommation (Hocquette et al., 2018). Ces changements ont apporté une grande variété de produits et de procédés de fabrication, pour lesquels il est devenu nécessaire d’avoir des définitions aussi claires que possible (Seman et al., 2018) et régulièrement mises à jour. En effet, certains termes utilisés dans la filière demeurent ambigus et leur usage peut également varier selon les pays ou entre les acteurs scientifiques, consommateurs, journalistes ou encore industriels (Seman et al., 2018). Cette absence de consensus autour de définitions partagées peut avoir une incidence sur les travaux de recherche, notamment pour les approches de biologie prédictive (Hocquette et al., 2020). Le mot viande fait lui-même l’objet de controverses avec l’apparition de substituts de viande notamment la « viande végétale » préparée à partir de protéines de plantes ou encore la « viande de culture » que certains préfèrent appeler « fibres musculaires » ou « muscle en culture » (Chriki et Hocquette, 2020). 
Diverses ressources ont donc été créées dans l’objectif d’expliciter le vocabulaire du domaine. L’Encyclopedia of Meat Sciences (Dikeman et Devine, 2014), conçue par une équipe internationale d'experts, couvre différents aspects importants comme l'élevage, la physiologie et l'abattage des animaux, la préparation de la viande, l'emballage, le bien-être, la sécurité alimentaire et bien d’autres. En France, les premiers dictionnaires de la viande ont été élaborés par Georges Chaudieu (Chaudieu, 1970), et ultérieurement par Éric Glatre (Glatre, 2008). Puis l’Académie de la Viande (2012) a conçu le dictionnaire de la viande il y a une dizaine d’années. Ce dernier contient des définitions claires et concises sur les noms de découpes, les termes de boucherie professionnelle (y compris les ustensiles), les races des animaux d’élevage, ainsi que les termes techniques ou périphériques, applicables aux animaux d’élevage : bovin, veau, agneau, porc, volaille et gibier. Il répertorie également le lexique relatif au goût et à la texture de la viande, ainsi que l'inventaire de quelques plats français et internationaux traditionnellement faits à base de viande. Enfin, il contient les termes particuliers au commerce de la viande ainsi que les spécificités françaises de la viande telles que les découpes et les organisations de la filière. Il contient 1357 entrées, est disponible en français et en anglais et comprend également quelques termes en espagnol. Sa version la plus récente date de 2019. S’ils font référence, ces trois dictionnaires sont toutefois publiés sous la forme d’ouvrages papier, limités donc à une lecture humaine. La généralisation des approches numériques dans la recherche aussi bien que dans l’industrie induit de nouveaux besoins qui nécessitent l’utilisation de ressources sémantiques au cœur des systèmes d’information. 
Dans le contexte actuel de développement de la Science Ouverte, avec ses enjeux relatifs au transfert de connaissances et à l’innovation, il est plus que jamais nécessaire de disposer de référentiels terminologiques qui facilitent 1) la collaboration entre communautés disciplinaires et linguistiques, 2) la découverte d’information et de données issues de sources variées, 3) le développement de méthodes et d’outils d’aide à la décision s’appuyant sur l’intégration de données hétérogènes et des connaissances du domaine. Pour atteindre les objectifs 2 et 3, ces référentiels doivent être disponibles dans des formats exploitables par des logiciels. 
Les communautés de recherche en agriculture, alimentation et environnement sont particulièrement actives dans la création et la mise à disposition de ces ressources sémantiques comme l’atteste l’étude menée par le groupe de travail Agrisemantics dans le cadre de la « Research Data Alliance » (Aubin et al., 2017). Ces communautés scientifiques s’inscrivent aujourd’hui également dans la démarche FAIR pour « Findable, Accessible, Interoperable, Re-useable », un ensemble de principes déclinés en actions permettant de rendre les données plus Faciles à trouver, plus Accessibles, plus Interopérables et par conséquent plus facilement Réutilisables (Wilkinson et al., 2016). Un des principes FAIR met d’ailleurs les vocabulaires au centre de la démarche : « I2 : Les données et les métadonnées utilisent des vocabulaires qui respectent les principes FAIR. », I2 étant le second principe soutenant l’interopérabilité des données, i.e. la capacité pour les logiciels d’échanger et de traiter des données ayant des représentations hétérogènes car originaires de plusieurs systèmes d’information. Un certain nombre de vocabulaires pour l’agriculture et l’alimentation sont ainsi accessibles depuis des portails publics, dont Agroportal (Jonquet et al., 2018) où est exposé le thésaurus de la Viande. Ce type de portail facilite la découverte d’ontologies et de thésaurus existants, dont la réutilisation concourt à harmoniser les définitions données aux objets manipulés par chaque communauté. 
Parmi les ressources de ce type, disponibles pour le domaine agroalimentaire, on trouve des thésaurus généralistes comme Agrovoc (http://www.fao.org/agrovoc/fr) de la FAO ou le National Agricultural Library Thésaurus (https://agclass.nal.usda.gov/) jusqu’à des ontologies très spécifiques tant par leur contenu que par leur usage comme celles de la communauté Crop Ontology (Shrestha et al., 2012) utilisées en phénotypage végétal. Sur la thématique viande, citons les travaux de Pizzuti et al. (2014, 2017) qui ont porté sur la construction d’ontologies dans le cadre du projet FTTO (Food Track and Trace Ontology) pour représenter la traçabilité dans la filière viande (Figure 1), Citons également le thésaurus Langual (https://www.langual.org) qui fournit un langage standardisé pour la description des aliments, en particulier pour la classification des produits alimentaires en vue de la recherche d'informations. L’ontologie FoodOn (Dooley et al., 2018), qui s’appuie sur Langual, offre une grande couverture thématique sur les aliments (Figure 2) sans être suffisamment précis sur certains aspects qui nous intéressent. Lors de nos recherches, nous n’avons donc pas pu identifier de ressource sémantique qui soit à la fois précise et complète sur la thématique viande, accessible en ligne et qui contienne des termes en français. 
 
Figure 1 : Points de contrôle pour la traçabilité de la viande (Pizzuti et al., 2017)
 
Thesaurus Fig1
 
 
 Figure 2 : Relations ontologiques entre un produit alimentaire et ses qualités descriptives, ses composants et ses processus associés dans le programme FoodOn
 
Thesaurus Fig2
 
En nous inscrivant dans la démarche « Science Ouverte », nous avons souhaité construire et publier le Thésaurus de la Viande en nous appuyant sur le Dictionnaire de l’Académie de la Viande qui nous fournit les termes et définitions en français et en anglais. Un thésaurus est une « liste d'autorité organisée de descripteurs [termes préférentiels ou recommandés] et de non-descripteurs [synonymes] obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives, ou d'équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d'ambiguïté des notions exprimées en langage naturel » (source AFNOR 1981). Le thésaurus constitue une ressource accessible pour des lecteurs humains, avec une structuration logique et des définitions textuelles. En choisissant de le représenter à l’aide du schéma standard SKOS (Simple Knowledge Organization System), et d’y associer des métadonnées riches et des identifiants, nous le rendons également exploitable par des applications informatiques diverses réalisant l’indexation de documents, de jeux de données, l’annotation de contenus, ou encore l’affichage de définitions en contexte. Cette représentation sera décrite dans la prochaine section. 
Dans cet article, nous présentons notre démarche de construction et de publication en ligne du Thésaurus de la Viande par un travail collaboratif entre des spécialistes en ingénierie de connaissances et en sciences et techniques de la viande.
 

I. MATERIELS & METHODES

Le passage du dictionnaire de sa forme documentaire au thésaurus sous une forme structurée a été réalisé en trois phases : 1) l’analyse des données aboutissant au choix du standard pour représenter les informations contenues dans le thésaurus, à savoir le modèle SKOS, 2) la transformation des données, réalisée de manière semi-automatique, et 3) un travail intellectuel et manuel d’organisation des concepts au sein des hiérarchies.

I.1. Choix du modèle SKOS (standard pour représenter les systèmes simples d’organisations des connaissances).

La création du Thésaurus de la viande s’appuie sur les termes du Dictionnaire de la Viande de l’Académie de la viande. Le fichier des données sources est un document Word qui contient 1357 entrées et des encadrés. Ces derniers ne sont pas conservés dans le thésaurus car ils ne contiennent pas de définitions. La structure pour décrire une entrée du dictionnaire est plutôt régulière (Figure 3), ce qui permet d’automatiser une partie des traitements, travail rendu cependant difficile par la présence d’un grand nombre d’éléments facultatifs. Le terme est suivi de ses caractéristiques grammaticales (sa nature, son genre et son nombre) et d’une définition comme dans l’exemple montré Figure 4. Certaines entrées présentent un ou plusieurs Synonymes, des Notes, ou encore un renvoi vers une ou plusieurs autres entrées indiquées par la mention Voir.

Figure 3 : Structure d'une entrée du dictionnaire

terme (obligatoire) nature.genre.nombre (facultatif) I définition (facultatif)
| Pour aller plus loin : (facultatif)
| Synonyme : (facultatif)
| Notes : (facultatif)
| Voir : nom (facultatif, plusieurs valeurs possibles séparées par des virgules ou des points)

Figure 4 : Exemple d'une entrée du dictionnaire : emboucheur

emboucheur n.m. I Éleveur ou marchand qui pratique l’engraissement du bétail à l’herbe sur des pâtures.
I Synonyme : herbager.
I Voir : Embouche.

Cette analyse des données textuelles nous a conduits à choisir le modèle SKOS (Simple Knowledge Organisation System), un standard du W3C (https://www.w3.org/) utilisé pour représenter des systèmes d’organisation des connaissances simples, typiquement les thésaurus. Ce modèle s’appuie sur RDF (Resource Description Framework), un cadre de description de données structuré sous forme de graphes, qui permet de faire des assertions de la forme [Sujet – Prédicat – Objet] comme montré dans la Figure 5 (ou par exemple, le concept « C1 » "est désigné par" le terme « emboucheur »).

Figure 5 : Exemples de représentation d’informations sous la forme [Sujet – Prédicat – Objet] ou triplets RDF

Thesaurus Fig5


Un identifiant unique appelé URI permet de faire référence à chaque élément décrit dans la base de données. Cet identifiant est composé d’un préfixe unique pour le thésaurus (ici http://opendata.inrae.fr/ThViande/) et d’un suffixe unique pour chaque ressource décrite (par exemple C1 pour le concept 1). L’URI est un identifiant global, i.e. unique dans tout l’espace du web. Comme le montre la Figure 6, l’objet central de notre modèle est le concept (skos:Concept) qui peut être vu comme une unité de pensée correspondant à un type d’objet du monde réel (ex : troupeau) ou à une entité abstraite (ex : transhumance). Il est désigné par un terme préférentiel (skos:prefLabel) dans une ou plusieurs langues et éventuellement des synonymes (skos:altLabel). La langue des termes est identifiée. Pour indiquer une définition, on utilise la propriété skos:definition. Les mentions « Voir » entre deux entrées du dictionnaire source sont traduites par la relation skos:related entre les deux concepts dans le thésaurus, par exemple [emboucheur] skos:related [embouche]. Au sein du thésaurus (skos:ConceptScheme), les concepts sont organisés sous la forme d’une hiérarchie au moyen des relations skos:narrower (concept plus spécifique) et skos:broader (concept plus générique). On aura par exemple : [éleveur] skos:narrower [emboucheur]. Cette structuration hiérarchique n’existait pas dans le dictionnaire et a fait l’objet d’un travail que nous décrivons ultérieurement. Le modèle SKOS présente d’autres propriétés et relations non utilisées que nous ne détaillons pas ici.

Figure 6 : Modèle des données du thésaurus basé sur SKOS, SKOS-XL et LexInfo
Thesaurus Fig6

I.2. Conversion du dictionnaire de sa forme textuelle en une ressource structurée et formalisée.

Le travail pour passer du dictionnaire au thésaurus comprend la récupération et la formalisation des données (encadré orangé de la Figure 7) qui précèdent la phase de structuration (en bleu gris). 
 
Figure 7 : Processus de construction du Thésaurus
 Thesaurus Fig7
 
 
Une grande partie du travail de récupération et de transformation a été réalisée de manière semi-automatique et a nécessité :
• La maîtrise des expressions régulières que nous avons appliquées dans un simple éditeur de texte (Notepad++ ) afin de séparer les entrées du dictionnaire les unes des autres (1 par ligne) et d’organiser leurs informations respectives dans un fichier en colonnes ;
• L’utilisation de l’outil OpenRefine, un logiciel libre de nettoyage et de transformation des données. Il nous a permis d’identifier et de corriger massivement les erreurs d’encodage introduites au moment de la transformation du fichier Word au fichier texte et d’affiner la segmentation des champs de chaque entrée. Enfin, l’extension RDF d’OpenRefine a permis de transformer les données d’un format tabulé vers la représentation standardisée en SKOS. 
Les données ont été exportées d’OpenRefine au format RDF/XML et facilement chargées dans Webstudio, un éditeur de vocabulaires doté d’une interface ergonomique permettant d’organiser les concepts créés au sein d’une hiérarchie pour former le thésaurus de la viande.

I.3. Structuration et hiérarchisation des données

Cette partie entièrement manuelle du travail a consisté à passer d’une représentation centrée sur les termes (dictionnaire) à une structuration centrée sur les concepts (thésaurus), et à en proposer une organisation thématique. Cette tâche nécessitait des connaissances approfondies du domaine qui ont été apportées par quatre experts, deux étant de l’Académie de la Viande et deux autres d’INRAE. Les experts de l’Académie de la Viande ont apporté des connaissances sur les découpes, les cuissons, les métiers et les spécificités de la filière ainsi que sur les différentes races d’animaux de boucherie. Les experts INRAE ont apporté des connaissances sur la biologie des muscles. Environ 32 réunions de 2 heures chacune se sont tenues pour ce travail. Dans certains cas, les experts se sont appuyés sur d’autres sources de connaissances telles que l’ontologie AHOL (Salaun et al., 2020) ou le dictionnaire du CIRAD (https://opendata.inra.fr/AHOL/page/AHOL_0005001).

Dans un thésaurus, et plus généralement en SKOS, un concept ne représente qu’une notion explicitée dans la définition. Dans le dictionnaire au contraire, l’entrée est centrée sur le terme qui peut correspondre à plusieurs notions et donc avoir plusieurs définitions. Ainsi, par exemple, alors que « charcuterie » est un commerce sous le concept « métier de la filière viande », il peut aussi être une déclinaison du concept « préparation culinaire des viandes ». Pour répondre à la contrainte d’univocité de SKOS, certaines entrées du dictionnaire ont dû être scindées en 2 concepts et leur définition modifiée en conséquence. Dans ce cas, il a fallu faire une distinction entre les 2 concepts en apportant des précisions entre parenthèses : « charcuterie (commerce) » et « charcuterie (salaison) ».

A l’inverse, certaines entrées du dictionnaire n’ont pas été reprises comme par exemple les termes VOF (Viande Ovine Française), VBF (Viande Bovine Française), VPF (Viande Porcine Française) pour ne garder que des labels officiels reconnus par l’INAO (https://www.inao.gouv.fr/Les-signes-officiels-de-la-qualite-et-de-l-origine-SIQO).
D’autres concepts ont été introduits pour répondre aux besoins de la hiérarchisation et assurer une certaine cohérence au sein du thésaurus. En particulier, les concepts de premier niveau (appelés « top concept » en SKOS) devaient être assez génériques pour constituer des catégories thématiques comme élevage ou métiers de la filière viande. Les ontologies AHOL - Animal Health Ontology for Livestock (https://www.atol-ontology.com/en/a-ahol/) et ATOL - Animal Trait Ontology for Livestock (Le Bail et al., 2014) ont été utilisées comme sources pour la création de concepts initialement absents du dictionnaire de la viande.

Afin d’organiser les concepts sous forme de hiérarchie au sein de chaque branche, les experts se sont basés sur les termes génériques mentionnés dans les définitions ou ont mobilisé leur propre expertise. Dans certains cas, le concept pouvait être placé à plusieurs endroits de la hiérarchie, comme par exemple le concept quartier pouvant être considéré comme spécifique de découpe ou demi-carcasse. Dans ce cas, il a été décidé qu’il était plus pertinent de le positionner comme un spécifique de demi-carcasse afin de rendre sa sémantique plus explicite. Dans d’autres cas, le concept le plus générique a été choisi. Par exemple, la branche « animal de boucherie » a été choisie pour englober tous les animaux abattus pour leur viande. Pour cette première version du thésaurus, nous avons choisi de ne pas introduire de polyhiérarchie, organisation dans laquelle un concept peut avoir plusieurs génériques. Si ce choix rend le travail de classification plus difficile (parce qu’il faut trancher), il le rend aussi plus précis (parce qu’il faut trouver la place la plus optimale).

Le travail de hiérarchisation a été complété par une révision de certaines définitions qui contenaient des éléments superflus ou sujets à évolution, ou encore contraires aux bonnes pratiques de rédaction des définitions (Vézina, 2009). Suite à la hiérarchisation, les relations skos:related (« Voir ») présentes dans le dictionnaire papier ont été supprimées entre les concepts entretenant dès lors une relation hiérarchique.

 
II.    RESULTATS
 
A l’issue de ce travail, le Thésaurus de la Viande est constitué de 1505 concepts. Ces concepts sont répartis dans 12 branches (ou concepts de 1er niveau) qui sont : 
• abattage
• animal de boucherie
• découpe
• élevage
• gibier
• marché et commercialisation du bétail et de la viande
• métiers de la filière viande
• organisations de la profession
• politique sanitaire
• préparations culinaires des viandes
• race
• viande
 
Chaque branche est déclinée en concepts plus spécifiques comme montré dans la Figure 8. 
 
Figure 8 : Déclinaison du concept « découpe »
Thesaurus Fig8

II.1. Un thésaurus couvrant les grands domaines de la filière viande.

Nous présentons les concepts de premier niveau classés par ordre alphabétique : 
- abattage contient les actions menées au sein de l’abattoir (étourdir, mettre à mort, égorger, épiler, éviscérer…), les outils utilisés (arrache-cuir, trocart, fendoir…), les abattages rituels (halal et casher), les notions relatives à la carcasse (rendement en carcasse, rendement en viande, atlas, cinquième quartier, piéçage …) ;
- animal de boucherie classe les animaux qui sont abattus pour de la consommation de viande. Les animaux sont répartis dans leurs grandes famille en tant que bovin, caprin, équin, ovin, porc, volaille et autres animaux de boucherie liste les animaux dont la viande est comestible mais dont la consommation est peu fréquente comme l’autruche, le bison ou encore le paon ;
- découpe décrit, dans le contexte français, toutes les découpes pour les volailles, les gros bovins, l’agneau, les équidés, le porc, le lapin et le veau. Il définit également de manière générale, les découpes communes à plusieurs animaux tel que la côte, le demi-gros, l’épaule et le gobet ;
- élevage regroupe les pratiques d’élevage qu’elles soient génériques (ex : zootechnie ou bien-être animal) ou bien particulières à un type d’élevage, par exemple bovin (ex : étable) ou ovin-caprin (ex : berger) ; 
- gibier regroupe tous les animaux qui sont chassés pour la consommation de leur viande et qui ne sont pas des animaux de boucherie tel que le faisan, le kangourou, le lièvre, le canard sauvage ou encore le pigeon ramier ;
- marché et commercialisation du bétail décrit les échanges commerciaux au sein de la filière viande en rendant compte des particularités françaises. Il contient 3 concepts de second niveau : marché de gros des viandes, marché aux bestiaux et transport des animaux vivants. 
- métiers de la filière viande regroupe tous les types d’occupations de la filière ainsi que les formations et distinctions. 
- organisations de la filière présente les différentes organisations réparties en quatre catégories : commercialisation-industrie, distribution, interprofession, production. 
- politique sanitaire recouvre 7 concepts de second niveau dont HACCP, maladies, inspection vétérinaire et traçabilité déclinés eux-mêmes en concepts plus spécifiques.
- préparation culinaire des viandes regroupe les concepts qui décrivent les préparations à base de viande ou des préparations où la viande est un ingrédient incontournable. Les concepts de second niveau sont : arts de la table, charcuterie, salaison, cuisson, sauce, charcuterie-salaison et les préparations culinaire à base de bœuf, gibier, porc, produits tripier, veau, viande ovine, volaille, multi-viandes. 
- race regroupe la notion de race rustique, les standards ainsi que les différents races bovines, caprines, équines, ovines, porcines. 
- viande est le vif du sujet dans ce thésaurus. On trouve dans cette branche les différents types de viande telles que la viande bovine, de gibier, de volaille, ovine et porcine. Elle propose également les définitions des viande blanche et viande rouge et d’autres comme qualité de la viande, conditionnement, conservation, transformation du muscle en viande, et industrie de la viande. 
 
Le thésaurus de la viande constitue donc une ressource qui couvre largement les notions abordées dans la Filière Viande. L’organisation thématique offre un parcours de navigation qui facilite sa découverte et son utilisation. L’intégration des définitions issues du dictionnaire de l’Académie de la Viande en fait une source de connaissances fiable et représentative des pratiques françaises.

II.2. Une ressource FAIR

Afin de permettre sa réutilisation par des tiers, le thésaurus de la Viande est mis à la libre disposition de la communauté sur un portail public, Agroportal, et dans un format ouvert : http://agroportal.lirmm.fr/ontologies/MEAT-T (onglet Classes pour voir la hiérarchie). Il s’inscrit dans la démarche FAIR (Tableau 1) dont les principes offrent un cadre pour s’assurer qu’une ressource numérique puisse être réutilisée par d’autres (humains et machines). Des solutions proposées par le service Vocabulaires Ouverts de la DipSO INRAE ont été combinées afin que le thésaurus de la viande soit autant que possible conforme aux principes FAIR.
L’analyse proposée dans le Tableau 1 a été réalisée dans le cadre du projet ANR FooSIN (https://foosin.fr/) et du questionnaire développé par le groupe de travail RDA SHARC (David et al., 2020).

Tableau 1 : le thésaurus de la Viande au crible des principes FAIR et solutions adoptées

Thesaurus Tab1

Une nouvelle fonctionnalité d’Agroportal, non disponible au moment de ce travail, permet d’attribuer un score de conformité aux principes FAIR (Amdouni E. et Jonquet C, 2021). Ce score est consultable, ainsi que les justifications, sur la page d’accueil du thésaurus sur Agroportal.
 
 
III. DISCUSSION
 
Fortifier les liens entre les différents acteurs de la filière viande (agriculteurs, producteurs, abattoir, grossistes et détaillants) est une priorité pour son avenir et son développement. Pour ce faire, il est important que ces acteurs communiquent sur la base d’un langage normalisé ou standardisé. La Commission économique des Nations Unies pour Europe (UNECE), promeut les normes et les langages standards sur les carcasses ainsi que les découpes pour faciliter la coopération internationale (Trypuz et al., 2014). De plus, les vocabulaires du « Web sémantique », qui sont mis à disposition sur le Web ouvert, participent à la recherche et à l'innovation dans les technologies alimentaires (Baker et al., 2019). Ainsi, peuvent-ils contribuer à l’innovation dans le domaine de la viande. 
La fondation « International Meat Research 3G » reconnue par l’UNECE a été créé dans le but d’améliorer la satisfaction des consommateurs vis-à-vis des viandes bovines en facilitant l'application des connaissances mondiales en recherche collaborative sur la viande dans les institut de recherche et les chaînes d'approvisionnement (https://imr3g.org/). Elle construit une base de données afin de prédire la qualité gustative de la viande bovine en se basant sur les tests consommateurs réalisés dans plusieurs pays (France, Irlande, Pologne, japon, Australie, Corée etc…). Lors de ces différents tests, les consommateurs classent la viande en fonction de sa tendreté, sa jutosité, sa flaveur et son appréciation globale. Le thésaurus de la viande donne des définitions pour chacun de ces critères. De plus, compte tenu de l’effet majeur de la maturation sur la tendreté de la viande (Nair et al., 2019), le thésaurus de la viande précise les temps de maturations pour différents types de viande dans le contexte français (« … Pour les viandes bovines du quartier arrière, la maturation minimale en froid positif devrait être de 8-10 jours, et est optimale à 3 semaines. Elle peut être beaucoup plus longue dans le cas de viande désossée sous vide ou sous gaz (90 jours). Les durées sont moindres pour le veau (4-6 jours), le porc (2-3 jours) et l’agneau (2-4 jours). »). 
Ce travail réalisé et décrit ici, vise donc à répondre aux objectifs de partage de connaissances entre les tous les acteurs et les groupes de recherche disparates en présentant une ressource décrivant la filière viande du point de vue de la communauté française.

III.1. Le thésaurus de la viande pour l’indexation des bases de données

Les progrès technologiques de la dernière décennie ont considérablement augmenté le taux de collecte d'informations scientifiques (Hughes et al., 2008). Cela a entraîné une prolifération de grandes bases de données biologiques conçues pour faciliter l'accès à ces données telles que Bif-Beef (pour Biologie Intégrative de la Viande Bovine) qui est centrée sur la qualité de la viande (Chriki et al., 2013)
Le thésaurus de la viande peut être utilisé pour indexer des articles de revues, des livres et des données sur la viande, sa transformation, son commerce et les disciplines connexes. Il pourra faciliter la recherche en étant utilisé pour consulter des bases de données. Par exemple, un utilisateur qui aura besoin d’informations sur le « faux filet » utilisera l’outil de recherche et les résultats qui lui seront donnés comporteront une définition ainsi qu’une indexation vers des bases de données constitués d’articles, des résultats de recherche ou de revues. 
Il peut donc être avantageux pour des chercheurs, lors de la constitution de leurs bases de données, d’utiliser des concepts déjà définis et en ajoutant des mots clés aux métadonnées. En 2002, le « National Agricultural Library Thesaurus » (NALT) fut établi afin de sélectionner des termes de vocabulaire contrôlés pour l'indexation par sujet dans des bases de données telles que AGRICOLA, PubAg (https://agclass.nal.usda.gov/). Ce thésaurus est principalement utilisé pour l'indexation et l'amélioration de la base de données bibliographiques des références aux ressources agricoles de la Bibliothèque nationale d'agriculture, AGRICOLA. Il contient 17 concepts de premier niveau et est consultable en ligne via AGROPORTAL (Pizzuti et Mirabelli, 2013) (http://agroportal.lirmm.fr/ontologies/NALT/?p=summary)
Le thésaurus sera mis à disposition de la communauté scientifique. Il permettra de créer des listes de valeurs contrôlées pour certains champs qualitatifs comme par exemple, race à viande ; ou la liste de valeurs possibles est l'ensemble des fils de ce concept. Le thésaurus devrait donc être implémenté dans le système d’information exploitant la base de données ou a minima avoir un fichier de correspondance entre les champs et le thésaurus (data dictionary). Il permettra également de préparer l’interopérabilité des bases de données qui exploiteront le même thésaurus ou un autre qui est aligné avec notre thésaurus 
Néanmoins, Il pourrait arriver que le thésaurus ne couvre pas tous les besoins de la base. Ceci peut arriver dans le cas où les responsables du thésaurus ne sont pas les mêmes que ceux de la base de données. Il faudra alors pouvoir demander l'ajout ou la modification de concepts dans le thésaurus.

III.2. Utilisation du thésaurus pour la construction d’une ontologie

Le thésaurus de la viande a été constitué comme une étape préalable à la construction d’une ontologie. Les ontologies sont une spécification formelle du domaine, c'est-à-dire un « ensemble de connaissances formellement représentées, basées sur des conceptualisations, qui sont des vues abstraites et simplifiées des éléments physiques ou procéduraux » (“Ontology - an overview | ScienceDirect Topics,” 2020). En reproduisant les propriétés et les contraintes des objets impliqués, une ontologie permettra de faire du raisonnement, ce que ne permet pas de faire un thésaurus. Le thésaurus permettra de compléter la définition de chaque classe dans l’ontologie. De même, la structuration faite dans le thésaurus facilitera l'identification des notions pertinentes pour l'ontologie.
C’est de cette manière qu’a été construite par exemple l’ontologie FoodOn en utilisant, entre autres, le thésaurus Langual publié en 2017 (Møller et Ireland, 2018). Ces travaux furent menés par un consortium pour construire une ontologie complète en open source, qui couvre les aliments crus, les conditions de processus pour l'emballage, la cuisson et la conservation, et une variété de schémas de types de produits sous lesquels les produits alimentaires peuvent être classés, comme indiqué dans la Figure 9. La description de chaque aliment se fait en fonction de qualités descriptives, de ses composants ainsi que des processus associés. Cette ontologie peut devenir plus précise dans un domaine spécifique comme celui de la filière viande. Citons par exemple les travaux initiés par le projet FTTO (FoodTrack&Trace Ontology) (Pizzuti et Mirabelli, 2013). Ce projet se base sur un langage partagé par tous les acteurs qui interviennent dans la chaîne d’approvisionnement d’aliments génériques. Ce projet soutient également une base de connaissances uniques en intégrant différents concepts et termes provenant de sources d’informations hétérogènes et d’utilisateurs impliqués dans la chaîne d’approvisionnement. 
Figure 9 : FoodOn réutilise les termes des ontologies OBO Foundry tels que les termes environnementaux de l'ontologie ENVO, les termes agricoles de l'ontologie AGRO, les termes d'anatomie végétale et animale d'UBERON et PO etc (https://foodon.org/)
 Thesaurus Fig9
 
Le projet FTTO s’est spécialisé dans le domaine de la viande en créant l’ontologie MESCO (MEat Supply Chain Ontology) (Pizzuti et al., 2017). Cette ontologie permet de rapidement accéder à toutes informations relatives à la chaîne d’approvisionnement de la viande. Cette approche permettrait d’éviter les retards dans l’obtention de données essentielles et de retracer l’origine des viandes. MESCO vise à fournir à la filière viande une norme de traçabilité, permettant l'interopérabilité entre différents systèmes et intégrant les bases de données hétérogènes adoptées par chaque acteur de la chaîne d’approvisionnement. 
De nombreux thésaurus, parmi lesquels AGROVOC et le Aquatic Sciences and Fisheries Abstracts Thesaurus (ASFA) sont convertis de la même manière en ontologies, afin d'améliorer leur expressivité et de profiter des outils mis à disposition par la communauté du web sémantique (Lauser et al., 2008). 
De la même manière que le projet FTTO s’est spécialisé dans la chaine d’approvisionnement de la viande, notre projet vise à se spécialiser dans la prédiction de la qualité de la viande. Afin de pouvoir prédire la qualité de la viande, plusieurs critères doivent être pris en considération au niveau de la ferme (pratiques d’élevage), de la chaîne de production (abattage, suspension des carcasses, maturation, emballage), la cuisson (spécificités de chaque morceaux, types de cuisson) ainsi que les préférences des consommateurs (tendreté, jutosité, flaveur, appréciation globale). Cette prédiction devra donc se fonder sur des bases de données robustes et interopérables. 
Les découpes peuvent varier d’un pays à l’autre, il est donc important que les communautés scientifiques réalisent les travaux de recherche sur la même base de définitions. Le thésaurus de la viande pourra servir de base pour combiner les connaissances issues de la littérature scientifique relatives aux principaux systèmes de notation des viandes de bœuf, avec un ensemble de caractéristiques de qualité de viande.
Plusieurs travaux sont constamment réalisés sur différents aspects de cette qualité mais ils sont souvent faits dans des contextes différents et les résultats ne sont parfois pas comparables les uns aux autres. En travaillant sur la base d’un vocabulaire standardisé, l’interopérabilité entre les bases de données sera ainsi facilitée et permettra des prédictions plus précises. Il est donc important que les caractères d’intérêts relatifs à la qualité de la viande aient des définitions claires et accessibles aux différentes communautés scientifiques intéressées par ces données afin de faciliter les méta-analyses et de limiter les incohérences ou les approximations dans les analyses. 
Le thésaurus de la viande pourrait donc servir de base pour la construction d’une ontologie spécifique à un sous-domaine de la filière viande comme par exemple la qualité de la viande en prenant en compte la qualité nutritionnelle, organoleptique aussi en intégrant les concepts de bases de données qui lui sont liées telles que la base de données Bif-BEEF (Chriki et al., 2013). Ceci permettra d’identifier les points de contrôle clés sur la qualité de la viande, conduisant ainsi, vers une meilleure maitrise de cette qualité.

III.3. Enrichissement de l’ontologie par les spécificités françaises 

Il peut être anticipé que ce nouveau système ontologique soit adopté par l'industrie, car les appareils agricoles et grand public connectés à l'Internet nécessiteront un vocabulaire alimentaire standard ayant une portée mondiale et multilingue (http://agroportal.lirmm.fr/ontologies/FOODON). 
Les particularités françaises sur la viande pourront donc être intégrés grâce au thésaurus de la viande. 
Ainsi, par exemple, le Thésaurus agricole Chinois fut intégré à AGROVOC afin de permettre aux utilisateurs d'accéder aux vastes référentiels du savoir agricole chinois, jusqu'alors inaccessibles aux non-locuteurs du chinois, en leur permettant d'utiliser le vocabulaire qui leur est familier dans les langues avec lesquelles ils sont familiers comme point d'entrée vers les ressources indexées (Liang et Sini, 2006).
ATOL (« Animal Trait Ontology for Livestock ») est une ontologie définissant les phénotypes des animaux d'élevage dans leur environnement. Cette ontologie est intégrée dans AgroPortal. Lorsqu’on cherche la définition de persillé (en anglais : Marbling) sur AgroPortal, nous avons accès à plusieurs définitions (y compris celle de ATOL) prenant en compte différentes spécificités de différentes régions du monde (mesure entre la 12ème et la 13ème côte en Inde ou aux Etats-Unis, entre la 5ème et la 13ème côte en Australie) comme indiqué dans la Figure 10. 
 
Figure 10 : Résultats de l’interrogation avec le mot « marbling » sur AgroPortal
 Thesaurus Fig10
 
En France, le persillé ne décrit pas seulement le gras intramusculaire mais également un morceau qui est aussi appelé pièce parée comme décrit dans le thésaurus de la viande. Cette spécificité pourra donc être incorporée dans la base ontologique. 
 
 
IV. CONCLUSION
 
Les écarts terminologiques, syntaxiques et sémantiques entre les sources de données doivent être surmontés pour qu'il soit possible pour les chercheurs d'avoir un accès transparent à différentes sources de données disparates. Il y a donc une prise de conscience croissante du besoin d'ontologies dans les sciences de la vie (Encyclopedia of Genetics, Genomics, Proteomics and Bioinformatics, n.d.). Il est également nécessaire de partager une mine de connaissances entre des chercheurs et des groupes de recherche disparates. En conséquence, un nombre croissant d'ontologies biologiques sont en cours de construction (Blake and Bult, 2006) car la gestion d’informations est d’un enjeu primordial. Ainsi par exemple, « The Lancet Planetary Health » avait déclaré l’année 2019 comme l’année de la nutrition lors du lancement de deux commissions d'enquête sur les liens entre les systèmes alimentaires, la santé humaine et l'environnement (https://www.thelancet.com/). Malheureusement très peu de ressources ont pu être associées à cette initiative dans le domaine de la viande. La gestion partagée d’informations constitue un objectif principal du web sémantique qui a pour objectif de permettre une meilleure gestion de l’information de manière à ce qu’elle soit interprétable et manipulable par les machines. Le web sémantique permet aussi une automatisation de la recherche de résultats.
Le thésaurus de la viande représente chaque dimension de la filière viande et ceci présente de nombreux avantages pour toutes les personnes voulant l’exploiter ; notamment des professionnels, des consommateurs ou encore des chercheurs. Il ne permettra pas seulement d’avoir des définitions précises des différents concepts mais aussi de trouver la relation entre eux en fonction des différentes catégories de concepts. Ceci permettra de contribuer à diffuser une meilleure connaissance de la filière, de ses organisations, de ses produits, de sa politique etc. L’avantage de ce thésaurus est de pouvoir également indexer des bases de données et des ressources bibliographiques.
Ce thésaurus englobe différents aspects de la viande : les animaux de boucherie, l’abattage et les découpes, la commercialisation, les préparations culinaires ainsi que la consommation. Les usagers de ce thésaurus peuvent donc avoir des profils différents ; les professionnels de la filière, les chercheurs, les journalistes, les étudiants ou alors les simples consommateurs voulant s’enquérir des spécificités françaises de la filière viande. Toutefois, il devra régulièrement être mis à jour pour une meilleure représentation de la filière qui évolue avec le temps.
Le contenu anglais de ce thésaurus est en cours d’intégration et il servira également de base pour une ontologie. Plus formelle et plus précise que le thésaurus, l’ontologie de la viande permettra de faire un raisonnement sur un aspect particulier de la viande, comme par exemple sur la qualité de la viande.
 

Références bibliographiques : 

Académie de la viande (2012). Dictionnaire de la viande. Publisher, Autres voix. ISBN, 540 2918237086, 9782918237082
AGROVOC. URL http://www.fao.org/agrovoc/fr (consulté le 5.26.21).
Ahol – Livestock Ontologies, URL https://www.atol-ontology.com/en/a-ahol/ (consulté le 1.27.21).
Amdouni E. et Jonquet C. (2021). Une méthodologie et un outil d'évaluation du niveau de " FAIRness " pour les ressources sémantiques : le cas d'AgroPortal. Journées Francophones d’Ingénierie des Connaissances (IC 2021) Plate-Forme Intelligence Artificielle (PFIA'21), Bordeaux, France. 11-19.
Animal Health Ontology for Livestock. URL https://opendata.inra.fr/AHOL/page/AHOL_0005001 (consulté le 6.20.21).
Aubin S., Caracciolo C., Zervas, P. (2017). Landscaping the Use of Semantics to Enhance the Interoperability of Agricultural Data. RDA Agrisemantics Working Group. https://doi.org/10.5281/zenodo.3697332
Baker T., Whitehead B., Musker R., Keizer J. (2019). Global agricultural concept space: lightweight semantics for pragmatic interoperability. Npj Science of Food, 3, 16. https://doi.org/10.1038/s41538-019-0048-6
Blake J.A., Bult C.J., 2006. Beyond the data deluge: Data integration and bio-ontologies. Journal of Biomedical Informatics, 39, 314–320. https://doi.org/10.1016/j.jbi.2006.01.003
Chaudieu G. (1970). Le petit dictionnaire de boucherie et de boucherie-charcuterie. Ed. J. Peyronnet, 1970. 193 p
Chriki S., Picard B., Faulconnier Y., Micol D., Brun J.-P., Reichstadt M., Jurie C., Durand D., Renand G., Journaux L., Hocquette J.-F. (2013). A Data Warehouse of Muscle Characteristics and Beef Quality in France and A Demonstration of Potential Applications. Italian Journal of Animal Science, 12, e41. https://doi.org/10.4081/ijas.2013.e41
Chriki S., Hocquette J.-F. (2020). The Myth of Cultured Meat: A Review. Frontiers in Nutrition, 7, 7. https://www.frontiersin.org/articles/10.3389/fnut.2020.00007/full
David R., Mabile L., Specht A., Stryeck S., Thomsen M., Yahia M., Jonquet C., Dollé L., Jacob D., Bailo D., Bravo H., Gachet S., Gunderman H., Hollebecq J.-E., Ioannidis V., Le Bras Y., Lerigoleur E., Cambon-Thomsen A., Community S. (2020). Templates for FAIRness evaluation criteria - RDA-SHARC ig. https://doi.org/10.5281/zenodo.3922069
Dikeman M., Devine C. (Eds.), (2014). Encyclopedia of meat sciences, 2. ed. Elsevier, Amsterdam.
Dooley D.M., Griffiths E.J., Gosal G.S., Buttigieg P.L., Hoehndorf R., Lange M.C., Schriml L.M., Brinkman F.S.L., Hsiao W.W.L. (2018). FoodOn: a harmonized food ontology to increase global food traceability, quality control and data integration. Npj Science of Food, 2, 23. https://doi.org/10.1038/s41538-018-0032-6
Encyclopedia of Genetics, Genomics, Proteomics and Bioinformatics., Wiley Anal. Sci. URL https://analyticalscience.wiley.com/do/10.1002/sepspec.9780470849743 (consulté le 9.7.21).
FoodOn - Summary | LIRMM AgroPortal., URL http://agroportal.lirmm.fr/ontologies/FOODON (consulté le 6.22.21).
Glatre, E. (2008). Dictionnaire de la viande. BPI, Clichy.
Health T.L.P. (2019). More than a diet. Lancet Planet. Health 3, e48. https://doi.org/10.1016/S2542-5196(19)30023-3
Hocquette J. F., Ellies-Oury M. P., Legrand I., Pethick D., Gardner G., Wierzbicki J. & Polkinghorne R. (2020). Research in Beef Tenderness and Palatability in the Era of Big Data. Meat and Muscle Biology, 4(2), 1-13.
Hocquette J.F., Ellies-Oury M.P., Lherm M., Pineau C., Deblitz C., Farmer L. (2018). Current situation and future prospects for beef production in Europe. Asian-Australasian Journal of Animal Science, 31, 1017-1035.
Hughes L.M., Bao J., Hu Z.-L., Honavar V., Reecy, J.M. (2008). Animal trait ontology: The importance and usefulness of a unified trait vocabulary for animal species. Journal of Animal Science, 86, 1485–1491. https://doi.org/10.2527/jas.2008-0930
IMR3G FOUNATION https://imr3g.org/ (consulté le 6.19.21).
Jonquet C., Toulet A., Arnaud E., Aubin S., Dzalé Yeumo E., Emonet V., Graybeal J., Laporte M.-A., Musen M.A., Pesce V., Larmande P. (2018). AgroPortal: A vocabulary and ontology repository for agronomy. Computers and Electronics in Agriculture, 144, 126–143. https://doi.org/10.1016/j.compag.2017.10.012
LanguaLTM - an international framework for food description - Thesaurus 2014. URL https://www.langual.org/langual_thesaurus.asp?termid=C0120&haschildren=False&owner=C0173&openstr=00000_A0361_A0356_C0116_C0164_C0127_C017 3 (consulté le 5.10.21).
Lauser B., Johannsen G., Caracciolo C., Keizer J., van Hage W.R., Mayr P. (2008). Comparing human and automatic thesaurus mapping approaches in the agricultural domain 10.
Le Bail, P.-Y., Bugeon J., Dameron, O., Fatet, A., Golik, W., Hocquette, J.F., Hurtaud, C., Hue, I., Jondreville, C., Joret, L., Meunier-Salaun, M.C., Vernet, J., Nédellec, C., Reichstadt, M., Chemineau, P., 2014. Un langage de référence pour le phénotypage des animaux d’élevage : l’ontologie ATOL. INRA Productions Animales, 27 (3), 195-208.
Liang A.C., Sini M. (2006). Mapping AGROVOC and the Chinese Agricultural Thesaurus: Definitions, tools, procedures. New Review of Hypermedia and Multimedia, 12, 51–62. https://doi.org/10.1080/13614560600774396
Møller A., Ireland J. (2018). LanguaLTM 2017 - Multilingual Thesaurus. https://doi.org/10.13140/RG.2.2.13274.64964
Nair M.N., Canto A.C.V.C.S., Rentfrow G., Suman S.P. (2019). Muscle-specific effect of aging on beef tenderness. LWT Food Science and Technology, 100, 250–252. https://doi.org/10.1016/j.lwt.2018.10.038
Ontology - an overview | ScienceDirect Topics. URL https://www.sciencedirect.com/topics/computer-science/ontology (consulté le 11.26.20).
Pizzuti T., Mirabelli G. (2013). FTTO: An example of Food Ontology for traceability purpose. https://doi.org/10.1109/IDAACS.2013.6662689
Pizzuti T., Mirabelli G., Grasso G., Paldino G., (2017). MESCO (MEat Supply Chain Ontology): An ontology for supporting traceability in the meat supply chain. Food Control, 72, 123–133. https://doi.org/10.1016/j.foodcont.2016.07.038
Pizzuti T., Mirabelli G., Sanz-Bobi M.A., Goméz-Gonzaléz F. (2014). Food Track & Trace ontology for helping the food traceability control. Journal of Food Engineering 120, 17–30. https://doi.org/10.1016/j.jfoodeng.2013.07.017
Salaun M.-C., Yon J., Le Bail, P.-Y., Reichstadt M. (2020). Animal Health Ontology for Livestock. https://doi.org/10.15454/KKZ3TS
Seman D.L., Boler D.D., Carr C.C., Dikeman M.E., Owens C.M., Keeton, J.T., Pringle, T.D., Sindelar, J.J., Woerner, D.R., de Mello, A.S., Powell, T.H. (2018). Meat Science Lexicon. Meat and Muscle Biology, 2, 1. https://doi.org/10.22175/mmb2017.12.0059
Shrestha R., Matteis L., Skofic M., Portugal A., McLaren G., Hyman G., Arnaud E. (2012). Bridging the phenotypic and genetic data useful for integrated breeding through a data annotation using the Crop Ontology developed by the crop communities of practice. Frontiers in Physiology, 3. https://doi.org/10.3389/fphys.2012.00326
Trypuz R., Piotr K. P., Wierzbicki J., Woźniak A., Carlhian B. (2014). Vers des standards automatisés dans la production de viande ? Utilisation de l’ontologie pour la présentation et l’implantation des standards dans la production de viande. Viandes & Produits Carnés, VPC-2014-30-4. http://www.viandesetproduitscarnes.fr/phocadownload/vpc_vol_30/3041_kulicki_standards_automatises_production_
Vézina R., Office québécois de la langue française. (2009). La rédaction de définitions terminologiques. Office québécois de la langue française, Québec.
Welcome to the Thesaurus and Glossary | NAL Agricultural Thesaurus and Glossary. URL https://agclass.nal.usda.gov/ (consulté le 6.20.21a).
Welcome to the Thesaurus and Glossary | NAL Agricultural Thesaurus and Glossary. URL https://agclass.nal.usda.gov/ (consulté le 6.24.21b).
Wilkinson M.D., Dumontier M., Aalbersberg Ij.J., Appleton G., Axton M., Baak A., Blomberg N., Boiten J.-W., da Silva Santos L.B., Bourne P.E., Bouwman J., Brookes A.J., Clark T., Crosas M., Dillo I., Dumon O., Edmunds S., Evelo C.T., Finkers R., Gonzalez-Beltran A., Gray A.J.G., Groth P., Goble C., Grethe J.S., Heringa J., ’t Hoen P.A.C., Hooft R., Kuhn T., Kok R., Kok J., Lusher S.J., Martone M.E., Mo,ns A., Packer A.L., Persson B., Rocca-Serra P., Roos M., van Schaik R., Sansone S.-A., Schultes E., Sengstag T., Slater T., Strawn, G., Swertz, M.A., Thompson, M., van der Lei, J., van Mulligen, E., Velterop, J., Waagmeester A., Wittenburg P., Wolstencroft K., Zhao, J., Mons B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientic Data 3, 160018. https://doi.org/10.1038/sdata.2016.18
World Wide Web Consortium (W3C). URL https://www.w3.org/ (consulté le 6.20.21).

 

Abonnez-vous !

Recevez notre Newsletter chaque trimestre. Vous êtes actuellement 5528 abonnés. VERIFIEZ DANS LES SPAMS ET ENREGISTRER L'EXPEDITEUR DANS VOTRE CARNET D'ADRESSES