Séminaire co-organisé par l’équipe IRIS de l’IRIT (Univ. Toulouse & CNRS), l’équipe Odycée d’AGIR (INRAE-Toulouse) et l’équipe ISD de BIA (INRAE-Nantes)
|
|
Liste des présentationsProgramme des présentations en cours de constructionLe langage naturel pour explorer les représentations, attentes, perceptions et préférences des consommateurs vis à vis des aliments — Michel Visalli (INRAE, CSGA) & Benjamin Mahieu (ONIRIS)Dans le cadre de nos recherches sur les comportements alimentaires, nous réalisons des études qualitatives utilisant le langage naturel afin de mieux saisir les représentations, attentes, perceptions et préférences des consommateurs. Nous présenterons différentes expérimentations basées sur la collecte de commentaires libres en réponse à des questions ouvertes, explorant des contextes variés tels que l’étude des perceptions sensorielles et affectives, l’identification des différences sémantiques entre consommateurs et experts, l'exploration des émotions et des évocations, l’analyse indirecte des préférences via l’analyse de sentiments, ainsi que la caractérisation des raisons de choix des aliments. Nous présenterons également les outils développés pour l’analyse des données, notamment un système expert qui combine des approches statistiques et sémantiques pour automatiser le prétraitement et l’analyse des données. Enfin, nous discuterons des perspectives futures dans notre domaine, tout en mettant en lumière les défis associés à ces approches. Explorer les rapports des organisations internationales : une analyse lexicométrique des rapports-pays de l'OCDE : 1962-1996 — Cécile Crespy (Sciences Po Toulouse, LaSSP)Cette communication reviendra sur l'analyse lexicométrique des rapports pays produits par l’Organisation pour la coopération et le développement économique (OCDE) des années 1960 au milieu des années 1990. Synthèse et agrégation d'information textuelle: quelques pistes de solution — Karen Pinel-Sauvagnat (IRIT)Dans cet exposé nous verrons quelques exemples de problématiques et solutions explorées au sein de l'équipe IRIS autour de la synthèse d'information : synthèse sous forme tabulaire, synthèse de grands flux de données (temps réel ou non), amélioration de la factualité et de la véracité des textes générés, via le contrôle des hallucinations ou en attribuant des sources aux informations générées. Analyser l'offre alimentaire: exploitation des listes ingrédients et mentions valorisantes des produits emballés — Ophélie Fraisier-Vannier (IRIT), Tristan Salord (INRAE, Dipso), Marie-Benoit Magrini (INRAE, Agir), Guillaume Cabanac (IRIT, IUF)Les impacts des systèmes agroalimentaires conventionnels sont de plus en plus discutés en termes de perte de biodiversité, de santé et de pratiques commerciales déloyales. Cependant, nous savons peu de choses sur l'hétérogénéité des produits alimentaires offerts sur le marché. En utilisant des méthodes d'exploration de texte, cette recherche analyse la base de données MINTEL-GNPD, qui suit les lancements de produits alimentaires emballés, sous marque, à l'échelle mondiale. Ce type de recherche vise à mieux informer sur les paradigmes sociotechniques qui sous-tendent la diversité des produits agroalimentaires. Ce travail souligne aussi la nécessité d’avancer sur des ontologies consensuelles pour caractériser les produits et les ingrédients les composant (en particulier sur type de transformation des ingrédients). Il interroge la manière d’évaluer comment les nouveaux produits mis sur le marché peuvent contribuer à des systèmes agroalimentaires plus sains et plus durables. Ce travail est illustré par une étude sur les légumineuses utilisées dans 350 000 produits au cours de la dernière décennie dans le monde. Fonctionnement des modèles de langue et exploitation sur des données alimentaires — Vincent Guigue (AgroParistech, MIA)Les réseaux de neurones et l'apprentissage de représentation ont permis une modélisation bien plus fine des données textuelles, images et des interactions utilisateurs. Les nouvelles représentations de ces objets ouvrent des perspectives appréciatives dans de nombreux domaines et en particulier pour la nutrition. Cet exposé propose une introduction aux mécanismes d'apprentissage de représentation avant d'aborder quelques pistes d'exploitation dans le cadre des applications en nutrition. Extraction de termes significatifs : de la représentation de documents au résumé automatique — Pascal Cuxac (CNRS, INIST)L'extraction de termes significatifs à partir du contenu d'un document constitue un procédé fréquemment employé, tant pour améliorer l'accès à l'information que pour élaborer une représentation concise du contenu d'un document. Le résumé automatique, de son côté, permet d'obtenir une vue d'ensemble rapide d'un document ou d'un ensemble de documents sous une forme aisée à appréhender.
Dans le cadre de cet exposé, nous proposerons une méthode d'extraction de termes qui exploite la structure du document. Nous démontrerons comment cette approche peut être utilisée pour générer des résumés par extraction, en s'appuyant sur les éléments clé identifiés dans le texte. Par la suite, nous examinerons les ajustements apportés à cette méthode afin de mieux répondre aux besoins pratiques et aux exigences des utilisateurs. Enfin, nous aborderons la problématique de la génération de résumés à partir de multiples documents et illustrerons ces concepts à travers des exemples d'applications.
Fonctionnement et défis d’Open Food Facts — Alexandre Garel (Open Food Facts)Open Food Facts est la plus grande base de données ouverte sur l’alimentation. C’est un projet collaboratif basé sur une production participative. Outre les données brutes, tout un travail d’analyse est également mené: analyse des ingrédients, labels, scores nutritionnels et environnementaux ; avec d’autre productions qui enrichissent ce travail comme les taxonomies. Comment s’organise ce travail de collecte mondial ? Quels sont les défis rencontrés sur la complétion, la qualité, l’analyse ? Comment l’apprentissage automatique est-il utilisé pour accélérer la contribution ? La base est-elle adaptée à des travaux de recherche ? Autant de questions pour lesquelles nous donnerons un rapide aperçu.
Représentation et extraction de données dans le domaine des emballages alimentaires — Patrice Buche (INRAE, IATE) & Martin Lentschat (LERASS)Quantité de données expérimentales sont présentes dans les articles scientifiques. Une extraction et structuration fiable et automatique de celles-ci est important afin, par exemple, d'enrichir des bases de connaissances pouvant ensuite être utilisées par des systèmes d'aide à la décision. Évaluées sur un corpus d’articles scientifiques portant sur les emballages alimentaires, l'approche développée vise à extraire les connaissances textuelles sous forme de relations n-Aires et repose sur l'utilisation d'une Ressource Termino-Ontologique (RTO) représentant relations ainsi qu'arguments symboliques et quantitatifs. Cette approche est divisée en deux phases : (1) l'extraction des instances d’arguments dans l'ensemble des documents et (2) la mise en relation de celles-ci avec les données présentes dans les tableaux afin de reconstituer des relations n-Aires. Ces travaux ont mené à la conception de deux représentations multi-critères (SciPuRe - Scientific Publication Representation et STaRe - Scientific Table Representation) permettant d'alimenter et de guider le processus d'extraction et de mise en relation. |
Personnes connectées : 2 | Vie privée | Accessibilité |
![]() ![]() |