Descriptif technique de l'API GreenCast Score

Ce document et les traitements décrits sont la propriété de Raccourci Agency.

Maintainer

Historique de ce document

Date Version Auteur
04/03/2024 1.0.0 Pierre-Sylvain Augereau,Ludovic Lacombe
07/01/2025 1.1.0 Ludovic Lacombe

L'API GreenCast Score a pour vocation d'attribuer un score de développement durable à des établissements du tourisme.

Plusieurs analyses sémantiques successives sont effectuées sur les contenus textuels issus des systèmes d'informations touristiques (SIT), les sites web des établissements touristiques et des avis laissés par les voyageurs.

Diagramme de séquence

sequenceDiagram participant API participant EndPoint participant OpenSearch participant IA participant Scraping participant MongoDB API ->> EndPoint: SIT/PWS classification EndPoint ->> OpenSearch: Recherche par sheet ID OpenSearch ->> EndPoint: Fiche SIT EndPoint ->> IA: Classification du champ %description IA ->> IA: Decoupage en phrases IA ->> IA: Classification IA ->> EndPoint: Phrases et critères EndPoint ->> IA: Classification du champ %slogan IA ->> IA: Decoupage en phrases IA ->> IA: Classification IA ->> EndPoint: Phrases et critères EndPoint ->> Scraping: Scraping du site web Scraping ->> EndPoint: Contenu du site au format texte EndPoint ->> IA: Classification des textes IA ->> IA: Decoupage en phrases IA ->> IA: Classification IA ->> EndPoint: Phrases et critères EndPoint ->> MongoDB: Enregistrement dans la base de données API ->> EndPoint: Avis clients classification EndPoint ->> OpenSearch: Recherche des avis par sheet ID OpenSearch ->> EndPoint: Avis client EndPoint ->> IA: Classification du texte de l'avis IA ->> IA: Decoupage en phrases IA ->> IA: Classification IA ->> IA: sentiment IA ->> EndPoint: Phrases, critères et sentiments EndPoint ->> MongoDB: Enregistrement dans la base de données

Calcul du score

Avant le calcul du score, chaque fragment de texte a été analysé par les différents modèles IA pour leur attribuer un critère et un sentiment.

Le calcul du score s'appuie sur quatre sources de données : les fiches SIT, les sites web, les avis clients et les labels.

Référentiel GreenCast (tableau ci-dessous)

Les thèmes et critères ont été élaborés et définis dans le référentiel GreenCAST. Un poids leur a été attribué avec un nombre de points.

Le référentiel GreenCAST a été élaboré suite à une analyse et agrégation des critères obligatoires des labels environnementaux dans le tourisme (Ecolabel européen, GreenGlobe, Clef Verte).

Le référentiel a été validé par plusieurs experts en sciences de l'environnement.

Le référentiel contient 7 thèmes et 40 critères :

Chaque thème dispose de 100 points. Ces 100 points sont distribués au sein des critères de chaque thème en donnant plus de points aux critères ayant le plus d'impact en faveur du développement durable.

Thème Critère Description POINTS GC
Biodiversite Gestion durable Rédaction d'un plan d'actions environnementales, pouvant intégrer des achats éco-responsables et des pratiques anti-pollution. 28
Biodiversite Alimentation biologique Offre de restauration incluant des produits alimentaires et boissons biologiques, écolabellisés, locaux ou issus du commerce équitable, faisant l'objet d'un contrôle qualité et respectant l'environnement. 17
Biodiversite Protection de la faune et de la flore Actions de préservation des milieux naturels 15
Biodiversite Sensibilisation Sensibilisation à la préservation des milieux naturels 14
Biodiversite Fournitures et produits d'entretien écologiques Privilégie l'utilisation de produits d'entretien respectueux de l'environnement ou éco-labellisés. 14
Biodiversite Végétalisation Présence d'espaces verts variés favorisant la biodiversité. 12
Dechets Réduction Diminue le gaspillage alimentaire, réduit les déchets, évite les articles jetables, mise à disposition de contenu réutilisables et favorise l'eau en carafe. 40
Dechets Gestion durable Mise en place d'un plan d'actions et de suivi des consommables visant à réduire les déchets et la pollution, incluant une gestion adéquate des déchets par le tri, la collecte, l'estimation du volume et l'implémentation de solutions alternatives pour les déchets non collectés localement. 30
Dechets Sensibilisation Promotion des éco-gestes pour le tri des déchets, avec affichage compréhensible pour les clients. 30
Eau Sensibilisation Encourage l'utilisation des programmes écologiques des équipements, la conservation de l'eau et de l'énergie, et offre une option de nettoyage sur demande. 29
Eau Gestion économe Surveille la consommation d'eau, détecte les fuites et établit un plan de durabilité. Mesures de réduction de consommation d'eau: équipements économes, débits réduits, double-chasse, arrosage raisonné, réutilisation du linge. 40
Eau Équité des ressources Préserve de manière équitable l'accès des habitants aux services de base en eau. 15
Eau Traitement Conformité avec la réglementation sur distribution, la collecte et le traitement de l'eau. 1
Eau Récupération Récupération de l'eau de pluie (l'entretien, aux espaces verts et aux chasses d'eau, etc), système de récupération des graisses dans les cuisines professionnelles 15
Economie circulaire Construction durable Applique des principes de construction durables (conformément aux documents d'urbanisme) adaptés localement tout en préservant l'environnement naturel et culturel. 20
Economie circulaire Réemploi Actions durables de réutilisation afin de réduire les déchets mis en décharge. 16
Economie circulaire Sensibilisation Formation du personnel, sensibilisation des clients autour de la charte environnementale (mobilité douce, eau , énergie, déchets, patrimoine culturel local), collaboration avec des fournisseurs engagés dans une démarche éco-responsable. 15
Economie circulaire Achats locaux Favorise l'achat de produits et de services locaux, équitables, issus de l'agriculture française ou en circuit-court. 17
Economie circulaire Gestion durable Une politique d'achat durable a été mise en place, favorisant l'emploi local et intégrant une gestion de la durabilité adaptée. 11
Economie circulaire Alimentation Offre de restauration incluant des produits alimentaires et boissons issus du commerce local. 13
Economie circulaire Collaborations locales Soutient des projets locaux durables et solidaires, incluant des collaborations avec des associations, des entreprises et des artistes locaux. 8
Energie CO2 Sensibilisation Instructions écologiques affichées près des appareils, incitant les voyageurs à économiser l'énergie. 14
Energie CO2 Energie verte Utilisation d'électricité renouvelable. 13
Energie CO2 Isolation L'isolation thermique est favorisée par la présence de double ou triple vitrage sur la majorité de leurs fenêtres. 14
Energie CO2 Alimentation L'offre alimentaire propose des choix végétariens et végétaliens, contribuant ainsi à réduire les émissions de CO2. 9
Energie CO2 Equipement performant énergétiquement Utilisation d'équipements énergétiquement performants pour le chauffage, la climatisation, l'entretien des locaux et espaces verts. 22
Energie CO2 Gestion durable Met en oeuvre des pratiques écologiques, surveille sa consommation énergétique et réduit ses émissions de gaz à effet de serre. 15
Energie CO2 Systèmes de gestion de bâtiment Contrôle automatisé de l'électricité et du confort thermique selon l'occupation et des systèmes d'éclairage régulés pour économiser l'énergie. 13
Mobilite Sensibilisation Promotion de la mobilité douce par la mise à disposition d'informations sur les transports en commun, location de vélos, borne de recharge électrique, covoiturage et itinéraires pédestres 25
Mobilite Borne de recharge Propose une ou plusieurs bornes de recharge pour véhicule électrique 10
Mobilite Covoiturage Accessible en auto partage et ou encourage voir organise les déplacements en covoiturage 20
Mobilite Pédestre Possibilité depuis l'établissement de se déplacer à pied vers des points d'intérêts touristiques, des commerces, des sentiers de randonnée 5
Mobilite Transports collectifs Accessible en transport collectif ou encourage voir organise les déplacements en transport collectif 20
Mobilite Vélo Accessible en vélo ou encourage voire organise les déplacements à velo, location ou prêt de vélo(s) 20
Responsabilité sociale et environnementale Formation Le personnel est formé aux pratiques environnementales, socioculturelles, sanitaires et sécuritaires, favorisant ainsi l'engagement écologique. 15
Responsabilité sociale et environnementale Sensibilisation Communication sur l'écologie, le patrimoine et les pratiques durables, intégrée à l'accueil et aux activités de l'entreprise. 15
Responsabilité sociale et environnementale Egalités entre les sexes, protection de l'enfance et inégalités réduites L'entreprise promeut l'égalité salariale et la non discrimination 15
Responsabilité sociale et environnementale Protection du patrimoine Protège les sites historiques locaux et s'engage à respecter les lois sur la conservation du patrimoine culturel. 10
Responsabilité sociale et environnementale Gestion responsable L'entreprise se conforme aux dispositions du code du travail et aux législations en vigueur sur la santé au travail et l'environnement, tout en assurant la sécurité et le bien-être de ses clients, de son personnel et des habitants et en promouvant un environnement sain. 30
Responsabilité sociale et environnementale Soutien associatif L'entreprise soutient des initiatives locales, liées à l'éducation, la santé et la préservation de la biodiversité. 15

La base des scores : le calcul par source (Avis positifs, Avis négatifs, Fiches SIT et les sites web (PWS)

Pour chaque source dans le critère observé, une fréquence est calculée. Le nombre total de fragments correspond au nombre total de fragments dans la source du critère observé (pour un établissement donné).

x=nb Fragments classés par IA dans un Critère par Sourcenb Total Fragments dans cette Source

On recherche une fréquence 90% (freq90) qui correspond au nombre total de fragments étiquetés Développement Durable sur la totalité des fragments de la destination filtré par source.

freq90=1k.quantile(0.90)

k étant le rapport suivant à l'échelle de la zone observée (du pull total d'établissements observés) :

k=Nb fragments avec une prédiction dans la sourceNb de fragment total

Sur Marseille, lors du calcul des quantiles en août 2024, les quantiles 90% de chaque sources sont :

On multiplie ensuite par la valeur attribuée au critère dans le référentiel GreenCAST, le calcul du score de base d'une source est :

scoresource=x×freq90×référentiel GreenCAST

Le score calculé par critère

Le score d'un critère est la somme des scores des différentes sources mais en retranchant par deux le score de la source des avis négatifs :

scorecritère=scoresit+scorepws+scoreavis positif(2×scoreavis négatifs)

Pour éviter d'afficher des établissements avec un faible nombre de points ou avec un score négatif, deux conditions existent :

Un critère n'est pas affiché s'il ne remplit pas l'une de ses deux conditions.

Cela permet également de filtrer les mauvaises prédictions des modèles. Il y a peu de chance qu'un grand nombre de prédictions dans un même critère soit lié à des erreurs de classification. En revanche, une prédiction isolée dans un critère a probablement plus de chance d'être liée à une erreur de classification.

Le score calculé par thème et établissement

Le score des thèmes est la somme des scores de ses critères.

Le score d'un établissement est la somme des scores de ses 7 thèmes.

Finalisation du calcul du score d'un établissement

Ajout des critères "Gestion durable" et "Sensibilisation" et de leurs points

Si les critères Gestion durable et Sensibilisation ne sont pas déjà observés par les fragments classifiés, l'api permet d'ajouter les critères "Gestion durable" et "Sensibilisation" aux thèmes possèdant ces critères sous conditions.

Contexte : Un établissement qui possède un des labels Clef Verte, Green Globe ou Ecolabel Européen a déjà mis en place des plans d'actions et des suivis des consommations, forme son personnel et sensibilise ses clients au développement durable. Ce sont des critères obligatoires de ces labels. Pour ces deux critères, en particulier la Gestion durable, il y a peu de retours des voyageurs dans les avis qui parlent avec les champs sémantiques ayant servis à entrainer les modèles de classification.

Pour la Sensibilisation

Les fragments ayant pour Source PWS sont copiés et collés dans le critère "Sensibilisation" des thèmes possèdant un critère "Sensibilisation" d'après le référentiel GreenCAST.

Le critère "Sensibilisation" nouvellement créé se voit attribuer la somme des points des sources PWS.

Pour la Gestion durable

Les fragments de toutes les sources sont reventilés dans le critère "Gestion durable" et le score du critère le plus élevé du même thème est attribué à la Gestion Durable.

Note : Le critère de la Gestion économe dans le thème Eau se voit attribué le même traitement que la Gestion durable.

Ajout de points en fonction des labels de l'établissement observé

L'api permet d'ajouter les points aux critères si ces derniers sont validés par un organisme certificateur comme la Clef Verte, Green Globe, Ecolabel Européen, Atout France (avec sa nouvelle grille de critères environnementaux pour les labellisés à partir de 2024).

Un critère validé par un label se voit attribué une bonification de 20%.