Aller au contenu

Glossaire

Vocabulaire transversal de Messier. Termes reliés entre eux et aux articles.

  • Mention — un fragment de texte clinique à normaliser (ex. « Brustkrebs », « adénocarcinome du côlon »). Unité d’entrée de la curation.
  • Concept — une entrée d’ontologie identifiée par un code (ex. MONDO:0007254).
  • MondoMondo Disease Ontology, l’ontologie pivot des maladies (CC0). KB en service ≈ 26 700 concepts. Voir Moteur de linking (cœur ML).
  • SNOMED CT — terminologie clinique de référence (sous licence). Cible d’émission pour l’interopérabilité biobanque. Éditions International + Swiss.
  • NCItNCI Thesaurus (CC0). Code de repli quand SNOMED est absent/non émis.
  • UMLSUnified Medical Language System (Metathesaurus, sous licence). Sert de pont Mondo→SNOMED via les CUI (voie 1.5).
  • ICD-O-3 / ICD-10 — classifications oncologie / morbidité. ICD-10 sert au pré-routage ; ICD-O-3 est le standard registre cancer (cf. SPHN).
  • Linker / pipeline xMEN — chaîne de résolution : n-gram TF-IDF + SapBERT (FAISS) + ensemble + cross-encoder de re-ranking.
  • Top-K / candidats — les K concepts proposés par le linker pour une mention.
  • Checkpoint — modèle fine-tuné en service : ce_finetune_v4ter_german.
  • Multi-KB — trois KB chargées : disease (Mondo), topography, morphology (SNOMED).
  • Pré-routage par code — résolution automatique par correspondance de code (ICD-10→Mondo) avant le linker ; écarte les chapitres hors-scope (S/T/R/Z…).
  • Cache de validations — une mention validée auto-résout les mentions identiques futures, cross-projet.
  • Compositionnel — décomposition d’une mention onco en axes (vs concept simple).
  • Axe — une dimension du diagnostic tumoral : topographie (site, SNOMED body structure), morphologie (histologie, SNOMED morphologic abnormality), comportement (/0…/6 ICD-O), grade (G1–G4). La maladie Mondo est l’ancre, pas un axe.
  • pending_oncology — état d’une mention onco validée Mondo, en attente de la curation multi-axe (curation en 2 temps).
  • Pont Mondo→requête topo (D21) — synthèse d’une requête topographique à partir de l’ancre, pour pré-remplir l’axe topo (modes A/B).
  • Émission — le code d’interop attribué à un concept validé. Voir l’article pilote Pont terminologique & émission (Mondo→SNOMED).
  • Paliersexact > confirmed > candidate > approximate > ncit > uncoded.
  • Trou-pivot — perte de granularité structurelle : Mondo (~26 k) est plus grossier que les disorders SNOMED (~100 k) → plafond de justesse exacte.
  • Voie 1 / 1.5 — émission directe SNOMED (CC0) / candidats SNOMED via UMLS (licencié).
  • QualificationexactMatch / autre, portée par un code émis.
  • Identifiant vs contenu — on peut redistribuer des identifiants (codes) CC0 ; on ne redistribue jamais le contenu sous licence (libellés/index SNOMED, cartes UMLS).
  • BYO terminologybring your own : le déployeur fournit ses dumps licenciés ; montés RO, gitignorés, jamais commités.
  • Clause 8.3 / 2.4 / 6.2 — SNOMED Affiliate : mention légale obligatoire / éditions officielles (pas de traduction maison) / fenêtre de mise à jour 180 j.
  • Pseudonymisationcurator_<sha256(user_id)[:8]> déterministe, appliquée à l’export (conformité nLPD).
  • MB / MC — dépôts : Messier Backend (API klouche/messier, branche messier-api-v1) / Messier Compositionnel (lib open-core, messier-compositional).
  • Staging — dossier où le déployeur dépose un dump d’ontologie ; détecté par l’UI d’import. Voir Gestion des ontologies.
  • Runner host — processus host (timer systemd) qui exécute les builds d’index hors conteneur.
  • Contract-first — l’openapi.yaml est la source de vérité ; types TS + schémas Pydantic en sont dérivés.
  • SPHN / BBMRI — cadres d’interopérabilité suisses (santé personnalisée / biobanques).