Glossaire
Vocabulaire transversal de Messier. Termes reliés entre eux et aux articles.
Entités du domaine
Section intitulée « Entités du domaine »- Mention — un fragment de texte clinique à normaliser (ex. « Brustkrebs », « adénocarcinome du côlon »). Unité d’entrée de la curation.
- Concept — une entrée d’ontologie identifiée par un code (ex.
MONDO:0007254). - Mondo — Mondo Disease Ontology, l’ontologie pivot des maladies (CC0). KB en service ≈ 26 700 concepts. Voir Moteur de linking (cœur ML).
- SNOMED CT — terminologie clinique de référence (sous licence). Cible d’émission pour l’interopérabilité biobanque. Éditions International + Swiss.
- NCIt — NCI Thesaurus (CC0). Code de repli quand SNOMED est absent/non émis.
- UMLS — Unified Medical Language System (Metathesaurus, sous licence). Sert de pont Mondo→SNOMED via les CUI (voie 1.5).
- ICD-O-3 / ICD-10 — classifications oncologie / morbidité. ICD-10 sert au pré-routage ; ICD-O-3 est le standard registre cancer (cf. SPHN).
- Linker / pipeline xMEN — chaîne de résolution : n-gram TF-IDF + SapBERT (FAISS) + ensemble + cross-encoder de re-ranking.
- Top-K / candidats — les K concepts proposés par le linker pour une mention.
- Checkpoint — modèle fine-tuné en service :
ce_finetune_v4ter_german. - Multi-KB — trois KB chargées :
disease(Mondo),topography,morphology(SNOMED). - Pré-routage par code — résolution automatique par correspondance de code (ICD-10→Mondo) avant le linker ; écarte les chapitres hors-scope (S/T/R/Z…).
- Cache de validations — une mention validée auto-résout les mentions identiques futures, cross-projet.
Compositionnel / oncologie
Section intitulée « Compositionnel / oncologie »- Compositionnel — décomposition d’une mention onco en axes (vs concept simple).
- Axe — une dimension du diagnostic tumoral : topographie (site, SNOMED body structure), morphologie (histologie, SNOMED morphologic abnormality), comportement (/0…/6 ICD-O), grade (G1–G4). La maladie Mondo est l’ancre, pas un axe.
pending_oncology— état d’une mention onco validée Mondo, en attente de la curation multi-axe (curation en 2 temps).- Pont Mondo→requête topo (D21) — synthèse d’une requête topographique à partir de l’ancre, pour pré-remplir l’axe topo (modes A/B).
Émission & pont (Mondo→SNOMED)
Section intitulée « Émission & pont (Mondo→SNOMED) »- Émission — le code d’interop attribué à un concept validé. Voir l’article pilote Pont terminologique & émission (Mondo→SNOMED).
- Paliers —
exact > confirmed > candidate > approximate > ncit > uncoded. - Trou-pivot — perte de granularité structurelle : Mondo (~26 k) est plus grossier que les disorders SNOMED (~100 k) → plafond de justesse exacte.
- Voie 1 / 1.5 — émission directe SNOMED (CC0) / candidats SNOMED via UMLS (licencié).
- Qualification —
exactMatch/ autre, portée par un code émis.
Licence (invariant)
Section intitulée « Licence (invariant) »- Identifiant vs contenu — on peut redistribuer des identifiants (codes) CC0 ; on ne redistribue jamais le contenu sous licence (libellés/index SNOMED, cartes UMLS).
- BYO terminology — bring your own : le déployeur fournit ses dumps licenciés ; montés RO, gitignorés, jamais commités.
- Clause 8.3 / 2.4 / 6.2 — SNOMED Affiliate : mention légale obligatoire / éditions officielles (pas de traduction maison) / fenêtre de mise à jour 180 j.
- Pseudonymisation —
curator_<sha256(user_id)[:8]>déterministe, appliquée à l’export (conformité nLPD).
Plateforme
Section intitulée « Plateforme »- MB / MC — dépôts : Messier Backend (API
klouche/messier, branchemessier-api-v1) / Messier Compositionnel (lib open-core,messier-compositional). - Staging — dossier où le déployeur dépose un dump d’ontologie ; détecté par l’UI d’import. Voir Gestion des ontologies.
- Runner host — processus host (timer systemd) qui exécute les builds d’index hors conteneur.
- Contract-first — l’
openapi.yamlest la source de vérité ; types TS + schémas Pydantic en sont dérivés. - SPHN / BBMRI — cadres d’interopérabilité suisses (santé personnalisée / biobanques).