Vue d'ensemble — le quoi & le pourquoi
1. Qu’est-ce que Messier
Section intitulée « 1. Qu’est-ce que Messier »🟢🔵 Messier est un système de medical entity linking pour les biobanques suisses. Il prend en entrée des mentions de maladies (texte clinique libre, souvent court, en FR / DE / IT) et les normalise vers des concepts d’ontologie, puis émet des codes d’interopérabilité exploitables par les registres et les cadres suisses (SPHN, BBMRI).
Il est bâti sur xMEN (un toolkit d’entity linking biomédical) et opère on-premise (Docker, RTX 4090), sans donnée personnelle sortante (conformité nLPD). Il est livré et opérationnel, en phase d’itération / pré-pilote avec un CHU partenaire.
flowchart LR
subgraph IN["Entrée"]
F["Fichier biobanque<br/>(CSV/XLSX de mentions)"]
end
subgraph MESSIER["Messier (on-premise)"]
LK["Linking<br/>(xMEN → Mondo)"]
CU["Curation humaine<br/>(IDE + arbitrage)"]
EM["Émission<br/>(Mondo → SNOMED/NCIt)"]
LK --> CU --> EM
end
subgraph OUT["Sorties"]
X1["Dictionnaire biobanque"]
X2["Fichier source enrichi"]
X3["Export SPHN oncologie"]
end
F --> LK
EM --> X1 & X2 & X3
classDef m fill:#e7f5ec,stroke:#2E7D5B
class LK,CU,EM m
Pourquoi c’est non-trivial : le texte clinique est court, multilingue et ambigu ; les terminologies cibles sont sous licence ; et la granularité entre l’ontologie pivot (Mondo) et la cible (SNOMED) diffère — ce qui plafonne la justesse et impose une curation humaine assistée plutôt qu’un mapping automatique aveugle.
2. Utilisateurs & cas d’usage
Section intitulée « 2. Utilisateurs & cas d’usage »🟢 Quatre rôles autour du système :
| Rôle | Fait quoi |
|---|---|
| Curateur | normalise les mentions dans l’IDE ; confirme les codes candidats |
| Médecin-arbitre | tranche les mentions routées (cas difficiles) |
| Admin biobanque | crée les projets, importe les fichiers, lance les exports |
| Déployeur licencié | fournit les dumps d’ontologies (BYO), gère les imports d’ontologie |
Cas d’usage typiques : constituer un registre tumeurs codé en SNOMED ; produire un dictionnaire mention→Mondo réutilisable ; alimenter une release SPHN ; bâtir un cache de validations mutualisable entre projets.
3. Principes directeurs
Section intitulée « 3. Principes directeurs »🔵 Les invariants qui reviennent dans tout le système :
- Contract-first — l’
openapi.yamlest la source de vérité ; types TS et schémas Pydantic en dérivent (le compile-time attrape les drifts). → Architecture - Identifiant vs contenu — on ne redistribue que des codes (CC0) ; jamais le contenu licencié. → Modèle de licence (open-core)
- Snapshot dénormalisé > FK — l’audit fige des libellés au moment de l’action
(
validated_by,actor_label) plutôt que des clés étrangères. - Déterminisme — émission, pseudonymisation et augmentation onco sont déterministes (reproductibles, auditables).
- On-premise / nLPD — tout tourne en local ; les exports sont pseudonymisés.
4. Périmètre (ce que Messier fait / ne fait pas)
Section intitulée « 4. Périmètre (ce que Messier fait / ne fait pas) »- ✅ Linking maladies → Mondo ; émission → SNOMED/NCIt ; décomposition onco (axes).
- ✅ Curation, arbitrage, cache, exports (biobanque, SPHN).
- ❌ Staging TNM, gestion patients/échantillons (BBMRI specimen) — linking ≠ staging. Le linkage sujet/specimen est laissé à la biobanque. → Imports & exports (interop)
Voir aussi
Section intitulée « Voir aussi »- Glossaire · Pont terminologique & émission (Mondo→SNOMED) (le cœur).