Imports & exports (interop)
1. Import de données projet
Section intitulée « 1. Import de données projet »🟢 L’admin téléverse un CSV/XLSX. Le système lit en-têtes + échantillon, demande un mapping de colonnes (la colonne mention est obligatoire ; sample_id, contexte, fréquence sont optionnels et préservés), puis le worker traite chaque ligne et produit un verdict de réception.
flowchart LR F["CSV/XLSX"] --> U["Upload + lecture en-têtes"] U --> MAP["Mapping colonnes (admin)"] MAP --> IR["import_rows"] IR --> W["Worker (par ligne)"] W --> Q["ajoutée à la file"] W --> CH["cache hit (auto-validée)"] W --> PR["pré-routée (hors-scope)"] W --> CR["résolue par code"] W --> DD["doublon écarté"] classDef m fill:#e7f5ec,stroke:#2E7D5B class W m
import_rows conserve les colonnes d’origine → base de l’export source_enriched (réinjection
LIMS). Voir le pré-routage : Moteur de linking (cœur ML).
2. Exports biobanque
Section intitulée « 2. Exports biobanque »🟢🔵 Trois kind à jeux de colonnes disjoints, tous pseudonymisés côté validateur :
| kind | Livrable | Validateur |
|---|---|---|
biobank_mapping | dictionnaire mention→Mondo (LIMS) | pseudonymisé |
biobank_source_enriched | fichier source reconstitué + colonnes donor_disease_* | pseudonymisé |
audit_training | dump riche interne (predicted_top1, ckpt_version, superseded…) | nominatif |
Formats : csv / xlsx / jsonl. Pseudonymisation → Modèle de licence (open-core).
3. Export SPHN oncologie
Section intitulée « 3. Export SPHN oncologie »🟢🔵 kind = sphn_oncology (JSONL SPHN-shaped) : un enregistrement par mention onco
décidée, codes SNOMED en identifiants seuls (jamais de libellé licencié), pattern SPHN
Concept → hasCode → Code(terminology, value).
flowchart LR
subgraph MES["Messier (axes + émission)"]
DM["émission primary"]
TO["axe topographie"]
MO["axe morphologie"]
GR["axe grade (G1–G4)"]
BE["axe comportement"]
end
subgraph SP["SPHN-shaped (JSONL)"]
OD["OncologyDiagnosis.hasCode<br/>(SNOMED / NCIt si repli)"]
ST["site (SCTID)"]
HI["histology (SCTID)"]
TG["TumorGradeAssessment<br/>(G→SCTID, table vérifiée RF2)"]
BV["behavior (/0../6)"]
end
DM --> OD
TO --> ST
MO --> HI
GR --> TG
BE --> BV
classDef m fill:#e7f5ec,stroke:#2E7D5B
class OD,ST,HI,TG m
Inclusif + tag de fiabilité (min_reliability : high/low). La table grade→SCTID
(G1 54102005 · G2 1663004 · G3 61026006 · G4 258245003) a été vérifiée contre le
RF2.
4. BBMRI / specimen & TNM — hors périmètre
Section intitulée « 4. BBMRI / specimen & TNM — hors périmètre »🟢 Messier code des mentions, pas des patients/échantillons :
- pas de
TumorSpecimen(BBMRI) — le linkage sujet/specimen se fait côté biobanque viabiobank_source_enriched(identifiants source) ; - pas de stade TNM (
TumorStageAssessment) — linking ≠ staging ; - le binding terminologique site/histologie (ICD-O-3 vs SNOMED) est une décision externe SPHN / CHU partenaire. Messier émet du SNOMED (seule option légale).
Cadrage complet : notes/51.