Aller au contenu

Imports & exports (interop)

🟢 L’admin téléverse un CSV/XLSX. Le système lit en-têtes + échantillon, demande un mapping de colonnes (la colonne mention est obligatoire ; sample_id, contexte, fréquence sont optionnels et préservés), puis le worker traite chaque ligne et produit un verdict de réception.

import_rows conserve les colonnes d’origine → base de l’export source_enriched (réinjection LIMS). Voir le pré-routage : Moteur de linking (cœur ML).

🟢🔵 Trois kind à jeux de colonnes disjoints, tous pseudonymisés côté validateur :

kindLivrableValidateur
biobank_mappingdictionnaire mention→Mondo (LIMS)pseudonymisé
biobank_source_enrichedfichier source reconstitué + colonnes donor_disease_*pseudonymisé
audit_trainingdump riche interne (predicted_top1, ckpt_version, superseded…)nominatif

Formats : csv / xlsx / jsonl. Pseudonymisation → Modèle de licence (open-core).

🟢🔵 kind = sphn_oncology (JSONL SPHN-shaped) : un enregistrement par mention onco décidée, codes SNOMED en identifiants seuls (jamais de libellé licencié), pattern SPHN Concept → hasCode → Code(terminology, value).

Inclusif + tag de fiabilité (min_reliability : high/low). La table grade→SCTID (G1 54102005 · G2 1663004 · G3 61026006 · G4 258245003) a été vérifiée contre le RF2.

🟢 Messier code des mentions, pas des patients/échantillons :

  • pas de TumorSpecimen (BBMRI) — le linkage sujet/specimen se fait côté biobanque via biobank_source_enriched (identifiants source) ;
  • pas de stade TNM (TumorStageAssessment) — linking ≠ staging ;
  • le binding terminologique site/histologie (ICD-O-3 vs SNOMED) est une décision externe SPHN / CHU partenaire. Messier émet du SNOMED (seule option légale).

Cadrage complet : notes/51.