Référence
1. Endpoints API
Section intitulée « 1. Endpoints API »🔵 Source de vérité : contracts/openapi.yaml. Familles de routes (/api/v1/*) :
| Famille | Rôle |
|---|---|
projects · imports · mentions · validations | curation (CRUD + flux) |
arbitration | mentions routées (médecin) |
concepts | hydratation KB (synonymes, définition, xrefs, émission) |
exports | livrables (mapping / source_enriched / audit / sphn_oncology) |
terminologies | dashboard ontologies (admin) |
ontology-imports (+ /builds) | détection staging + déclenchement de build (admin) |
health · auth | santé · utilisateur courant |
2. Schéma de base de données
Section intitulée « 2. Schéma de base de données »🔵 Tables : users · projects · imports · import_rows · mentions · validations · exports · audit_log · ontology_builds (+ legacy mappings, cold backup). Enums principaux :
mention_status: pending · pending_semantic · in_review · validated · rejected · pending_arbitration · arbitrated · pending_oncologyvalidation_kind: accept · reject · request_arbitration · arbitrate_accept · arbitrate_reject · undoexport_format(csv/jsonl/xlsx/…) ·export_scope(validated_only/all_decided) ·export_kind(biobank_mapping/biobank_source_enriched/audit_training/sphn_oncology)build_status: queued · running · done · failed · cancelled
→ diagramme ER dans Architecture.
3. Variables d’environnement (extrait)
Section intitulée « 3. Variables d’environnement (extrait) »🔵
| Variable | Rôle |
|---|---|
MESSIER_INDEX_DIR | dossier des index + meta SNOMED (RO) |
MESSIER_STAGING_DATA_DIR | dépôt staging d’import d’ontologies |
MESSIER_MONDO_JSON | dump Mondo (dashboard) |
MESSIER_SNOMED_EMISSION | carte d’émission directe (CC0) |
MESSIER_SNOMED_UMLS_PATH · MESSIER_SNOMED_UMLS_CANDIDATES | carte candidate UMLS (licenciée) + flag |
MESSIER_UMLS_VERSION | version UMLS déclarée |
MESSIER_DB_URL · DL_DB_URL | DSN Postgres (runner / API) |
MESSIER_API_RESTART_CMD | commande de restart API (runner UMLS) |
DL_API_TOKEN | token API du backend |
MESSIER_BACKEND_URL | base API côté web (baké au next build) |
4. Index des notes (00→54) → wiki
Section intitulée « 4. Index des notes (00→54) → wiki »🔵 Les notes restent la trace chronologique ; le wiki en est la synthèse vivante.
| Notes | Thème | Article |
|---|---|---|
| 00–07 | setup, pipeline ES, UMLS, CUDA | Opérations & infra |
| 08–17 | cross-encoder, multilingue, fine-tune, demo | Moteur de linking (cœur ML) |
| 18–25 | épidémio, contexte, API runtime, lineage | Moteur de linking (cœur ML) / Architecture |
| 26–28 | MVP, jalons 6-10, pré-routage code | Vue d’ensemble — le quoi & le pourquoi / Moteur de linking (cœur ML) |
| 29–37 | benchmarks, retrieval, couverture, multilingue, rares | Moteur de linking (cœur ML) |
| 38–41 | fast-path, routage ICD-10, reranker morpho, curation onco | Moteur compositionnel & oncologie (MC) |
| 42–48 | pont Mondo→SNOMED (exp + caractérisation + mesures) | Pont terminologique & émission (Mondo→SNOMED) |
| 49–50 | politique d’émission + licence | Pont terminologique & émission (Mondo→SNOMED) / Modèle de licence (open-core) |
| 51, 53 | mapping axes→SPHN + export SPHN | Imports & exports (interop) |
| 52, 54 | dashboard ontologies + UI d’import | Gestion des ontologies |
5. Roadmap / jalons restants
Section intitulée « 5. Roadmap / jalons restants »🔵
- 10b — test de charge 10k mentions + virtualisation de la queue.
- 10d — OIDC réel (SWITCH edu-ID / IdP d’un CHU partenaire).
- O3 — linker SNOMED-direct (si l’exigence pilote = SCTID exact).
- Phase 3 import — trigger Mondo complet (xmen GPU), pré-vol des dumps, annulation/purge staging.
- Décomposeur — meilleur span morpho (« carcinome canalaire »).
- Pre-print — formulation multilingue (morpho gréco-latin vs anatomie germanique).