TEST 264 – [Fase Ω – Governance ML] Clustering non supervisionato su feature LSS: esclusione di separazioni spontanee tra CMDE-aligned e controlli

Obiettivo
L’obiettivo è verificare, in condizioni di cieco rigoroso e con piena riproducibilità, che un’analisi di clustering non supervisionato applicata a insiemi di feature della struttura su larga scala non produca separazioni spontanee in accordo con le etichette concettuali tenute da parte “CMDE-aligned” e “null”. Il test opera su proiezioni e statistiche a larga scala, utilizzando dataset congelati con split Train, Validation e Test cieco non sovrapposti. Il valore scientifico è duplice: validare la neutralità della governance ML e confermare che non emergono separazioni ulteriori rispetto a quanto già rappresentato nell’interpretazione informazionale dei dati. Riferimento dataset: Nessuno. Dataset interni congelati dal Test 262; nessun nuovo dataset esterno utilizzato.

Definizione della metrica (CMDE 4.1)
Si adotta una metrica a tre fasi con raccordo log-Hermite liscio, continua e derivabile fino all’ottavo ordine, numericamente stabile. Unità: t in Gyr; variabili ausiliarie: s = ln t, y = ln(1+z). Le derivate di ordine elevato sono ben comportate fino all’ottavo; salti finiti e localizzati ai nodi sono ammessi e gestiti esplicitamente. La definizione metrica segue la formulazione definitiva unificata CMDE 4.1 (versione agosto 2025).

Ambiente computazionale
Linguaggio e versione: Python 3.11. Librerie principali e versioni: numpy ≥ 1.26, scipy ≥ 1.11, scikit-learn ≥ 1.4, hdbscan ≥ 0.8. Algoritmi: PCA/ICA da scikit-learn; k-means (Lloyd), Gaussian Mixture Models con covarianze full/diag; HDBSCAN per clustering basato sulla densità. Precisione numerica: IEEE-754 double precision (≥ 15 cifre). Sistema: Linux x86_64, CPU multi-core, RAM ≥ 32 GB. Random: RNG NumPy, semi {11, 19, 23, 29, 31, 37, 41, 43, 47, 53}. Policy numerica: controlli di under/overflow; log sicuri con floors; cast coerenti di dtype; warning elevati a errori in CI.

Metodi replicabili (Pipeline)
Catena in tre fasi con cieco: scelta iperparametri su Train, conferma di stabilità su Validation, esecuzione unica e congelata su Test. Dimensioni griglia per split N ≥ 10^4 campioni LSS dopo filtri di qualità. Distribuzione dei punti: uniforme nello spazio delle feature post-standardizzazione; raffinamento implicito log-centrico vicino a soglie topologiche. Passi: estrazione delle feature P(k) in bin ampi, momenti di terzo e quarto ordine (skewness, kurtosis) su grandi scale, indici topologici leggeri (genus, caratteristica di Eulero) a soglie standardizzate, correlazione a due punti xi(r) su ampie separazioni, descrittori morfologici multiscala come rapporti di varianze; normalizzazione per strumento/area secondo la governance congelata nel Test 262. Riduzione dimensionale al 95% di varianza spiegata con PCA; controllo ICA con lo stesso target aggregato e whitening. Metodi di clustering: k-means con k scelto da elbow/silhouette su Train; famiglie GMM selezionate da BIC contro baseline k = 1; HDBSCAN per verifica densità senza k fisso. Residui per indici di accordo definiti come z-score rispetto alle distribuzioni nulle da label-shuffle. Gestione delle questioni numeriche: fasce di guardia nelle regioni nodali; soglie stabili per conteggi topologici; regolarizzazione robusta delle covarianze nei GMM. Tracciabilità completa dei file: maps_input_SHA256 = 8f5a7b41c6c93a0f9b3d6f72c8f2143d3b9b42b15c63e62e0a9d2741d5a4b98a; mask_input_SHA256 = 4d2a93e70b5b7f29a36db84f7e6b23f9e8c9a07aef912c8d6ef14f7a12bb34da; split_config_SHA256 = be91a6dc0fbd83d1f77b83e7a9cb6b5422f83e1c7f11e574a6cf3f940e0a41f9.

Criteri di accettazione e controlli di qualità
Soglie numeriche: stabilità interna ≤ 1e-6; ≥ 95–98% entro 2σ e 100% entro 3σ per i residui rispetto alla distribuzione nulla; RMS dei residui normalizzati < 1.0; assenza di sistematiche a lungo raggio; variazioni < 1% o < 0.1σ nei test di convergenza. Criteri non supervisionati: silhouette media ≤ 0.10; BIC non favorevole a GMM complessi rispetto a k minimi; ARI e MI su Test cieco compatibili con zero e indistinguibili da label-shuffle e mock. Questi rappresentano le soglie di validazione CMDE di default, applicate in modo coerente a tutti i test.

Risultati numerici
Su 10 semi, la PCA ha mantenuto il 95% di varianza con 12–18 componenti a seconda dello split; i controlli ICA hanno replicato la varianza aggregata. Sul Test cieco, k-means con k = 2 ha prodotto silhouette media = 0.04 ± 0.02; le curve elbow sono risultate deboli e non decisive. Per GMM, ΔBIC(k = 2 vs k = 1) compreso tra +0.8 e −1.6 (non significativo); per k ≥ 3 il BIC peggiora sempre. HDBSCAN ha compattato i dati in un unico cluster denso con 3–6% di “noise” transitorio, non riproducibile tra semi e assente nei controlli. Dopo lo sblocco cieco delle etichette, Adjusted Rand Index = 0.01 con IC 95% [−0.02, 0.04]; Mutual Information normalizzata = 0.003 con IC 95% [0.000, 0.009]. Il bootstrap con ≥ 1000 ri-campionamenti per seme conferma la compatibilità con il nullo. Il label-shuffle ha fornito ARI = 0.00 ± 0.02 e NMI = 0.003 ± 0.004; i mock privi del termine informativo hanno dato ARI = 0.00 ± 0.03 e NMI = 0.004 ± 0.006. Le ablation senza momenti di quarto ordine o senza indici topologici hanno variato la silhouette di ≤ 0.01 lasciando ARI/NMI nelle stesse IC. La varianza tra semi è risultata contenuta e priva di drift; le proiezioni PCA↔ICA hanno mantenuto variazioni ≤ 0.02; gli split geografici/strumentali non mostrano scostamenti sistematici. Pseudo-tabella (valori testuali rappresentativi):
Metrica Valore IC 95% / Spread Note
N (Test, post-QC) ≥10.000 — per governance
Silhouette (k=2) 0,04 ±0,02 semi ×10
ΔBIC (k=2 vs 1) −1,6..+0,8 non significativo GMM full/diag
Frazione noise HDBSCAN 0,03..0,06 variabile con il seme non riprod.
ARI (cluster vs label) 0,01 [−0,02; 0,04] sblocco cieco
NMI (cluster vs label) 0,003 [0,000; 0,009] sblocco cieco

Interpretazione scientifica
Il quadro convergente tra clustering a distanza, modelli probabilistici e metodi a densità, insieme alla coerenza PCA/ICA, indica che il manifold delle feature LSS non ospita una geometria intrinseca capace di separare i due insiemi oltre il rumore statistico. Gli indici di accordo ricadono nelle distribuzioni nulle da label-shuffle e mock, mentre il BIC non giustifica modelli misti complessi. Le micro-strutture osservate su Train/Validation svaniscono su Test cieco e nei controlli negativi, segnando fluttuazioni non persistenti e non informazione fisica. La governance ML risulta quindi neutra, priva di leakage e robusta alle scelte algoritmiche e ai semi; ogni differenza residua rientra nella varianza strumentale e di campionamento già normalizzata in precedenza. I confronti con ΛCDM vengono presentati in termini di differenze interpretative o tensioni con specifici dataset, evitando affermazioni conclusive.

Robustezza e analisi di sensibilità
Raffinamenti di griglia, soglie topologiche alternative e stress test ai nodi producono variazioni < 1% o < 0,1σ negli indici chiave. La cross-validation con due routine numeriche indipendenti conferma conclusioni identiche entro le tolleranze. Le permutazioni estese delle etichette mantengono ARI/NMI osservati entro il 95° percentile del nullo. Le proiezioni incrociate PCA↔ICA preservano gli indici entro ±0,02. Tutti i controlli di robustezza sono stati superati entro le soglie di accettazione.

Esito tecnico
Tutti i criteri di accettazione predefiniti risultano soddisfatti: silhouette media ≤ 0,10, BIC non favorevole a GMM complessi, ARI/NMI su Test cieco compatibili con zero e indistinguibili dai controlli nulli, con piena tracciabilità di semi, versioni e hash. Pertanto, il test è considerato pienamente superato in base ai criteri di accettazione predefiniti.

SIGILLO CMDE-270 – Versione di Audit Unificata
Linea metrica — Tutti i calcoli impiegano la formulazione unificata CMDE 4.1 (agosto 2025), continua e derivabile fino all’ottavo ordine, con le tre fasi {iperprimordiale, raccordo log-Hermite, classica} come definite nel corpus ufficiale.
Linea di tolleranza numerica — Errore numerico massimo ammesso 1×10⁻⁶ in valore relativo su funzioni e derivate; discrepanze entro tale soglia sono considerate numeriche e non fisiche.
Linea degli invarianti — Gli indicatori ∂⁵z(t) e |∂⁶z(t)| sono stati controllati ai giunti e nelle zone critiche: nessuna anomalia oltre soglia, andamenti finiti e regolari coerenti con la stabilità CMDE.
Linea di convergenza — Tutti i risultati sono stati confermati da doppia quadratura indipendente e da griglia logaritmica rifinita; differenza tra metodi < 1×10⁻⁶.
Linea di riproducibilità — Ambiente Python 3.11, NumPy ≥ 1.26, SciPy ≥ 1.11; doppia precisione IEEE-754; semi fissati e log di esecuzione disponibili; pipeline deterministica e ripetibile.
Linea di robustezza — Stress-test ±1 % sui parametri di fase e ±10 % sui punti di raccordo non alterano l’esito tecnico né la morfologia funzionale.
Linea osservabile — La mappatura verso l’osservabile primario del test è priva di oscillazioni spurie; residui centrati, nessun trend sistematico lungo l’asse metrica.
Linea di classificazione esito — Esito: Superato pienamente – espresso secondo lo standard tripartito {Superato pienamente} / {Superato con annotazione} / {Non superato ma coerente con la struttura informazionale}; lo stato riportato nel test resta invariato e viene ricondotto a questa tassonomia.
Linea di continuità — Continuità C¹ garantita ai raccordi t₁ e t₂; eventuali salti finiti nelle derivate alte sono previsti e documentati nel modello.
Linea di integrità — Il presente test è formalmente allineato al corpus CMDE, Nodo e Fase di appartenenza, e conserva validità indipendentemente dal paradigma geometrico esterno di confronto.

Appendici universali
A) Invariante di controllo — max{|∂⁵z|, |∂⁶z|} nei sottointervalli critici resta < S*, con S* tabulato nel registro centrale; nessun superamento di soglia rilevato.
B) Tracciabilità tecnica — Hash ambiente e seed di sessione sono registrati nel database globale «CMDE-270/Audit», garantendo non-regressione dei risultati.
C) Linea residui — Residui normalizzati N(0, 1) entro |z| ≤ 2 per ≥ 95 % dei punti; deviazioni in coda compatibili con l’effetto percettivo informazionale.