Approfondimento sulla verifica dei modelli meteorologici

1. Verifica di variabili continue

La verifica di previsioni di variabili continue (es. temperatura a 2m, intensità del vento a 10m) si effettua, in generale, misurando lo scarto (o errore) tra i valori previsti e quelli osservati della grandezza fisica esaminata in un campione statistico rappresentativo ed omogeneo.
Tra gli indici (scores, in inglese) più comunemente utilizzati, la radice dell'errore quadratico medio (in inglese root rean rquare rrror, RMSE) misura la grandezza media dell'errore.
La formula matematica che definisce il RMSE si può trovare nei riferimenti citati in calce. In sostanza si calcola il quadrato della differenza tra i valori previsti ed i corrispondenti osservati, si effettua quindi la media sul campione e si estrae infine la radice quadrata. Poiché tali deviazioni sono pesate al quadrato prima dell'operazione di media, il RMSE dà un contributo elevato agli scostamenti grandi in valore assoluto.

Per questo il RMSE è un indice che può variare da 0 a ∞  orientato negativamente ( valori più bassi sono migliori ) comunemente utilizzato per diagnosticare variazioni degli errori in un insieme di previsioni.

2. Verifica di previsioni categoriche

Per variabili previste di tipo categorico, come gli eventi "dicotomici" (vero/falso, ad es. per l'evento "precipitazione superiore ad una soglia prefissata"), si definisce invece la cosiddetta tabella di contingenza (contingency table, in inglese) che riporta la frequenza, per un campione di dati, di previsioni ed osservazioni per ciascuno dei casi possibili (vero/falso).
Le quattro combinazioni di casi previsti (vero o falso) e osservati (vero o falso), che costituiscono le cosiddette distribuzioni congiunte (joint distributions), sono chiamate rispettivamente (usando la terminologia in inglese):

  • hits - eventi previsti, osservati;
  • misses - eventi non previsti, osservati;
  • false alarms - eventi previsti, non osservati;
  • correct negatives - eventi non previsti, non osservati.

La tabella di contingenza rappresenta uno strumento utile all'analisi degli errori commessi nel processo prognostico. Un ideale sistema perfetto di previsioni produrrebbe soltanto "hits" e "correct negatives", senza "misses" né "false alarms".
A partire dagli elementi in tabella, possono essere calcolati opportuni indici statistici per descrivere particolari aspetti della performance del sistema di previsioni.
Tra essi, l'accordo a posteriori (in inglese post agreement, PAG), definito come il rapporto hits / (hits + false alarms) ed espresso tipicamente in valori percentuali, fornisce una misura della frazione dei casi previsti con successo sul totale di casi previsti dal sistema prognostico.

Per approfondimenti ulteriori sull'argomento si possono visitare i siti:
http://www.cawcr.gov.au/projects/verification
http://www.eumetcal.org/resources/ukmeteocal/verification/www/english/courses/msgcrs/index.htm