Funzione di ripartizione: Difference between revisions

Latest revision as of 20:04, 13 April 2024

In statistica e teoria della probabilità, la funzione di ripartizione (o funzione cumulativa) è una funzione di variabile reale che racchiude le informazioni su un fenomeno (un insieme di dati, un evento casuale) riguardanti la sua presenza o la sua distribuzione prima o dopo un certo punto.

Nel calcolo delle probabilità

Template:Vedi anche Nel calcolo delle probabilità la funzione di ripartizione, o funzione di probabilità cumulata, di una variabile casuale <math>X</math> a valori reali è la funzione che associa a ciascun valore <math>x</math> la probabilità del seguente evento: "la variabile casuale <math>X</math> assume valori minori o uguali ad <math>x</math>".

In altre parole, è la funzione <math>F\colon \R \to [0,1]</math> con dominio la retta reale e immagine nell'intervallo <math>[0,1]</math> definita da

Una funzione F è una valida funzione di ripartizione se è non decrescente, continua a destra e

<math>F(x)\geq 0, \quad \forall x </math>

<math>\lim_{x \to +\infty} F(x) =1</math>

<math>\lim_{x \to -\infty} F(x) =0</math>

Una funzione di ripartizione non è necessariamente continua a sinistra (e dunque continua globalmente): se <math>X</math> è una variabile casuale discreta e <math>z</math> un punto del suo supporto, allora <math>F</math> è una funzione a gradino e dunque

(ponendo senza restrizioni di generalità <math>x_1 < x_2 < \ldots< x_n < x < z</math>) poiché è una costante indipendente da <math>x</math>, mentre

dunque essendo <math>p(z)\neq 0</math> si ha che <math>F</math> non è continua.

Più in generale, una funzione di ripartizione individua univocamente una intera distribuzione di probabilità, cioè una funzione che ad ogni sottoinsieme misurabile <math>A</math> associa la probabilità che <math>X</math> cada in <math>A</math><ref>Template:Cita.</ref>.

Proprietà

Si può dimostrare dalla definizione che valgono le seguenti uguaglianze, ponendo per semplicità di notazione <math>F(x^-):=\lim_{t \to x^-}F(t)</math>:

<math>\operatorname{P}(X < x)=F(x^-)</math>
<math>\operatorname{P}(a < X \leq b)=F(b)-F(a)</math>
<math>\operatorname{P}(a \leq X < b)=F(b^-)-F(a^-)</math>
<math>\operatorname{P}(a \leq X \leq b)=F(b)-F(a^-)</math>
<math>\operatorname{P}(a < X < b)=F(b^-)-F(a)</math>
<math>\operatorname{P}(X=b) = F(b) - F(b^-)</math>

Se <math>X</math> è una variabile casuale assolutamente continua la funzione di ripartizione di <math>X</math> può essere espressa come funzione integrale:

<math>F(x) = \int_{-\infty}^xf(u)du</math>

ove <math>f</math> è detta funzione di densità di <math>X</math>. Si può anche considerare la relazione inversa:

Se <math>X</math> è una variabile casuale discreta (ossia ammette una collezione numerabile di possibili valori <math>x_1,\ldots,x_n,\ldots</math>)

dove <math>p(x)=P(X=x)</math> è detta funzione di probabilità di <math>X</math>.

Esempi

File:Grafico v.c.uniforme.png

Grafico della funzione di ripartizione relativa alla distribuzione uniforme

Se <math>X</math> è la variabile aleatoria risultato del lancio di un dado a sei facce si ha

<math>F(x)=\begin{cases} 0 & x<1 \\ \lfloor x\rfloor /6 & 1\leq x < 6 \\ 1 & x\geq 6 \end{cases}</math>

dove con <math>\lfloor x\rfloor</math> si indica la parte intera di x.

Se <math>X</math> è la variabile casuale uniforme continua in <math>[0,1]</math> si ha

<math>F(x)=\begin{cases} 0 & x<0 \\ x & 0\leq x < 1 \\ 1 & x\geq 1 \end{cases}</math>.

Funzione di sopravvivenza

In alcuni modelli è più utile analizzare la probabilità che un certo dato numerico valga più del valore <math>x</math> (come nella vita di un organismo, biologico o meccanico): questi casi sono trattati dalla branca chiamata analisi di sopravvivenza. Si definisce allora la funzione di sopravvivenza <math>S</math> (dal termine inglese survival) come il complemento della funzione di ripartizione:

Nei casi rispettivamente continuo e discreto, valgono naturalmente delle identità speculari a quelle della ripartizione:

<math>S(x)=\int_x^{+\infty} f(t)dt</math>

e

Ogni funzione di sopravvivenza <math>S(x)</math> è una funzione monotona decrescente, vale a dire <math>S(a) \le S(b)</math> per <math>a > b.</math>

Il tempo <math>x=0</math> rappresenta l'origine, in genere l'inizio di uno studio o l'inizio del funzionamento di alcuni sistemi.

Variabili aleatorie multivariate

Più in generale la funzione di ripartizione di una variabile aleatoria <math>X</math> a valori in <math>\mathbb R^k</math> è la funzione <math>F(x)</math> con dominio <math>\mathbb R^k</math> e codominio l'intervallo <math>[0,1]</math> definita da

<math>F(x_1,\ldots,x_k)=P((X_1\leq x_1) \cap (X_2\leq x_2) \cap \ldots \cap (X_k\leq x_k))</math>

dove <math>X_i</math> sono le componenti di <math>X</math>.

Questa funzione possiede la proprietà di essere continua a destra separatamente per ogni variabile. Valgono inoltre le seguenti formule, derivanti dalla definizione:

Per qualsiasi <math>i</math>, <math>\lim_{x_i \to -\infty}F(x_1,\ldots,x_k)=0</math>
<math>F</math> è monotona crescente separatamente in ogni variabile, cioè se <math>c > 0</math>, <math>F(x_1,\ldots,x_i+c,\ldots,x_k) \geq F(x_1,\ldots,x_i,\ldots,x_k)</math>
se <math>k=2</math> per semplicità, <math>P(a < X_1 \leq b, c < X_2 \leq d)=F(b,d)+F(a,c)-F(a,d)-F(b,c)</math>
<math>\lim_{x_i \to +\infty}F(x_1,\ldots,x_k)=G(x_1,\ldots,x_{i-1},x_{i+1},\ldots,x_k)</math> dove <math>G</math> è la funzione di ripartizione della variabile <math>(k-1)</math>-variata <math>(X_1,X_2,\ldots,X_{i-1},X_{i+1},\ldots,X_k)</math>.

Da quest'ultima proprietà viene anche l'uguaglianza

<math>\lim_{x_k \to +\infty}\lim_{x_{k-1} \to +\infty}\ldots\lim_{x_1 \to +\infty}F(x_1,x_2,\ldots,x_k)=1</math>

e l'affermazione vale ovviamente anche per ogni permutazione degli indici <math>i</math>.

In statistica descrittiva

Template:Vedi anche In statistica la funzione di ripartizione empirica, o funzione di distribuzione cumulata, viene usata per descrivere fenomeni quantitativi o comunque descritti con valori misurati su scale ordinali, intervallari o proporzionali, ma non se misurati con una scala nominale.

La funzione di ripartizione viene indicata solitamente con <math>F(x)</math> e rappresenta il numero di osservazioni del fenomeno minori o uguali del valore <math>x</math>.

Se <math>x_1,\ldots, x_n</math> sono le osservazioni (ordinate in senso crescente), con frequenze relative <math>f_1,\ldots, f_n</math> la funzione di ripartizione ha espressione analitica

<math>F(x)=\begin{cases}0 & x < x_1 \\F_i=\sum_{j \leq i}f_j & x_i \leq x < x_{i+1} \\ 1 & x \geq x_n \end{cases}</math>

Le <math>F_i</math> sono dette frequenze relative cumulate.

Note

Bibliografia

Giorgio Dall'Aglio, Calcolo delle probabilità, Zanichelli, Bologna, 2003
Template:Cita libro

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Collegamenti esterni

Template:Probabilità Template:Controllo di autorità Template:Portale

Categoria:Statistica matematica Categoria:Teoria della probabilità