Funzione di ripartizione: Difference between revisions
imported>Mat4free m Annullata la modifica 138799190 di 131.175.147.14 (discussione) |
(No difference)
|
Latest revision as of 20:04, 13 April 2024
In statistica e teoria della probabilità, la funzione di ripartizione (o funzione cumulativa) è una funzione di variabile reale che racchiude le informazioni su un fenomeno (un insieme di dati, un evento casuale) riguardanti la sua presenza o la sua distribuzione prima o dopo un certo punto.
Nel calcolo delle probabilità
Template:Vedi anche Nel calcolo delle probabilità la funzione di ripartizione, o funzione di probabilità cumulata, di una variabile casuale <math>X</math> a valori reali è la funzione che associa a ciascun valore <math>x</math> la probabilità del seguente evento: "la variabile casuale <math>X</math> assume valori minori o uguali ad <math>x</math>".
In altre parole, è la funzione <math>F\colon \R \to [0,1]</math> con dominio la retta reale e immagine nell'intervallo <math>[0,1]</math> definita da
- <math>F(x)=P(X\leq x).</math>
Una funzione F è una valida funzione di ripartizione se è non decrescente, continua a destra e
- <math>F(x)\geq 0, \quad \forall x </math>
- <math>\lim_{x \to +\infty} F(x) =1</math>
- <math>\lim_{x \to -\infty} F(x) =0</math>
Una funzione di ripartizione non è necessariamente continua a sinistra (e dunque continua globalmente): se <math>X</math> è una variabile casuale discreta e <math>z</math> un punto del suo supporto, allora <math>F</math> è una funzione a gradino e dunque
- <math>\lim_{x \to z^-}F(x)=\lim_{x \to z^-} \sum_{i=1}^n p(x_i)=\sum_{i=1}^n p(x_i)</math>
(ponendo senza restrizioni di generalità <math>x_1 < x_2 < \ldots< x_n < x < z</math>) poiché è una costante indipendente da <math>x</math>, mentre
- <math>F(z)=\sum_{i=1}^n p(x_i)+p(z)</math>
dunque essendo <math>p(z)\neq 0</math> si ha che <math>F</math> non è continua.
Più in generale, una funzione di ripartizione individua univocamente una intera distribuzione di probabilità, cioè una funzione che ad ogni sottoinsieme misurabile <math>A</math> associa la probabilità che <math>X</math> cada in <math>A</math><ref>Template:Cita.</ref>.
Proprietà
Si può dimostrare dalla definizione che valgono le seguenti uguaglianze, ponendo per semplicità di notazione <math>F(x^-):=\lim_{t \to x^-}F(t)</math>:
- <math>\operatorname{P}(X < x)=F(x^-)</math>
- <math>\operatorname{P}(a < X \leq b)=F(b)-F(a)</math>
- <math>\operatorname{P}(a \leq X < b)=F(b^-)-F(a^-)</math>
- <math>\operatorname{P}(a \leq X \leq b)=F(b)-F(a^-)</math>
- <math>\operatorname{P}(a < X < b)=F(b^-)-F(a)</math>
- <math>\operatorname{P}(X=b) = F(b) - F(b^-)</math>
Se <math>X</math> è una variabile casuale assolutamente continua la funzione di ripartizione di <math>X</math> può essere espressa come funzione integrale:
- <math>F(x) = \int_{-\infty}^xf(u)du</math>
ove <math>f</math> è detta funzione di densità di <math>X</math>. Si può anche considerare la relazione inversa:
- <math>F'(x) = f(x)</math>
Se <math>X</math> è una variabile casuale discreta (ossia ammette una collezione numerabile di possibili valori <math>x_1,\ldots,x_n,\ldots</math>)
- <math>F(x) = \sum_{x_i\leq x} p(x_i)</math>
dove <math>p(x)=P(X=x)</math> è detta funzione di probabilità di <math>X</math>.
Esempi
Se <math>X</math> è la variabile aleatoria risultato del lancio di un dado a sei facce si ha
- <math>F(x)=\begin{cases} 0 & x<1 \\ \lfloor x\rfloor /6 & 1\leq x < 6 \\ 1 & x\geq 6 \end{cases}</math>
dove con <math>\lfloor x\rfloor</math> si indica la parte intera di x.
Se <math>X</math> è la variabile casuale uniforme continua in <math>[0,1]</math> si ha
- <math>F(x)=\begin{cases} 0 & x<0 \\ x & 0\leq x < 1 \\ 1 & x\geq 1 \end{cases}</math>.
Funzione di sopravvivenza
In alcuni modelli è più utile analizzare la probabilità che un certo dato numerico valga più del valore <math>x</math> (come nella vita di un organismo, biologico o meccanico): questi casi sono trattati dalla branca chiamata analisi di sopravvivenza. Si definisce allora la funzione di sopravvivenza <math>S</math> (dal termine inglese survival) come il complemento della funzione di ripartizione:
- <math>S(x)=P(X>x)=1-F(x)</math>
Nei casi rispettivamente continuo e discreto, valgono naturalmente delle identità speculari a quelle della ripartizione:
- <math>S(x)=\int_x^{+\infty} f(t)dt</math>
e
- <math>S(x)=\sum_{t>x} p(t).</math>
Ogni funzione di sopravvivenza <math>S(x)</math> è una funzione monotona decrescente, vale a dire <math>S(a) \le S(b)</math> per <math>a > b.</math>
Il tempo <math>x=0</math> rappresenta l'origine, in genere l'inizio di uno studio o l'inizio del funzionamento di alcuni sistemi.
Variabili aleatorie multivariate
Più in generale la funzione di ripartizione di una variabile aleatoria <math>X</math> a valori in <math>\mathbb R^k</math> è la funzione <math>F(x)</math> con dominio <math>\mathbb R^k</math> e codominio l'intervallo <math>[0,1]</math> definita da
- <math>F(x_1,\ldots,x_k)=P((X_1\leq x_1) \cap (X_2\leq x_2) \cap \ldots \cap (X_k\leq x_k))</math>
dove <math>X_i</math> sono le componenti di <math>X</math>.
Questa funzione possiede la proprietà di essere continua a destra separatamente per ogni variabile. Valgono inoltre le seguenti formule, derivanti dalla definizione:
- Per qualsiasi <math>i</math>, <math>\lim_{x_i \to -\infty}F(x_1,\ldots,x_k)=0</math>
- <math>F</math> è monotona crescente separatamente in ogni variabile, cioè se <math>c > 0</math>, <math>F(x_1,\ldots,x_i+c,\ldots,x_k) \geq F(x_1,\ldots,x_i,\ldots,x_k)</math>
- se <math>k=2</math> per semplicità, <math>P(a < X_1 \leq b, c < X_2 \leq d)=F(b,d)+F(a,c)-F(a,d)-F(b,c)</math>
- <math>\lim_{x_i \to +\infty}F(x_1,\ldots,x_k)=G(x_1,\ldots,x_{i-1},x_{i+1},\ldots,x_k)</math> dove <math>G</math> è la funzione di ripartizione della variabile <math>(k-1)</math>-variata <math>(X_1,X_2,\ldots,X_{i-1},X_{i+1},\ldots,X_k)</math>.
Da quest'ultima proprietà viene anche l'uguaglianza
- <math>\lim_{x_k \to +\infty}\lim_{x_{k-1} \to +\infty}\ldots\lim_{x_1 \to +\infty}F(x_1,x_2,\ldots,x_k)=1</math>
e l'affermazione vale ovviamente anche per ogni permutazione degli indici <math>i</math>.
In statistica descrittiva
Template:Vedi anche In statistica la funzione di ripartizione empirica, o funzione di distribuzione cumulata, viene usata per descrivere fenomeni quantitativi o comunque descritti con valori misurati su scale ordinali, intervallari o proporzionali, ma non se misurati con una scala nominale.
La funzione di ripartizione viene indicata solitamente con <math>F(x)</math> e rappresenta il numero di osservazioni del fenomeno minori o uguali del valore <math>x</math>.
Se <math>x_1,\ldots, x_n</math> sono le osservazioni (ordinate in senso crescente), con frequenze relative <math>f_1,\ldots, f_n</math> la funzione di ripartizione ha espressione analitica
- <math>F(x)=\begin{cases}0 & x < x_1 \\F_i=\sum_{j \leq i}f_j & x_i \leq x < x_{i+1} \\ 1 & x \geq x_n \end{cases}</math>
Le <math>F_i</math> sono dette frequenze relative cumulate.
Note
<references />
Bibliografia
- Giorgio Dall'Aglio, Calcolo delle probabilità, Zanichelli, Bologna, 2003
- Template:Cita libro
Voci correlate
- Distribuzione (statistica)
- Funzione càdlàg
- Funzione di densità di probabilità
- Funzione caratteristica (teoria della probabilità)
- Funzione di probabilità
- Integrale
- Percentile
- Quantile
- Statistica
- Teoria della probabilità
- Variabile casuale
- Histogram matching
Altri progetti
Collegamenti esterni
Template:Probabilità Template:Controllo di autorità Template:Portale
Categoria:Statistica matematica Categoria:Teoria della probabilità