Jednolite i normalne rozkłady częstotliwości

Istnieją dwa typowe rozkłady częstotliwości, które możemy również często napotkać w praktyce. Są to równomierny rozkład częstotliwości i normalny rozkład częstotliwości.

Jednolity rozkład częstotliwości

Rozkład jednostajny oznacza, że wszystkie wartości występują równie często w naszej populacji. Na przykład możemy policzyć, ile miesięcy miały lata 2000, 2001, ..., 2009:

Jeśli rzucimy klasyczną wyidealizowaną kostką, mamy prawdopodobieństwo $\frac16$ wyrzucenia 1, prawdopodobieństwo $\frac16$ wyrzucenia 2 itd. Mówimy więc o jednolitym rozkładzie prawdopodobieństwa, ponieważ każdy wynik ma takie samo prawdopodobieństwo.

Rozkład niejednorodny miałby miejsce, gdybyśmy mieli brzęczącą kość, na której prawdopodobieństwo $\frac13$ było zawsze szóstką. Pozostałe strony nie mogą również mieć prawdopodobieństwa $\frac13$. Podobnie, moglibyśmy policzyć liczbę dni w każdym miesiącu - nie wszystkie miesiące mają taką samą liczbę dni, więc nie byłby to równomierny rozkład częstotliwości.

Normalny rozkład prawdopodobieństwa

Rozkład normalny jest czasami nazywany także rozkładem gaussowskim. Jest on używany tylko dla ciągłych zmiennych losowych. Znormalizowany rozkład normalny ma następującą postać:

Znormalizowany rozkład normalny prawdopodobieństwa

Krzywa ta jest opisana przez tak zwaną funkcję Gaussa, która ma postać:

$$ \Large f(x) = \frac{1}{\sigma\sqrt{2\pi}} \mathrm{e}^{-\frac{{(x-\mu)}^2}{2\sigma^2}} $$

Funkcja ta jest dość skomplikowana, nie trzeba jej pamiętać. Widzimy jednak, że możemy sparametryzować rozkład normalny za pomocą średniej i odchylenia standardowego/wariancji. Następnie możemy uzyskać różne wykresy dla różnych wartości średniej i wariancji:

Różne rozkłady normalne

Rozkład normalny jest ważny, ponieważ dość wiernie symuluje różne rozkłady, które możemy napotkać w prawdziwym życiu. Widzimy, że krzywa zawsze ma jedno globalne maksimum, które jest również równe wartości średniej. Na przykład czerwona krzywa ma maksimum na X = 0, więc średnia wartość tej wielkości wynosi zero. Krzywa jest symetryczna, osiowosymetryczna z linią prostopadłą do osi X i przechodzącą przez średnią, punkt X = 0. Innymi słowy - krzywa wygląda tak samo na lewo od zera, jak i na prawo od zera. Zielona krzywa ma te same właściwości, ale z zerem, ale z punktem X = −2.

Rozkład normalny może wiernie opisywać rozkład inteligencji lub IQ wśród ludzi. Średnie IQ wynosi - z definicji - 100. W ten sposób istnieje w przybliżeniu równa liczba osób, które mają IQ powyżej 100 i poniżej 100. Jest w przybliżeniu tyle samo osób o inteligencji nieco poniżej średniej, co osób o inteligencji nieco powyżej średniej, a także tyle samo kretynów, co geniuszy. Chociaż czasami na to nie wygląda :-). Wykres przedstawiający przybliżony rozkład IQ:

Rozkład IQ

W przypadku rozkładu normalnego odchylenie standardowe odgrywa dużą rolę. Jeśli mamy rozkład, który jest normalny i ma odchylenie standardowe $\sigma$, to musi być prawdą, że 68% wartości znajduje się w przedziale $\left<\mu-\sigma, \mu+\sigma\right>$. Oznacza to, że 68% wartości różni się od średniej o co najwyżej jedno odchylenie standardowe. Około 95% wartości musi zatem znajdować się w przedziale $\left<\mu-2\sigma, \mu+2\sigma\right>$, a 99,7% wartości w przedziale $\left<\mu-3\sigma, \mu+3\sigma\right>$. Jest to wyraźnie zilustrowane na poniższym rysunku:

Rozkład normalny i odchylenie standardowe

Odniesienia i źródła