1. Home
  2. Docs
  3. Statystyka – lub przewodnik dla graczy
  4. Treść szkolenia
  5. Podstawowe pojęcia w statystyce

Podstawowe pojęcia w statystyce

Bardzo często w rozmowach ze znajomymi padają takie pytania jak:

„Ile średnio tysięcy kilometrów rocznie jeździsz samochodem?”

„Ile średnio wynosi twój miesięczny rachunek za prąd?”

„Ile pieniędzy wydajesz średnio na leki miesięcznie?”

Życie często wymaga od nas poszukiwania średnich wartości i dlaczego spróbujemy pokazać ci jeden konkretny przypadek, aby było to bardziej zrozumiałe.
Przykładem może być sektor energetyczny – centralne ogrzewanie lub ogrzewanie elektryczne.
1 września ogłoszono wzrost ceny ogrzewania o 11%, a ty masz dylemat – zaprzestać korzystania z centralnego ogrzewania i skorzystać z ogrzewania elektrycznego lub pozostać w obecnej sytuacji. Korzyści i szkody dla zdrowia nie będą brane tutaj pod uwagę, jedynie czysto matematyczna (finansowa) strona problemu.
Sąsiad pokazał ci swoje rachunki za prąd, ponieważ używa on ogrzewanie pozyskiwanego z energii elektrycznej. Przyjrzyjmy się najpierw danym z rachunków sąsiada:

sty lut mar kwi maj cze lip sie wrz paź lis gru
82 75 70 52 40 41 42 13 42 54 74 80

A teraz porównanie twoich kosztów za ogrzewanie centralne oraz za prąd:

sty lut mar kwi maj cze lip sie wrz paź lis gru
Prąd 20 21 22 20 21 22 45 55 20 21 20 23
Centralne 68 62 66 28 0 0 0 0 0 35 65 66

Na podstawie tego przykładu postaramy się wyjaśnić pojęcie statystyki bazując na wartości średniej, którą można obliczyć na kilka różnych sposobów. Sprawdź, który z nich jest dla Ciebie najlepszy.

Najpopularniejszą i zarazem najłatwiejszą metodą jest obliczanie średniej arytmetycznej, gdzie po prostu sumujemy wszystkie wartości i dzielimy je przez ich liczbę – w tym przypadku przez 12 miesięcy.

Dla sąsiada 82 + 75 + 70 + 52 + 40 + 41 + 42 + 13 + 42 + 54 + 74 + 80 = 665

665/12 = 55.40 tyle średnio płaci za prąd.

Dla ciebie: 88 + 83 + 88 + 48 + 21 + 22 + 45 + 55 + 20 + 56 + 85 + 89 = 700

700/12 = 58.30 Tyle płacisz miesięcznie za rachunki za prąd i gaz.

Wniosek wydaje być się jasny, nawet bez obliczania cen po wzroście rachunków za ogrzewanie centralne.

Zastanawiasz się, dlaczego istnieją inne sposoby obliczania? Każdy z nich da inne spojrzenie na liczby i zależnie od pytania, na które próbujesz odpowiedzieć, każdy z trzech może być najbardziej odpowiedni.

Ale jak widać w danych twojego sąsiada i twoich, są albo bardzo niskie, albo bardzo wysokie wartości, przyczyny mogą być różne, ale wynik jest jasny.

Z tego powodu statystyki oferują także inną metodę określania wartości średniej – metodę obliczania MEDIANY. Jednak w tym przypadku dane muszą być w porządku rosnącym lub malejącym, a średnia w szeregu jest średnią. W tym przypadku mamy parzystą ilość danych, w którym to przypadku uciekamy się do ich średniej wartości. Zapiszmy to:

82 75 70 52 40 41 42 13 42 54 74 80 następnie ułóżmy je w kolejności rosnącej

13 40 41 42 42 52 54 70 74 75 80 82, gdzie 52 i 54 są wartościami średnimi, a ich średnią arytmetyczną jest 53, co stanowi MEDIANĄ (średnia wartość rachunku za energię elektryczną sąsiada). W twoim wypadku to:

88 83 88 48 21 22 45 55 20 56 85 89 lub w porządku rosnącym

20 21 22 45 48 55 56 83 85 88 88 89, gdzie 55 i 56 to średnie, a 55,5 to MEDIANA (średnia twojego rachunku).

Z rzeczywistego punktu widzenia dane obliczone przy użyciu tej metody są mniejsze niż średnie, ale należy wziąć pod uwagę jeszcze jedną rzecz – dłuższe serie danych. Na przykład takie, które obejmują rachunki z zeszłego roku, gdy ciebie nie było w gorące miesiące w domu, a twój sąsiad oglądał mistrzostwa w piłce nożnej. Wtedy różnice między średnią a medianą zmniejszyłyby się jeszcze bardziej.

Istnieje również trzeci sposób obliczania średniej wartości o nazwie MODE – po pierwsze jest to metoda najrzadziej stosowana, a po drugie wynik jest wysoce zależny od czynników ubocznych, warto jednak o tym wspomnieć – wystarczy spojrzeć na liczby, które najczęściej pojawiają się w bazie danych. Istnieje możliwość, że może istnieć więcej niż jeden tryb lub nie ma żadnego trybu, co utrudnia określenie średniej.

W tej serii danych jest jeszcze jeden ważny parametr. I to jest rozstęp wartości. Średnia wartość jest oczywiście interesującym parametrem, ale w krajach o wyraźnym klimacie kontynentalnym, w których zimy są mroźne, a lata gorące, a my chcemy żyć w normalnych temperaturach (klimatyzator działa zarówno zimą, jak i latem). Z czysto matematycznego punktu widzenia rozstęp jest różnicą między największą a najmniejszą wartością, często myloną z największą i najmniejszą wartością.

Więc twój sąsiad ma rozstęp rzędu 82-13 = 69, a ty masz 89-22 = 67. Zakres pokazuje szerokość danych, jak daleko są wartości od najniższej do najwyższej.

Was this article helpful to you? Yes 4 No