Dzień Polskiej Statystyki - podstawy teoretyczne


Oceń artykuł Zobacz ranking
Przepisz powyższy kod i oceń artykuł »
Dzień Polskiej Statystyki - podstawy teoretyczne
2017-03-06
Poprzedni artykuł, nawiązując do przypadającego na 9 marca Dnia Polskiej Statystyki, poświęcono sumarycznej analizie historii i rozwoju statystyki jako dziedziny nauki.

 

Zamów artykuły sponsorowane na serwisie Kafito.pl w kilka minut, poprzez platformę Link Buildingu np.:

Przeczytaj również:

 

 

 

Tytułem przypomnienia warto nadmienić, iż wyszczególniono w ramach tychże analiz:

  • statystykę opisową, tj. dział statystyki ukierunkowany na szacunki parametrów populacji w oparciu o dostępny badaczowi zbiór danych;
  • statystykę matematyczną, tj. dział statystyki, którego istotę stanowi przeniesienie wyników z ograniczonej próby badawczej (tzw. ich uogólnienie) na całą populację, z której próbę tę wyłoniono - gałąź ta (zwana też „wnioskowaniem statystycznym”), w ramach ww. przenoszeń wyników i szacowania błędów tego typu uogólnień, obejmuje w szczególności estymację parametrów populacji, weryfikację hipotez statystycznych oraz klasteryzację obserwacji.

Jak zauważyć to może szanowny Czytelnik, opis powyższych gałęzi statystyki jako nauki jest nieco bardziej formalny niż dokonany uprzednio - więcej w nim również terminów, które określić można by mianem fachowych. Dzień Polskiej Statystyki to Dora okazja, by poznać podstawowe zagadnienia teoretyczne, jakie wykorzystuje się w statystyce, a które to kompleksowo (wraz z prostymi przykładami i aspektami praktycznego zastosowania) omawia portal http://www.statystyka.az.pl.

I tak dla przykładu wspomniane wcześniej wnioskowanie statystyczne to proces umożliwiający wypracowywanie istotnych wniosków na temat cech całej populacji generalnej w oparciu o  analizę danych pozyskanych z odpowiednio dobranej i objętej badaniem próby. Z kolei populacja generalna (zwana też statystyczną) jest niczym innym, jak zbiorowością, na której to prowadzi się dane badanie. Ponieważ zbiór taki - z racji na aspekty czasowe i finansowe oraz możliwości techniczne - jest jednak zazwyczaj niemożliwy do zbadania w pełnym zakresie, pomiarem obejmuje się jedynie jego przedstawicielstwo - próbę badawczą. Stanowi ona podzbiór elementów, jakie wybrano  z ogółu populacji oraz poddano badaniu - dobór ten, dokonywany w oparciu o dedykowane temu metody, przyjmuje postać losową lub celową.

Próba losowa budowana jest z uwzględnieniem prawdopodobieństwa inkluzji, jakie definiuje się dla każdego z elementów populacji statystycznej - z racji na taki losowy charakter, badacz nie ma wpływu na skład próby. Jako podstawowe rodzaje tego typu próby wyróżnić należy próby wylosowane w sposób:

  • prosty - prawdopodobieństwo wylosowania karego elementu populacji jest równe,
  •  warstwowy - populacja generalna dzielona jest na warstwy (podgrupy rozłączne) zrzeszające elementy o danych cechach, przy czym losowanie odbywa się oddzielnie w każdej z warstw,
  • zespołowy - w tym wypadku populacja statystyczna dzielona jest na zespoły (grupy, wyłonione w oparciu o cechy elementów populacji), które z kolei podlegają losowaniu całościowo (brak losowania pojedynczych jednostek),
  • dwu(wielo)stopniowe - jest to losowanie etapowe, gdzie z populacji generalnej losuje się jedną z wyłonionych z niej podgrup, z niej wybiera się droga losowania kolejną, aż do uzyskania odpowiednio małej próby/małych prób .

Co istotne, poszczególne losowania mogą dopuszczać możliwość wielokrotnego znalezienia się elementu w próbie (losowanie na zwrotne) i lub nie (losowanie bezzwrotne).

Z kolei próba celowa uwzględnia dobór elementów populacji generalnej do pomiaru w sposób subiektywny - zależy on od intuicji i wiedzy badacza w zakresie wskazania do badania odpowiednich jednostek.

Niezależnie od sposobu doboru próby wymaga się, aby wykazywała ona tzw. reprezentatywność, tj. zachowywała charakter tykę ogółu populacji generalnej ze względu na wybrane jej cechy. Skoro zaś mowa o cechach statystycznych warto podkreślić, iż są to czynniki wyróżniające jednostki (elementy) danej populacji - to czyni je przedmiotem omawianych tu badań statystycznych. Same cechy podzielić można na:

  • jakościowe, tj. niemierzalne i charakteryzowane wielkościami nieliczbowymi (np. kolor włosów, płeć),
  • ilościowe, tj. mierzalne i charakteryzowane wielkościami liczbowymi,  w tym - cechy ilościowe ciągłe (przyjmują każdą wartość z danego przedziału, np. wzrost, waga), dyskretne (przyjmują wartości pełne, np. liczba dzieci w rodzinie) i porządkowe (ich wartości służą porządkowaniu elementów ze względu na nasilenie danej cechy).

W oparciu o dane pozyskane z badanej próby dokonuje się szacowania pewnych parametrów cech statystycznych opisujących ogół populacji generalnej - proces ten nazywany jest estymacją, a jego efekty to estymatory, czyli statystyki odzwierciedlające interesujące statystyka cechy. Estymacja parametrów cech populacji, czy to dokonana przedziałowo (jej wynikiem jest przedział, w który z wysokim prawdopodobieństwem występuje poszukiwana wartość) , czy punktowo (jej wynikiem jest pojedyncza wartość), pozwala na weryfikację hipotez statystycznych, tj. weryfikację przyjętego przez statystyka rozkładu cech w badanej populacji - hipotezy takie mogą mieć charakter parametryczny (odnoszą się do jednego z parametrów rozkładu cechy) lub nieparametryczny (odnoszą się do postaci funkcyjnej rozkładu cechy). Ich weryfikacja, z punktu widzenia statystyki matematycznej, sprowadza się do konstrukcji dwóch hipotez: zerowej i przeciwstawnej do niej hipotezy alternatywnej. W oparciu o to tworzy sie statystykę testową (tj. określonej na przestrzeni statystycznej mierzalnej funkcji) i sprawdza, czy przy przyjętym przez badacza poziomie istotności wartość tejże statystyki mieści w obszarze krytycznym testu (powoduje to odrzucenie hipotezy zerowej - w przeciwnym wypadku hipoteza, w związku z brakiem statystycznych przesłanek, uznana zostaje za prawdziwą). W kontekście tym warto podkreślić, iż ww. test statystyczny to narzędzie budowane w oparciu o rozkład statystyki testowej i służący weryfikacji hipotez.

Powyższe opracowanie zawiera jedynie krótką charakterystykę podstawowych pojęć statystycznych. Pełniejszy zakres terminologii zawarto m.in. na ww. portalu „Statystyka od A do Z” - wiedza ta stanowi fundament zaawansowanych analiz, zarówno w odniesieniu do problematyki ogólnej (które poświęcono m.in. uwagę na portalu www.statystyka.eu), jak i do problematyki zawężonej, bo dedykowanej jedynie wybranej dziedzinie - np. medycznej (o tego typu statystyce przeczytać szerzej można na portalu www.statystyka-medyczna.com.pl).

Mam nadzieję, że lektura przypadła Państwu do gustu i choćw minimalnym stopniu zainteresowała Państwa omawianym zagadnieniem.

Życzę udanego Dnia Polskiej Statystyki!

Nadesłał:

Badania Rynku

Wasze komentarze (0):


Przepisz kod:
Twój podpis:
System komentarzy dostarcza serwis eGadki.pl