T-test to sposób na określenie, czy istnieją statystycznie istotne różnice między zestawami danych, przy użyciu rozkładu t-Studenta. Test T w programie Excel to test T dla dwóch próbek porównujący średnie z dwóch próbek. W tym artykule wyjaśniono, co oznacza istotność statystyczna i pokazano, jak wykonać test T w programie Excel.
Instrukcje zawarte w tym artykule dotyczą programu Excel 2019, 2016, 2013, 2010, 2007; Excel dla Microsoft 365 i Excel Online.
Co to jest istotność statystyczna?
Wyobraź sobie, że chcesz wiedzieć, która z dwóch kości da lepszy wynik. Rzucasz pierwszą kostką i otrzymujesz 2; rzucasz drugą kostką i otrzymujesz 6. Czy to mówi ci, że druga kostka zwykle daje wyższe wyniki? Jeśli odpowiedziałeś: „Oczywiście, że nie”, to masz już pewne pojęcie o istotności statystycznej. Rozumiesz, że różnica wynikała z losowej zmiany wyniku za każdym razem, gdy rzuca się kostką. Ponieważ próbka była bardzo mała (tylko jedna rolka), nie pokazała niczego istotnego.
Teraz wyobraź sobie, że rzucasz każdą kostką 6 razy:
- Pierwsza kostka rzuca 3, 6, 6, 4, 3, 3; Średnia=4,17
- Druga kostka rzuca 5, 6, 2, 5, 2, 4; Średnia=4,00
Czy to teraz dowodzi, że pierwsza kość daje wyższe wyniki niż druga? Prawdopodobnie nie. Mała próba ze stosunkowo niewielką różnicą między średnimi sprawia, że prawdopodobnie różnica nadal wynika z losowych odchyleń. W miarę zwiększania liczby rzutów kostką trudno jest udzielić zdroworozsądkowej odpowiedzi na pytanie – czy różnica między wynikami jest wynikiem losowej zmienności, czy też jedna z nich faktycznie da wyższe wyniki niż druga?
Istotność to prawdopodobieństwo, że zaobserwowana różnica między próbkami wynika z losowych zmian. Istotność jest często nazywana poziomem alfa lub po prostu „α”. Poziom ufności lub po prostu „c” to prawdopodobieństwo, że różnica między próbkami nie wynika z losowej zmienności; innymi słowy, że istnieje różnica między podstawowymi populacjami. Dlatego: c=1 – α
Możemy ustawić „α” na dowolnym poziomie, aby mieć pewność, że udowodniliśmy znaczenie. Bardzo często stosuje się α=5% (95% ufność), ale jeśli chcemy być naprawdę pewni, że jakiekolwiek różnice nie są spowodowane przypadkową zmiennością, możemy zastosować wyższy poziom ufności, używając α=1% lub nawet α=0,1 %.
Różne testy statystyczne służą do obliczania istotności w różnych sytuacjach. Testy T służą do określenia, czy średnie z dwóch populacji są różne, a testy F służą do określenia, czy wariancje są różne.
Dlaczego testować istotność statystyczną?
Porównując różne rzeczy, musimy użyć testów istotności, aby określić, czy jedna jest lepsza od drugiej. Dotyczy to wielu pól, na przykład:
- W biznesie ludzie muszą porównywać różne produkty i metody marketingowe.
- W sporcie ludzie muszą porównywać różne urządzenia, techniki i zawodników.
- W inżynierii ludzie muszą porównywać różne projekty i ustawienia parametrów.
Jeśli chcesz sprawdzić, czy coś działa lepiej niż coś innego, w dowolnej dziedzinie, musisz przeprowadzić test istotności statystycznej.
Co to jest rozkład T ucznia?
Rozkład t-Studenta jest podobny do rozkładu normalnego (lub Gaussa). Obydwa są rozkładami w kształcie dzwonu z większością wyników zbliżonych do średniej, ale niektóre rzadkie zdarzenia są dość daleko od średniej w obu kierunkach, zwanych ogonami rozkładu.
Dokładny kształt rozkładu t-Studenta zależy od wielkości próby. Dla próbek powyżej 30 jest bardzo podobny do rozkładu normalnego. W miarę zmniejszania się wielkości próbki ogony stają się większe, reprezentując zwiększoną niepewność wynikającą z wnioskowania na podstawie małej próbki.
Jak wykonać test T w programie Excel
Zanim będzie można zastosować test t w celu ustalenia, czy istnieje statystycznie istotna różnica między średnimi dwóch próbek, należy najpierw wykonać test t. Dzieje się tak, ponieważ dla testu T wykonywane są różne obliczenia w zależności od tego, czy istnieje znacząca różnica między wariancjami.
Do przeprowadzenia tej analizy potrzebny będzie dodatek Analysis Toolpak.
Sprawdzanie i ładowanie dodatku Analysis Toolpak
Aby sprawdzić i aktywować pakiet narzędzi analitycznych, wykonaj następujące kroki:
- Wybierz kartę PLIK >wybierz Opcje.
- W oknie dialogowym Opcje wybierz Dodatki z zakładek po lewej stronie.
-
U dołu okna wybierz menu rozwijane Zarządzaj, a następnie wybierz Dodatki programu Excel. Wybierz Przejdź.
- Upewnij się, że pole wyboru obok Analysis Toolpak jest zaznaczone, a następnie wybierz OK.
- Pakiet narzędzi analitycznych jest teraz aktywny i możesz rozpocząć stosowanie testów F i T.
Wykonywanie testu F i testu T w programie Excel
-
Wprowadź dwa zestawy danych do arkusza kalkulacyjnego. W tym przypadku rozważamy sprzedaż dwóch produktów w ciągu tygodnia. Obliczana jest również średnia dzienna wartość sprzedaży dla każdego produktu, wraz z jej odchyleniem standardowym.
-
Wybierz kartę Dane > Analiza danych
-
Wybierz F-Testuj dwie próbki dla wariancji z listy, a następnie wybierz OK.
Test F jest bardzo wrażliwy na odchylenia od normalności. Dlatego bezpieczniejsze może być użycie testu Welcha, ale w programie Excel jest to trudniejsze.
-
Wybierz zakres zmiennej 1 i zakres zmiennej 2; ustawić Alfa (0,05 daje 95% ufność); wybierz komórkę dla lewego górnego rogu wyniku, biorąc pod uwagę, że wypełni to 3 kolumny i 10 wierszy. Wybierz OK.
W przypadku zakresu zmiennej 1 należy wybrać próbkę o największym odchyleniu standardowym (lub wariancji).
-
Przejrzyj wyniki testu F, aby określić, czy istnieje znacząca różnica między wariancjami. Wyniki dają trzy ważne wartości:
- F: Stosunek między wariancjami.
- P(F<=f) jednostronny: Prawdopodobieństwo, że zmienna 1 nie ma w rzeczywistości większej wariancji niż zmienna 2. Jeśli jest ona większa niż alfa, co wynosi ogólnie 0,05, to nie ma znaczącej różnicy między wariancjami.
- F Krytyczny jednostronny: Wartość F, która byłaby wymagana do uzyskania P(F<=f)=α. Jeśli ta wartość jest większa niż F, oznacza to również, że nie ma znaczącej różnicy między wariancjami.
P(F<=f) można również obliczyć przy użyciu funkcji FDIST z F i stopniami swobody dla każdej próbki jako danymi wejściowymi. Stopnie swobody to po prostu liczba obserwacji w próbce minus jeden.
-
Teraz, gdy już wiesz, czy istnieje różnica między wariancjami, możesz wybrać odpowiedni T-Test. Wybierz zakładkę Dane > Analiza danych, a następnie wybierz albo Test t: Dwie próby przy założeniu równych wariancjilub Test t: Dwie próbki przy założeniu nierównych odchyleń
-
Niezależnie od tego, którą opcję wybrałeś w poprzednim kroku, zostanie wyświetlone to samo okno dialogowe, w którym można wprowadzić szczegóły analizy. Aby rozpocząć, wybierz zakresy zawierające próbki dla Zmienna 1 Zakres i Zmienna 2 Zakres.
- Zakładając, że chcesz przetestować brak różnicy między średnimi, ustaw Hipotetyczna różnica średniej na zero.
- Ustaw poziom istotności Alfa (0,05 daje 95% ufność) i wybierz komórkę w lewym górnym rogu wyniku, biorąc pod uwagę, że wypełni to 3 kolumny i 14 wierszy. Wybierz OK.
-
Przejrzyj wyniki, aby zdecydować, czy istnieje znacząca różnica między średnimi.
Podobnie jak w przypadku testu F, jeśli wartość p, w tym przypadku P(T<=t), jest większa niż alfa, to nie ma znaczącej różnicy. Jednak w tym przypadku podane są dwie wartości p, jedna dla testu z jednym ogonem, a druga dla testu z dwoma ogonami. W takim przypadku użyj wartości z dwoma ogonami, ponieważ każda zmienna mająca większą średnią byłaby znaczącą różnicą.