


Eksploruj, wizualizuj, modeluj. Lepszy wgląd zaczyna się od Stata
Szybko. Dokładnie. Łatwo w użyciu. Stata to kompletny, zintegrowany pakiet oprogramowania, który zapewnia wszystkie potrzeby związane z nauką o danych — manipulację danymi, wizualizację, statystyki i automatyczne raportowanie.
Przedstawiamy Stata 19
Kup lub uaktualnij Stata
Kup Stata do użytku biznesowego, rządowego, non-profit, edukacyjnego lub studenckiego.
OS | Windows 10 or macOS 11.0 or newer |
---|---|
Processor | Applie Silicon, Intel or AMD processor (Core i3 equivalent or better) |
Memory | 4GB RAM |
Hard Drive | 2GB |

Zarządzanie danymi

Statystyki

Grafika
Dlaczego Stata?
Szybko. Dokładnie. Łatwo w użyciu. Stata to kompletny, zintegrowany pakiet oprogramowania, który zapewnia wszystkie potrzeby związane z nauką o danych — manipulację danymi, wizualizację, statystyki i automatyczne raportowanie.
|
|


Zapanuj nad swoimi danymi
Funkcje zarządzania danymi Stata dają Ci pełną kontrolę.
|
|


Grafika jakości publikacji
Stata ułatwia generowanie wykresów o wyjątkowej stylistyce i jakości publikacji.
Możesz wskazać i kliknąć, aby utworzyć niestandardowy wykres. Możesz też napisać skrypty, aby wygenerować setki lub tysiące wykresów w sposób powtarzalny.
Eksportuj wykresy do formatu EPS lub TIFF w celu publikacji, do formatu PNG lub SVG w celu umieszczenia w Internecie albo do formatu PDF w celu przeglądania.
Dzięki zintegrowanemu Edytorowi wykresów możesz klikać, aby zmieniać dowolne elementy wykresu lub dodawać tytuły, notatki, linie, strzałki i tekst.
Automatyczne raportowanie
Wszystkie narzędzia potrzebne do automatyzacji raportowania wyników.
- Dokument Dynamic Markdown
- Utwórz dokumenty Word
- Utwórz dokumenty PDF
- Utwórz pliki Excel
- Tabele dostosowywane
- Schematy graficzne
- Słowo, HTML, PDF, SVG, PNG


Badania naprawdę powtarzalne
Wiele osób mówi o powtarzalnych badaniach. Stata poświęca się temu od ponad 30 lat.
Ciągle dodajemy nowe funkcje; nawet fundamentalnie zmieniliśmy elementy języka. Nieważne. Stata jest jedynym pakietem statystycznym ze zintegrowanym wersjonowaniem. Jeśli napisałeś skrypt do wykonania analizy w 1985 r., ten sam skrypt nadal będzie działał i nadal będzie generował te same wyniki dzisiaj. Każdy zestaw danych, który utworzyłeś w 1985 r., możesz odczytać dzisiaj. I to samo będzie prawdą w 2050 r. Stata będzie w stanie uruchomić wszystko, co robisz dzisiaj.
Powtarzalność wyników jest dla nas kwestią priorytetową.
PyStata — integracja z Pythonem
Wywołuj Pythona interaktywnie lub osadź go w kodzie Stata.
Wywołanie Stata z poziomu Pythona i wywołanie kodu Stata ze środowisk IPython.
Użyj Stata w Jupyter Notebook.
Bezproblemowe przesyłanie danych i wyników między Statą i Pythonem.
Używaj analiz Stata z poziomu Pythona.
Użyj dowolnego pakietu Python w Stata
- Matplotlib i seaborn do wizualizacji
- Beautiful Soup i Scrapy do scrapowania sieci
- NumPy i pandas do analizy numerycznej
- TensorFlow i scikit-learn do uczenia maszynowego
- I wiele więcej


Prawdziwa dokumentacja
Kiedy przychodzi czas na przeprowadzenie analiz lub zrozumienie stosowanych przez Ciebie metod, Stata nie pozostawia Cię samego sobie ani nie wymaga zamawiania książek, abyś zgłębił każdy szczegół.
Każda z naszych funkcji zarządzania danymi jest w pełni wyjaśniona, udokumentowana i pokazana w praktyce na prawdziwych przykładach. Każdy estymator jest w pełni udokumentowany i zawiera kilka przykładów na prawdziwych danych, z prawdziwymi dyskusjami na temat tego, jak interpretować wyniki. Przykłady dostarczają danych, dzięki czemu możesz pracować w Stata, a nawet rozszerzać analizy. Dajemy Ci Szybki start dla każdej funkcji, pokazując niektóre z najczęstszych zastosowań. Chcesz jeszcze więcej szczegółów? Nasze sekcje Metody i wzory zawierają szczegóły tego, co jest obliczane, a nasze Odniesienia kierują Cię do jeszcze większej ilości informacji.
Stata to duży pakiet, więc ma mnóstwo dokumentacji – ponad 18 000 stron w 35 podręcznikach. Ale nie martw się, wpisz help my topic, a Stata przeszuka swoje słowa kluczowe, indeksy, a nawet pakiety dodane przez społeczność, aby dostarczyć Ci wszystkiego, co musisz wiedzieć o swoim temacie. Wszystko jest dostępne bezpośrednio w Stata.
Zaufany
Nie tylko programujemy metody statystyczne, ale także je weryfikujemy.
Wyniki, które widzisz z estymatora Stata, opierają się na porównaniach z innymi estymatorami, symulacjach spójności i pokrycia metodą Monte Carlo oraz obszernych testach przeprowadzanych przez naszych statystyków. Każdy Stata, który wysyłamy, przeszedł zestaw certyfikacji obejmujący 4,1 miliona wierszy kodu testowego, który generuje 5,8 miliona wierszy wyników. Certyfikujemy każdą liczbę i fragment tekstu z tych 5,8 miliona wierszy wyników.
Niezawodny
Od ponad 35 lat StataCorp jest lojalny wobec swoich użytkowników, rozszerzając oprogramowanie Stata o nowe metody statystyczne i najnowsze rozwiązania w zakresie raportowania, wizualizacji danych, manipulacji danymi i interfejsu użytkownika. Dzięki naszej długiej historii wydań jesteśmy zobowiązani do ciągłego dostarczania stabilnego i niezawodnego oprogramowania naszej zróżnicowanej społeczności badaczy i praktyków.
Ciągle aktualizowane
Korzystanie z najnowszej wersji oprogramowania Stata jest teraz łatwiejsze niż kiedykolwiek.
StataCorp nieustannie rozwija nowe funkcje, aby udoskonalić oprogramowanie Stata, od najnowszych metod statystycznych po najlepsze w zakresie raportowania, wizualizacji danych i interfejsu użytkownika. Dzięki StataNow™ nowe funkcje są udostępniane w trakcie bieżącej wersji aż do następnej głównej wersji. Funkcje te są priorytetowo traktowane w cyklu rozwoju, aby były dostępne, gdy tylko będą gotowe, dzięki czemu użytkownicy będą mogli z nich korzystać od razu.
Łatwy w użyciu
Korzystanie z najnowszej wersji oprogramowania Stata jest teraz łatwiejsze niż kiedykolwiek.
Do wszystkich funkcji Stata można uzyskać dostęp za pomocą menu, okien dialogowych, paneli sterowania, Edytora danych, Menedżera zmiennych, Edytora wykresów, a nawet Kreatora diagramów SEM. Możesz wskazywać i klikać, aby przejść przez dowolną analizę.
Jeśli nie chcesz pisać poleceń i skryptów, nie musisz tego robić.
Nawet gdy wskazujesz i klikasz, możesz zapisać wszystkie swoje wyniki i później uwzględnić je w raportach. Możesz nawet zapisać polecenia utworzone przez Twoje działania i odtworzyć całą analizę później.


Łatwy w uprawie
Polecenia Stata do wykonywania zadań są intuicyjne i łatwe do nauczenia. Co więcej, wszystko, czego nauczysz się o wykonywaniu zadania, można zastosować do innych zadań. Na przykład, po prostu dodaj if gender=="female" do dowolnego polecenia, aby ograniczyć analizę do kobiet w próbie. Po prostu dodaj vce(robust) do dowolnego estymatora, aby uzyskać błędy standardowe i testy hipotez, które są odporne na wiele typowych założeń.
Spójność sięga jeszcze głębiej. To, czego dowiadujesz się o poleceniach zarządzania danymi, często odnosi się do poleceń estymacji i odwrotnie. Istnieje również pełen zestaw poleceń postestymacji do przeprowadzania testów hipotez, tworzenia kombinacji liniowych i nieliniowych, dokonywania przewidywań, tworzenia kontrastów, a nawet przeprowadzania analizy marginalnej z wykresami interakcji. Te polecenia działają w ten sam sposób po praktycznie każdym estymatorze.
Sekwencjonowanie poleceń do odczytu i czyszczenia danych, a następnie do wykonywania testów statystycznych i szacowania, a na końcu do raportowania wyników leży u podstaw powtarzalnych badań. Stata udostępnia ten proces wszystkim badaczom.
Łatwe do zautomatyzowania
Każdy ma zadania, które wykonuje cały czas — tworzy konkretny rodzaj zmiennej, produkuje konkretną tabelę, wykonuje sekwencję kroków statystycznych, oblicza RMSE itd. Możliwości są nieograniczone. Stata ma tysiące wbudowanych procedur, ale możesz mieć zadania, które są stosunkowo wyjątkowe lub które chcesz wykonać w określony sposób.
Jeśli napisałeś skrypt wykonujący zadanie na danym zestawie danych, możesz łatwo przekształcić ten skrypt w coś, co będzie można zastosować do wszystkich zestawów danych, dowolnego zestawu zmiennych i dowolnego zestawu obserwacji.
Łatwy do rozszerzenia
Niektóre z rzeczy, które automatyzujesz, mogą być tak przydatne, że chcesz się nimi podzielić ze współpracownikami, a nawet udostępnić je wszystkim użytkownikom Stata. To również jest proste. Za pomocą odrobiny kodu możesz zmienić skrypt automatyzacji w polecenie Stata. Polecenie, które obsługuje standardowe funkcje obsługiwane przez oficjalne polecenia Stata. Polecenie, którego można używać w taki sam sposób, w jaki używa się oficjalnych poleceń.


Zaawansowane programowanie
Stata zawiera również zaawansowany język programowania — Mata.
Mata zawiera struktury, wskaźniki i klasy, których można oczekiwać w języku programowania, a ponadto zapewnia bezpośrednie wsparcie dla programowania macierzowego.
Chociaż nie musisz programować, aby używać Stata, pocieszające jest wiedzieć, że szybki i kompletny język programowania jest integralną częścią Stata. Mata jest zarówno interaktywnym środowiskiem do manipulowania macierzami, jak i pełnym środowiskiem programistycznym, które może generować skompilowany i zoptymalizowany kod. Zawiera specjalne funkcje do przetwarzania danych panelowych, wykonuje operacje na rzeczywistych lub złożonych macierzach, zapewnia pełne wsparcie dla programowania obiektowego i jest w pełni zintegrowany z każdym aspektem Stata. Stata ma również kompleksową integrację z Pythonem, co pozwala na wykorzystanie całej mocy Pythona bezpośrednio z kodu Stata.
Stata ma również PyStata, który zapewnia kompleksową integrację z Pythonem, umożliwiając wykorzystanie całego potencjału Pythona bezpośrednio z kodu Stata i wykorzystanie całego potencjału Stata z kodu Pythona.
Stata pozwala nawet na włączenie wtyczek C, C++ i Java do programów Stata za pośrednictwem natywnego API dla każdego języka. Możesz nawet osadzić kod Java bezpośrednio w kodzie Stata!




Funkcje dodane przez społeczność
Stata jest tak programowalna, że programiści i użytkownicy codziennie dodają nowe funkcje, aby sprostać rosnącym wymaganiom dzisiejszych badaczy.
Dzięki możliwościom internetowym Stata nowe funkcje i oficjalne aktualizacje można zainstalować przez Internet za pomocą jednego kliknięcia.
Wsparcie techniczne na światowym poziomie
Wszyscy zarejestrowani użytkownicy aktualnej wersji Stata (Stata 18) kwalifikują się do bezpłatnego wsparcia technicznego. Jeśli nie zarejestrowałeś swojej kopii Stata, wypełnij formularz rejestracyjny online.
Mamy oddany zespół ekspertów programistów Stata i statystyków, którzy odpowiedzą na Twoje pytania techniczne. Od skomplikowanych rozwiązań zarządzania danymi po uzyskanie odpowiedniego wyglądu wykresu i od wyjaśnienia solidnego błędu standardowego po określenie modelu wielopoziomowego, mamy odpowiedzi.
Kompatybilny z wieloma platformami
Stata będzie działać na komputerach z systemami Windows, Mac i Linux/Unix; jednak nasze licencje nie są specyficzne dla platformy. Oznacza to, że jeśli masz laptopa Mac i komputer stacjonarny z systemem Windows, nie potrzebujesz dwóch oddzielnych licencji, aby uruchomić Stata. Możesz zainstalować licencję Stata na dowolnej z obsługiwanych platform. Zestawy danych Stata, programy i inne dane mogą być udostępniane na różnych platformach bez tłumaczenia. Możesz również szybko i łatwo importować zestawy danych z innych pakietów statystycznych, arkuszy kalkulacyjnych i baz danych.
Szeroko stosowany
Z narzędzia Stata korzystają naukowcy od ponad 35 lat. Oferuje ono wszystko, czego potrzeba do nauki o danych, czyli manipulację danymi, wizualizację, statystykę i automatyczne raportowanie.
Wybierz swoją dyscyplinę i sprawdź, jak Stata może Ci pomóc.
{{typ widżetu-no-translate-custom="Magento\Cms\Block\Widget\Block" szablon="widget/static_block/default.phtml" identyfikator_bloku="stata-usage"}}
Przedstawiamy StataNow™
Nowe funkcje udostępniane z prędkością Stata. Dzięki StataNow zawsze będziesz mieć najnowsze funkcje.
StataNow to wersja oprogramowania Stata udostępniana w trybie ciągłym, oferująca nowe funkcje natychmiast po ich opracowaniu i gwarantująca użytkownikom stały dostęp do najnowszej wersji oprogramowania Stata.
Prosto z rozwoju do Ciebie. Dzięki StataNow zawsze masz dostęp do najnowszych funkcji.
Czym jest StataNow?
Przede wszystkim StataNow to Stata. Jest to wersja Stata o ciągłym wydawaniu, która oferuje nowe funkcje, gdy tylko są gotowe. StataNow jest wynikiem naszych ciągłych wysiłków, aby dostarczyć naszym użytkownikom najlepszą Statę — najnowszą Statę.
Przed StataNow większość nowych funkcji stawała się dostępna dopiero w momencie wydania głównej wersji, takiej jak Stata 17, Stata 18 itd. StataNow zapewnia dostęp do nowych funkcji wcześniej. Na przykład StataNow zawiera funkcje, które będą również częścią przyszłej głównej wersji, Stata 19.
Funkcje w StataNow są w pełni przetestowane, w pełni certyfikowane, dobrze udokumentowane, kontrolowane pod względem wersji (jeśli to konieczne), a także dopracowane do naszej zwyczajowej wysokiej jakości. Funkcje te są priorytetowo traktowane w cyklu rozwoju, aby były dostępne, gdy tylko będą gotowe, tak aby użytkownicy mogli z nich skorzystać od razu. Jak zawsze, wszystkie wersje Stata są regularnie aktualizowane o wszelkie poprawki i niezbędne ulepszenia. Możesz wyświetlić listę wszystkich dodatków do Stata i StataNow od czasu, gdy wydaliśmy Stata 18.
Nowe funkcje w StataNow są udostępniane w sposób ciągły w trakcie bieżącej wersji aż do następnej głównej wersji. Nie są udostępniane zgodnie z żadnym ustalonym harmonogramem. Wszystkie funkcje StataNow są oznaczone jako takie w witrynie Stata i dokumentacji Stata.
Ponieważ StataNow to Stata, gdy wspominamy „Stata” w naszej witrynie i dokumentacji, mamy na myśli również „StataNow”. Będziemy szczegółowo mówić o StataNow w przypadku funkcji dostępnych tylko w StataNow. A ponieważ StataNow to Stata, jest dostępne we wszystkich edycjach (StataNow/MP, StataNow/SE i StataNow/BE) i na wszystkich obsługiwanych platformach (Windows, Mac i Linux). W całej witrynie i dokumentacji zazwyczaj będziemy odnosić się do Stata/MP, Stata/SE i Stata/BE dla uproszczenia. Jeśli masz licencję StataNow, jak opisano poniżej, możesz to rozumieć jako StataNow/MP, StataNow/SE i StataNow/BE.
Jak mogę otrzymać StataNow?
Wszyscy posiadacze licencji rocznych mają dostęp do StataNow, niezależnie od tego, czy masz licencję roczną, wieloletnią lub czy Twoja instytucja ma licencję lokalną. Możesz uzyskać dostęp do najnowszych funkcji StataNow, po prostu wpisując update all w oknie poleceń lub prosząc administratora systemu o zaktualizowanie Stata. Istniejący użytkownicy Stata 18 mogą musieć wpisać update all dwa razy. Pierwsza aktualizacja da Ci Stata, która wie, jak zaktualizować się do StataNow. Druga aktualizacja będzie StataNow. Następnie wpisz help whatsnew , aby zobaczyć listę wszystkich funkcji.
Nowi użytkownicy mogą uzyskać dostęp do StataNow online, kupując dowolną roczną licencję Stata
Jeśli chcesz przedłużyć licencję, skontaktuj się z nami , aby uzyskać nowe informacje dotyczące pobierania i licencji StataNow.
Jeśli posiadasz licencję wieczystą bez okresu konserwacji lub okres konserwacji lub licencji wygasł, skontaktuj się z nami, aby poznać dostępne opcje.
Jak mogę sprawdzić, czy mam już StataNow?
Po uruchomieniu Stata zobaczysz StataNow na ekranie powitalnym. Możesz również wpisać about , a zobaczysz StataNow w pierwszym wierszu.
Wymagania systemowe
OS | Windows 10 or macOS 11.0 or newer |
---|---|
Processor | Applie Silicon, Intel or AMD processor (Core i3 equivalent or better) |
Memory | 4GB RAM |
Hard Drive | 2GB |
Stata w Twoich badaniach
Oprogramowanie Stata, z którego korzystają setki tysięcy badaczy od ponad 35 lat, zapewnia wszystko, czego potrzeba do nauki o danych, czyli manipulację danymi, wizualizację, statystykę i powtarzalne raportowanie.
Wybierz swoją dyscyplinę i sprawdź, jak Stata może Ci pomóc.
Oprogramowanie Stata, z którego korzystają setki tysięcy badaczy od ponad 35 lat, zapewnia wszystko, czego potrzeba do nauki o danych, czyli manipulację danymi, wizualizację, statystykę i powtarzalne raportowanie.
Wybierz swoją dyscyplinę i sprawdź, jak Stata może Ci pomóc.
Funkcje dla naukowców zajmujących się danymi
Przetwarzanie danych
Zbieraj dane z sieci, importuj je ze standardowych formatów lub pobieraj za pomocą SQL z JDBC lub ODBC. Dopasowuj-scalaj, łącz, dołączaj, zmieniaj kształt, transponuj, sortuj, filtruj. Stata obsługuje Unicode, ramki (wiele zestawów danych w pamięci), BLOB-y, wyrażenia regularne i wiele więcej, niezależnie od tego, czy pracujesz z setkami tysięcy, czy nawet miliardami punktów danych.
Automatyczne raportowanie i konfigurowalne tabele
Użyj Markdown do tworzenia dokumentów Word i plików HTML z osadzonym kodem Stata, wynikami i wykresami. Automatyzuj raporty Word, PDF lub Excel zarówno za pomocą możliwości eksportu wysokiego poziomu, jak i niskopoziomowego, szczegółowego dostępu programowego, aby zautomatyzować produkcję dokumentów, których potrzebuje Twój zespół. Dostosuj tabele, aby jasno komunikować wyniki, i eksportuj swoje tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown.
Wyobrażanie sobie
Twórz wykresy i dostosowuj je programowo lub interaktywnie za pomocą Graph Editor. Edycje można nawet rejestrować i „odtwarzać” na innych wykresach w celu zapewnienia powtarzalności. Eksportuj do standardowych formatów branżowych odpowiednich do Internetu (SVG, PNG) lub druku (PDF, TIFF, EPS, PS).
Programowanie
Zautomatyzuj cały swój przepływ pracy zarówno za pomocą skryptów, jak i pełnoprawnych funkcji programowania, takich jak klasy, struktury i wskaźniki. Unikalną cechą środowiska programistycznego Stata jest Mata, szybki i skompilowany język programowania macierzowego. Oczywiście, ma wszystkie zaawansowane operacje macierzowe, których potrzebujesz. Ma również dostęp do mocy LAPACK. Co więcej, ma wbudowane rozwiązywacze i optymalizatory, aby ułatwić implementację własnego estymatora. Możesz również wykorzystać wszystkie funkcje szacowania Stata i inne funkcje z poziomu Mata.
PyStata — integracja z Pythonem
Współdziałaj z kodem Stata i kodem Pythona. Możesz bezproblemowo przesyłać dane i wyniki między Stata i Pythonem. Możesz używać Stata w Jupyter Notebook i innych środowiskach IPython. Możesz wywoływać biblioteki Pythona, takie jak NumPy, matplotlib, Scrapy, scikit-learn i inne ze Stata. Możesz używać analiz Stata z poziomu Pythona.
Interoperacyjność
Połącz się z kodem zewnętrznym za pomocą wtyczek Python, Java i C++. Napisz kod Python lub Java bezpośrednio w kodzie Stata. Kontroluj Stata za pomocą Jupyter Notebook, OLE Automation lub wywołaj go w trybie wsadowym. Napisz niestandardowe instrukcje SQL za pomocą JDBC i ODBC, aby wyodrębnić lub wypełnić bazy danych. Uzyskaj dostęp do klastrów H2O.
Statystyka i modelowanie
Włącz najnowocześniejsze modele statystyczne i wyniki do swojego przepływu pracy. Znajdź grupy w swoich danych, używając nienadzorowanych technik, w tym analizy skupień, głównych składowych, analizy czynnikowej, skalowania wielowymiarowego i analizy korespondencji. Zrozum swoje grupy jeszcze lepiej, używając analizy klas ukrytych. Gdy Twoja analiza wymaga nadzorowanych technik, Stata ma elastyczne metody nieparametryczne i szereg modeli regresji, od modeli liniowych i logistycznych po modele mieszane. Stata nadąża, gdy Twoje dane wymagają specjalnych technik. Masz dostęp do metod, które rozumieją i wykorzystują strukturę w szeregach czasowych, danych panelowych, danych przeżycia, złożonych danych ankietowych, danych przestrzennych i danych wielopoziomowych. Stata zapewnia najbardziej przystępne implementacje metod bayesowskich i modelowania równań strukturalnych dostępnych gdziekolwiek. Możesz zażądać metod bootstrap dla praktycznie każdego estymatora. Gdy Twoja analiza tego wymaga, Stata automatyzuje inne metody replikacji i symulacje.
Powtarzalność
Stata to jedyne oprogramowanie do nauki o danych i analizy statystycznej, które oferuje kompleksowy system kontroli wersji, który zapewnia, że kod będzie działał bez zmian, nawet po wydaniu aktualizacji lub nowych wersji. Nie ma potrzeby przechowywania wielu starszych instalacji, aby uniknąć uszkodzenia systemu; kod Stata sprzed 25 lat nadal można uruchamiać bez modyfikacji. Zestawy danych, wykresy, skrypty, programy i inne są w 100% wieloplatformowe i wstecznie kompatybilne.
Lasso
Użyj lassa i elastycznej sieci do wyboru modelu i prognozowania. A gdy chcesz oszacować efekty i przetestować współczynniki dla kilku interesujących zmiennych, metody wnioskowania dostarczają szacunków dla tych zmiennych, podczas gdy lassa służą do wyboru spośród potencjalnie dużej liczby zmiennych kontrolnych. Możesz nawet uwzględnić endogeniczne zmienne współzmienne. Niezależnie od tego, czy Twoim celem jest wybór modelu, prognoza czy wnioskowanie, możesz użyć funkcji lassa Stata z wynikami ciągłymi, binarnymi, zliczającymi lub czasowo-do-zdarzenia.
Funkcje dla ekonomistów
Dane panelowe
Wykorzystaj w pełni dodatkowe informacje, które dostarczają dane panelowe, jednocześnie zajmując się osobliwościami danych panelowych. Zbadaj cechy niezmienne w czasie w obrębie każdego panelu, relacje między panelami i to, jak wyniki zainteresowania zmieniają się w czasie. Dopasuj modele liniowe lub nieliniowe dla wyników binarnych, liczbowych, porządkowych, ocenzurowanych lub przetrwania z estymatorami efektów stałych, efektów losowych lub uśrednionych dla populacji. Dopasuj modele dynamiczne lub modele z endogenicznością.
Szereg czasowy
Radź sobie ze statystycznymi wyzwaniami inherentnymi dla danych szeregów czasowych — autokorelacje, czynniki wspólne, autoregresyjna warunkowa heteroskedastyczność, pierwiastki jednostkowe, kointegracja i wiele innych. Analizuj jednowymiarowe szeregi czasowe przy użyciu modeli ARIMA, ARFIMA, modeli przełączania Markowa, modeli ARCH i GARCH oraz modeli nieobserwowanych składników. Porównaj modele ARIMA lub ARFIMA przy użyciu modeli AIC, BIC i HQIC oraz wybierz najlepszą liczbę wyrazów autoregresyjnych i średniej ruchomej. Analizuj wielowymiarowe szeregi czasowe przy użyciu modeli VAR, strukturalnego VAR, VEC, wielowymiarowego GARCH, modeli czynników dynamicznych i modeli przestrzeni stanów. Oblicz i wykreśl odpowiedzi impulsowe. Testuj pierwiastki jednostkowe. Przeprowadź analizę szeregów czasowych bayesowską.
Modele przekrojowe
Dopasuj klasyczne modele liniowe relacji między ciągłym wynikiem, takim jak płaca, a czynnikami determinującymi płacę, takimi jak poziom wykształcenia, wiek, doświadczenie i sektor ekonomiczny. Jeśli Twoja odpowiedź jest binarna (na przykład zatrudniony lub bezrobotny), porządkowa (poziom wykształcenia), liczbowa (liczba dzieci) lub ocenzurowana (sprzedaż biletów w istniejącym miejscu), nie martw się. Stata ma estymatory maksymalnego prawdopodobieństwa — probit, uporządkowany probit, Poissona, tobit i wiele innych — które szacują relację między takimi wynikami a ich czynnikami determinującymi. Dostępna jest szeroka gama narzędzi do analizy takich modeli. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów lub dowolną liniową lub nieliniową kombinację parametrów.
Endogeniczność i selekcja
Gdy zmienne objaśniające są powiązane z pominiętymi zmiennymi obserwowalnymi lub gdy są powiązane ze zmiennymi nieobserwowalnymi lub gdy występuje błąd selekcji, wówczas związki przyczynowe są zaburzone, a oszacowania parametrów ze standardowych estymatorów dają niespójne oszacowania prawdziwych związków. Stata może dopasować spójne modele, gdy występuje taka endogeniczność lub selekcja — niezależnie od tego, czy zmienna wynikowa jest ciągła, binarna, liczbowa czy porządkowa i czy dane są przekrojowe czy panelowe. Stata może nawet łączyć endogeniczne zmienne współzmienne, selekcję i efekty leczenia w tym samym modelu.
Wnioskowanie przyczynowe/Efekty leczenia
Oszacuj eksperymentalne efekty przyczynowe z danych obserwacyjnych; na przykład oszacuj wpływ programu szkolenia zawodowego na zatrudnienie lub wpływ dotacji na produkcję. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, ułamkowych i dotyczących przeżycia z binarnymi lub wielowartościowymi metodami leczenia przy użyciu odwrotnego ważenia prawdopodobieństwa (IPW), dopasowania wyniku skłonności, dopasowania najbliższego sąsiada, korekty regresji lub podwójnie odpornych estymatorów. Dopasuj modele z metodami leczenia egzogenicznego lub endogenicznego. Po oszacowaniu przetestuj założenie nakładania się i równowagę zmiennych współzależnych. Dodaj zmienne współzależnych i dobór próby do niektórych estymatorów efektów leczenia. W przypadku występowania efektów grupowych i czasowych możesz użyć estymatorów różnicy w różnicach (DID) i potrójnych różnic (DDD). W przypadku występowania zmiennych współzależnych o wielu wymiarach możesz użyć lasso. Jeżeli skutki przyczynowe są pośredniczone przez inną zmienną, należy zastosować mediację przyczynową z czynnikiem pośredniczącym, aby rozdzielić skutki bezpośrednie i pośrednie.
Efekty marginalne i średnie marginalne
Efekty marginalne i średnie marginalne pozwalają analizować i wizualizować relacje między zmienną wynikową a współczynnikami, nawet gdy wynik jest binarny, liczbowy, porządkowy, kategoryczny lub ocenzurowany (tobit). Oszacuj efekty marginalne uśrednione dla populacji lub oceń efekty marginalne przy interesujących lub reprezentatywnych wartościach współczynników. Przeanalizuj efekt interakcji. Możesz nawet prześledzić efekt marginalny w zakresie interesujących wartości współczynników lub interakcji współczynników. Możesz zrobić to wszystko za pomocą średnich marginalnych (czasami nazywanych średnimi potencjalno-wynikowymi), nawet gdy Twoja „średnia” jest prawdopodobieństwem pozytywnego wyniku lub liczbą z modelu Poissona. Jeśli masz dane panelowe i efekty losowe, efekty te są automatycznie integrowane, aby zapewnić efekty marginalne (czyli uśrednione dla populacji).
Modele wyboru
Modeluj dane dotyczące wyboru dyskretnego. Jeśli na przykład Twoim wynikiem jest wybór podróży autobusem, pociągiem, samochodem lub samolotem, możesz dopasować warunkowy model logitowy, wielomianowy model probitowy lub mieszany model logitowy. Czy Twoim wynikiem jest raczej ranking preferowanych metod podróży? Dopasuj model probitowy lub model logitowy o uporządkowanej randze. Niezależnie od dopasowania modelu możesz użyć marginesów, aby łatwo zinterpretować wyniki. Oszacuj, jak bardzo czas oczekiwania na lotnisku wpływa na prawdopodobieństwo podróży samolotem lub nawet pociągiem.
GMM
GMM (uogólniona metoda momentów) może być używana do dopasowania niemal każdego modelu statystycznego, w tym zarówno dokładnie zidentyfikowanych, jak i nadmiernie zidentyfikowanych problemów estymacji. Nadmiernie zidentyfikowane problemy pojawiają się, gdy występuje endogeniczność, korelacja w panelach dynamicznych, dobór próby i wiele innych sytuacji. Dzięki Stata szacujesz te modele, po prostu pisząc swoje momenty i umieszczając parametry w nawiasach klamrowych. Możesz łatwo dopasować modele przekrojowe, szeregów czasowych, danych panelowych lub danych przeżycia i przetestować swoje ograniczenia nadmiernie zidentyfikowane.
Systemy popytu
Dopasuj systemy popytu, aby zbadać popyt konsumentów na dobra i usługi. Mając budżet i pakiet dóbr i usług, określ elastyczność wydatków i cen dla tych dóbr. Wybierz pomiędzy systemem Cobba-Douglasa, liniowym systemem wydatków Stone'a, translogarytmicznym pośrednim systemem popytu użytkowego, prawie idealnym systemem popytu (AIDS), kwadratowym prawie idealnym systemem popytu (QUAIDS) i innymi.
Lasso
Użyj lassa i elastycznej sieci do wyboru modelu i prognozowania. A gdy chcesz oszacować efekty i przetestować współczynniki dla kilku interesujących zmiennych, metody wnioskowania dostarczają szacunków dla tych zmiennych, podczas gdy lassa służą do wyboru spośród potencjalnie dużej liczby zmiennych kontrolnych. Możesz nawet uwzględnić endogeniczne zmienne współzmienne. Niezależnie od tego, czy Twoim celem jest wybór modelu, prognoza czy wnioskowanie, możesz użyć funkcji lassa Stata z wynikami ciągłymi, binarnymi, zliczającymi lub czasowo-do-zdarzenia.
Programowanie
Chcesz zaprogramować własne polecenia, aby wykonać oszacowanie, wykonać zarządzanie danymi lub zaimplementować inne nowe funkcje? Stata jest programowalna, a tysiące użytkowników Stata zaimplementowało i opublikowało tysiące poleceń dodanych przez społeczność. Polecenia te wyglądają i działają tak samo jak oficjalne polecenia Stata i są łatwo instalowane bezpłatnie przez Internet z poziomu Stata. Unikalną cechą środowiska programistycznego Stata jest Mata, szybki i skompilowany język z obsługą typów macierzy. Oczywiście, ma wszystkie zaawansowane operacje macierzowe, których potrzebujesz. Ma również dostęp do mocy LAPACK. Co więcej, ma wbudowane rozwiązywacze i optymalizatory, aby ułatwić implementację własnego maksymalnego prawdopodobieństwa, GMM lub innych estymatorów. Możesz również wykorzystać wszystkie szacowania i inne funkcje Stata z poziomu Mata. Wiele oficjalnych poleceń Stata jest zaimplementowanych w Mata.
PyStata - integracja z Pythonem
Współdziałaj z kodem Stata i kodem Pythona. Możesz bezproblemowo przesyłać dane i wyniki między Stata i Pythonem. Możesz używać Stata w Jupyter Notebook i innych środowiskach IPython. Możesz wywoływać biblioteki Pythona, takie jak NumPy, matplotlib, Scrapy, scikit-learn i inne ze Stata. Możesz używać analiz Stata z poziomu Pythona.
Prognozowanie
Twórz modele wielorównaniowe i twórz prognozy poziomów, trendów, stawek itp. Niezależnie od tego, czy masz mały model z kilkoma równaniami, czy kompletny model gospodarki z tysiącami równań, Stata może pomóc Ci zbudować ten model i generować prognozy. Twój model może obejmować zarówno szacowane relacje, jak i znane tożsamości. Możesz łatwo tworzyć i porównywać prognozy w różnych scenariuszach, tworzyć prognozy statyczne i dynamiczne, a nawet szacować stochastyczne przedziały ufności. Możesz utworzyć swój model, używając intuicyjnej składni poleceń lub korzystając z interaktywnego panelu sterowania prognozowaniem.
Analiza przeżycia
Przeanalizuj wyniki dotyczące czasu trwania — wyniki mierzące czas do zdarzenia, takiego jak awaria lub śmierć — przy użyciu specjalistycznych narzędzi Stata do analizy przeżycia. Weź pod uwagę komplikacje inherentne dla danych dotyczących przeżycia, takie jak czasami brak obserwacji zdarzenia (cenzura prawa, lewa i przedziałowa), osoby wchodzące do badania w różnym czasie (opóźnione wejście) i osoby, które nie są stale obserwowane przez cały okres badania (luki). Możesz oszacować i przedstawić na wykresie prawdopodobieństwo przeżycia w czasie. Lub modelować przeżycie jako funkcję współczynników przy użyciu modeli Coxa, Weibulla, logarytmiczno-normalnych i innych modeli regresji. Przewiduj współczynniki ryzyka, średni czas przeżycia i prawdopodobieństwo przeżycia. Czy w badaniu biorą udział grupy osób? Dostosuj korelację wewnątrzgrupową za pomocą modelu efektów losowych lub modelu wspólnej kruchości. Jeśli masz wiele potencjalnych współczynników, użyj lasso cox i elasticnet cox do wyboru modelu i przewidywania.
Analiza bayesowska
Wykonaj analizę ekonometrii bayesowskiej przy użyciu jednej z metod Monte Carlo łańcucha Markowa (MCMC). Możesz wybierać spośród różnych obsługiwanych modeli, takich jak modele panel-data, hierarchiczne, VAR i DSGE, a nawet możesz zaprogramować własne. Dostępne są rozbudowane narzędzia do sprawdzania zbieżności, w tym wiele łańcuchów. Oblicz szacunki średniej a posteriori i wiarygodne przedziały dla parametrów modelu i funkcji parametrów modelu. Możesz wykonać testowanie hipotez zarówno interwałowych, jak i opartych na modelu. Porównaj modele przy użyciu czynników Bayesa. Oblicz dopasowanie modelu przy użyciu wartości predykcyjnych a posteriori. Generuj przewidywania i prognozy. Jeśli chcesz uwzględnić niepewność modelu w swoim modelu regresji, użyj uśredniania modelu bayesowskiego.
Metody badania
Niezależnie od tego, czy Twoje dane wymagają prostej ważonej korekty z powodu różnicowych współczynników próbkowania, czy też masz dane ze złożonego badania wieloetapowego, funkcje badania Stata mogą zapewnić Ci prawidłowe błędy standardowe i przedziały ufności dla Twoich wniosków. Po prostu określ odpowiednie cechy swojego projektu próbkowania, takie jak wagi próbkowania (w tym wagi na wielu etapach), klasteryzacja (na jednym, dwóch lub więcej etapach), stratyfikacja i poststratyfikacja. Następnie większość poleceń estymacji Stata może dostosować swoje szacunki, aby poprawić Twój projekt próbkowania.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Funkcje dla edukacji
Wielopoziomowe modele efektów mieszanych
Niezależnie od tego, czy grupowania w Twoich danych powstają w sposób zagnieżdżony (uczniowie zagnieżdżeni w klasach i klasy zagnieżdżone w szkołach), czy w sposób niezagnieżdżony (szkoła podstawowa skrzyżowana ze szkołą średnią), możesz dopasować model wielopoziomowy, aby uwzględnić brak niezależności w tych grupach. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, porządkowych i przetrwania. Oszacuj wariancje losowych przecięć i losowych współczynników. Oblicz korelacje wewnątrzklasowe. Przewiduj efekty losowe. Oszacuj relacje, które są uśrednione dla populacji w odniesieniu do efektów losowych.
Modelowanie równań strukturalnych (SEM)
Oszacowanie efektów mediacji, analiza relacji między nieobserwowanym ukrytym pojęciem, takim jak zdolności werbalne, a obserwowanymi zmiennymi mierzącymi zdolności werbalne lub dopasowanie modelu ze złożonymi relacjami między zmiennymi ukrytymi i obserwowanymi. Dopasowanie modeli z wynikami ciągłymi, binarnymi, liczbowymi i porządkowymi. Nawet dopasowanie modeli hierarchicznych z grupami skorelowanych obserwacji, takimi jak dzieci w tych samych szkołach. Ocena dopasowania modelu. Obliczenie pośrednich i całkowitych efektów. Dopasowanie modeli poprzez narysowanie diagramu ścieżki lub użycie prostej składni polecenia.
Ogólne modele liniowe
Dopasuj modele jedno- i dwukierunkowe. Lub dopasuj modele z trzema, czterema lub nawet większą liczbą czynników. Analizuj dane z zagnieżdżonymi czynnikami, z czynnikami stałymi i losowymi lub z powtarzanymi pomiarami. Używaj modeli ANCOVA, gdy masz ciągłe zmienne współzmienne, i modeli MANOVA, gdy masz wiele zmiennych wynikowych. Dalsze badanie relacji między wynikiem a predyktorami poprzez szacowanie rozmiarów efektów i obliczanie najmniejszych kwadratów i średnich brzegowych. Przeprowadź kontrasty i porównania parami. Analizuj i kreśl interakcje.
IRT (teoria odpowiedzi na pozycje)
Zbadaj związek między nieobserwowanymi ukrytymi cechami, takimi jak zdolności matematyczne, a prawdopodobieństwem prawidłowych odpowiedzi na pytania testowe (elementy). Lub zbadaj związek między zadowoleniem z pracy nauczyciela a samodeklarowanymi odpowiedziami na pytania związane ze satysfakcją z pracy. IRT można wykorzystać do tworzenia miar takich nieobserwowanych cech lub umieszczania osób na skali mierzącej cechę. Można go również wykorzystać do wybierania najlepszych elementów do pomiaru ukrytej cechy. Modele IRT są dostępne dla elementów odpowiedzi binarnych, stopniowanych, ocenianych, częściowych i nominalnych. Wizualizuj relacje za pomocą krzywych charakterystycznych elementów i mierz ogólną wydajność testu za pomocą funkcji informacji testowej.
Regresje liniowe, binarne i liczbowe
Dopasuj klasyczne modele regresji liniowej relacji między ciągłym wynikiem, takim jak wynik testu czytania, a czynnikami determinującymi wynik, takimi jak metoda nauczania i poziom czytania ucznia w poprzedniej klasie. Jeśli Twoja odpowiedź jest binarna (na przykład zaliczony lub niezaliczony test), porządkowa (poziom wykształcenia), liczbowa (liczba uczniów) lub kategoryczna (szkoła prywatna, publiczna lub domowa), nie martw się. Stata ma estymatory maksymalnego prawdopodobieństwa — logistyczne, uporządkowane logistyczne, Poissona, wielomianowe logit i wiele innych — które szacują relację między takimi wynikami a ich czynnikami determinującymi. Po dopasowaniu takich modeli dostępna jest szeroka gama narzędzi. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów. Oblicz liniowe i nieliniowe kombinacje parametrów.
Regresje liniowe, binarne i liczbowe
Uwzględnij brakujące dane w próbie, używając wielokrotnej imputacji. Wybierz spośród metod jednowymiarowych i wielowymiarowych, aby imputować brakujące wartości w zmiennych ciągłych, ocenzurowanych, obciętych, binarnych, porządkowych, kategorycznych i zliczeniowych. Następnie, w jednym kroku, oszacuj parametry, używając imputowanych zestawów danych i połącz wyniki. Dopasuj model liniowy, model logit, model Poissona, model hierarchiczny, model przetrwania lub jeden z wielu innych obsługiwanych modeli. Użyj polecenia mi lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą analizę MI.
Modele wyboru
Modeluj dane dotyczące wyboru dyskretnego. Jeśli na przykład Twoim wynikiem jest wybór podróży autobusem, pociągiem, samochodem lub samolotem, możesz dopasować warunkowy model logitowy, wielomianowy model probitowy lub mieszany model logitowy. Czy Twoim wynikiem jest raczej ranking preferowanych metod podróży? Dopasuj model probitowy lub model logitowy o uporządkowanej randze. Niezależnie od dopasowania modelu możesz użyć marginesów, aby łatwo zinterpretować wyniki. Oszacuj, jak bardzo czas oczekiwania na lotnisku wpływa na prawdopodobieństwo podróży samolotem lub nawet pociągiem.
Kontrasty, średnie marginalne i wykresy profilowe
Szybko i łatwo uzyskaj kontrasty dla zmiennych kategorycznych i ich interakcji. R.edlevel poda wszystkie kontrasty poziomu wykształcenia z kategorią odniesienia. A.edlevel poda każdy sparowany kontrast z kolejnym wyższym poziomem wykształcenia. Istnieje wiele innych nazwanych kontrastów i możesz określić swój własny. Jeśli nie lubisz pisać, użyj okna dialogowego, aby wybrać kontrasty. Średnie marginalne są tylko prostym poleceniem lub kliknięciem myszy po prawie każdym poleceniu estymacji. Ocena efektów interakcji, efektów zmiennych moderujących, jest równie łatwa. I nie dotyczy to tylko modeli liniowych, ale modeli z wynikami binarnymi, porządkowymi i liczbowymi. Nawet modeli hierarchicznych z prawidłową obsługą efektów losowych. Proste polecenie lub kilka kliknięć myszy da Ci wykres profilowy dowolnego z tych wyników.
Moc, precyzja i wielkość próbki
Przed przeprowadzeniem eksperymentu określ wielkość próby potrzebną do wykrycia istotnych efektów bez marnowania zasobów. Czy zamierzasz obliczyć przedziały ufności dla średnich lub wariancji lub wykonać testy proporcji lub korelacji? Czy zamierzasz dopasować model proporcjonalnych zagrożeń Coxa lub porównać funkcje przeżycia przy użyciu testu log-rank? Czy chcesz użyć testu asocjacji Cochrana-Mantela-Haenszela lub testu trendu Cochrana-Armitage'a? Użyj polecenia power programu Stata, aby obliczyć moc i wielkość próby, utworzyć niestandardowe tabele i automatycznie wykreślić zależności między mocą, wielkością próby i wielkością efektu dla zaplanowanego badania. Możesz też użyć polecenia ciwidth, aby zrobić to samo, ale dla przedziałów ufności zamiast testów hipotez, obliczając wymaganą wielkość próby dla pożądanej precyzji przedziału ufności. Możesz też użyć gsdesign, aby obliczyć granice zatrzymania i wymagane rozmiary próby dla projektów sekwencyjnych grup. Zamiast poleceń użyj interaktywnego Panelu sterowania, aby wykonać analizę.
Wnioskowanie przyczynowe
Oszacuj eksperymentalne efekty przyczynowe na podstawie danych obserwacyjnych. Dzięki estymatorom efektów leczenia Stata możesz użyć ram potencjalnych wyników (kontrfaktycznych), aby oszacować na przykład wpływ struktury rodziny na rozwój dziecka lub wpływ bezrobocia na lęk. Dopasuj modele do wyników ciągłych, binarnych, liczbowych, ułamkowych i dotyczących przeżycia z binarnymi lub wielowartościowymi metodami leczenia, używając odwrotnego ważenia prawdopodobieństwa (IPW), dopasowania wyniku skłonności, dopasowania najbliższego sąsiada, korekty regresji lub podwójnie odpornych estymatorów. Jeśli przypisanie do leczenia nie jest niezależne od wyniku, możesz użyć endogenicznego estymatora efektów leczenia. W obecności efektów grupowych i czasowych możesz użyć estymatorów różnicy w różnicach (DID) i potrójnych różnic (DDD). W obecności wielowymiarowych zmiennych współzależnych możesz użyć lasso. Jeżeli skutki przyczynowe są pośredniczone przez inną zmienną, należy zastosować mediację przyczynową z czynnikiem pośredniczącym, aby rozdzielić skutki bezpośrednie i pośrednie.
Metody wielowymiarowe
Użyj analiz wielowymiarowych, aby ocenić relacje między zmiennymi z wielu różnych perspektyw. Przeprowadź wielowymiarowe testy średnich lub dopasuj wielowymiarowe modele regresji i MANOVA. Zbadaj relacje między dwoma zestawami zmiennych, takimi jak pomiary zdolności i pomiary osiągnięć, używając korelacji kanonicznej. Zbadaj liczbę i strukturę ukrytych pojęć leżących u podstaw zestawu zmiennych, używając eksploracyjnej analizy czynnikowej. Lub użyj analizy głównych składowych, aby znaleźć leżącą u podstaw strukturę lub zmniejszyć liczbę zmiennych używanych w kolejnej analizie. Odkryj grupowania obserwacji w swoich danych, używając analizy skupień. Jeśli masz znane grupy w swoich danych, opisz różnice między nimi, używając analizy dyskryminacyjnej.
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Analiza bayesowska
Wykonaj analizę ekonometrii bayesowskiej przy użyciu jednej z metod Monte Carlo łańcucha Markowa (MCMC). Możesz wybierać spośród różnych obsługiwanych modeli, takich jak modele panel-data, hierarchiczne, VAR i DSGE, a nawet możesz zaprogramować własne. Dostępne są rozbudowane narzędzia do sprawdzania zbieżności, w tym wiele łańcuchów. Oblicz szacunki średniej a posteriori i wiarygodne przedziały dla parametrów modelu i funkcji parametrów modelu. Możesz wykonać testowanie hipotez zarówno interwałowych, jak i opartych na modelu. Porównaj modele przy użyciu czynników Bayesa. Oblicz dopasowanie modelu przy użyciu wartości predykcyjnych a posteriori. Generuj przewidywania i prognozy. Jeśli chcesz uwzględnić niepewność modelu w swoim modelu regresji, użyj uśredniania modelu bayesowskiego.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Notatnik J upyter ze Stata
Jupyter Notebook jest szeroko stosowany przez badaczy i naukowców do dzielenia się pomysłami i wynikami w celu współpracy i innowacji. Jest to łatwa w użyciu aplikacja internetowa, która umożliwia łączenie kodu, wizualizacji, wzorów matematycznych, tekstu narracyjnego i innych bogatych mediów w jednym dokumencie („notatniku”) do interaktywnego przetwarzania i opracowywania. Możesz wywołać Stata i Mata z Jupyter Notebook za pomocą jądra IPython (interaktywny Python). Oznacza to, że możesz połączyć możliwości Pythona i Stata w jednym środowisku, aby Twoja praca była łatwa do odtworzenia i udostępniania innym.
Funkcje dla epidemiologów
Tabele epidemiologiczne
Chcesz analizować dane z badania prospektywnego, badania kohortowego, badania przypadku i kontroli lub dopasowanego badania przypadku i kontroli? Tabele Stata dla epidemiologów ułatwiają podsumowanie danych i obliczanie statystyk, takich jak współczynniki zapadalności, różnice współczynników zapadalności, współczynniki ryzyka, różnice ryzyka, ilorazy szans i ułamki przypisywane. Możesz również analizować dane stratyfikowane — obliczać łączone szacunki Mantela-Haenszela, przeprowadzać testy jednorodności i standaryzować szacunki. Jeśli masz ekspozycję porządkową, a nie binarną, możesz wykonać test trendu.
Analiza przeżycia
Przeanalizuj wyniki dotyczące czasu trwania — wyniki mierzące czas do zdarzenia, takiego jak awaria lub śmierć — przy użyciu specjalistycznych narzędzi Stata do analizy przeżycia. Weź pod uwagę komplikacje inherentne dla danych dotyczących przeżycia, takie jak czasami brak obserwacji zdarzenia (cenzura prawa, lewa i przedziałowa), osoby wchodzące do badania w różnym czasie (opóźnione wejście) i osoby, które nie są stale obserwowane przez cały okres badania (luki). Możesz oszacować i przedstawić na wykresie prawdopodobieństwo przeżycia w czasie. Lub modelować przeżycie jako funkcję współczynników przy użyciu modeli Coxa, Weibulla, logarytmiczno-normalnych i innych modeli regresji. Przewiduj współczynniki ryzyka, średni czas przeżycia i prawdopodobieństwo przeżycia. Czy w badaniu biorą udział grupy osób? Dostosuj korelację wewnątrzgrupową za pomocą modelu efektów losowych lub modelu wspólnej kruchości. Jeśli masz wiele potencjalnych współczynników, użyj lasso cox i elasticnet cox do wyboru modelu i przewidywania.
Regresje liniowe, binarne i liczbowe
Dopasuj klasyczne modele ANOVA i regresji liniowej relacji między ciągłym wynikiem, takim jak waga, a czynnikami determinującymi wagę, takimi jak wzrost, dieta i poziom ćwiczeń. Jeśli Twoja odpowiedź jest binarna, porządkowa, kategoryczna lub liczbowa, nie martw się. Stata ma również estymatory dla tego typu wyników. Użyj regresji logistycznej, aby dostosować ilorazy szans dla zmiennych zakłócających. Oszacuj wskaźniki częstości występowania za pomocą modelu Poissona. Przeanalizuj dopasowane dane przypadek–kontrola za pomocą warunkowej regresji logistycznej. Po dopasowaniu takich modeli dostępna jest szeroka gama narzędzi. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów. Oblicz liniowe i nieliniowe kombinacje parametrów.
Metody badania
Niezależnie od tego, czy Twoje dane wymagają prostej ważonej korekty z powodu różnicowych współczynników próbkowania, czy też masz dane ze złożonego badania wieloetapowego, funkcje badania Stata mogą zapewnić Ci prawidłowe błędy standardowe i przedziały ufności dla Twoich wniosków. Po prostu określ odpowiednie cechy swojego projektu próbkowania, takie jak wagi próbkowania (w tym wagi na wielu etapach), klasteryzacja (na jednym, dwóch lub więcej etapach), stratyfikacja i poststratyfikacja. Następnie większość poleceń estymacji Stata może dostosować swoje szacunki, aby poprawić Twój projekt próbkowania.
Średnie marginalne, kontrasty i interakcje
Średnie marginalne i kontrasty pozwalają analizować relacje między zmienną wynikową a predyktorami, nawet gdy wynik jest binarny, liczbowy, porządkowy lub kategoryczny. Na przykład po dopasowaniu regresji logistycznej choroby do zmiennej ekspozycji i innych zmiennych współzależnych średnie marginalne mogą być uśrednionymi ryzykami dla populacji. Możesz też ustawić zmienne współbieżne na interesujące wartości, aby obliczyć skorygowane ryzyko, a następnie użyć kontrastów, aby uzyskać skorygowane różnice ryzyka. Po dopasowaniu niemal każdego modelu w Stata możesz analizować wpływ interakcji zmiennych współzależnych i łatwo tworzyć wykresy, aby wizualizować te interakcje.
Moc, precyzja i wielkość próbki
Przed przeprowadzeniem eksperymentu określ wielkość próby potrzebną do wykrycia istotnych efektów bez marnowania zasobów. Czy zamierzasz obliczyć przedziały ufności dla średnich lub wariancji lub wykonać testy proporcji lub korelacji? Czy zamierzasz dopasować model proporcjonalnych zagrożeń Coxa lub porównać funkcje przeżycia przy użyciu testu log-rank? Czy chcesz użyć testu asocjacji Cochrana-Mantela-Haenszela lub testu trendu Cochrana-Armitage'a? Użyj polecenia power programu Stata, aby obliczyć moc i wielkość próby, utworzyć niestandardowe tabele i automatycznie wykreślić zależności między mocą, wielkością próby i wielkością efektu dla zaplanowanego badania. Możesz też użyć polecenia ciwidth, aby zrobić to samo, ale dla przedziałów ufności zamiast testów hipotez, obliczając wymaganą wielkość próby dla pożądanej precyzji przedziału ufności. Możesz też użyć gsdesign, aby obliczyć granice zatrzymania i wymagane rozmiary próby dla projektów sekwencyjnych grup. Zamiast poleceń użyj interaktywnego Panelu sterowania, aby wykonać analizę.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Wnioskowanie przyczynowe
Oszacuj eksperymentalne efekty przyczynowe na podstawie danych obserwacyjnych. Dzięki estymatorom efektów leczenia Stata możesz użyć ram potencjalnych wyników (kontrfaktycznych), aby oszacować na przykład wpływ struktury rodziny na rozwój dziecka lub wpływ bezrobocia na lęk. Dopasuj modele do wyników ciągłych, binarnych, liczbowych, ułamkowych i dotyczących przeżycia z binarnymi lub wielowartościowymi metodami leczenia, używając odwrotnego ważenia prawdopodobieństwa (IPW), dopasowania wyniku skłonności, dopasowania najbliższego sąsiada, korekty regresji lub podwójnie odpornych estymatorów. Jeśli przypisanie do leczenia nie jest niezależne od wyniku, możesz użyć endogenicznego estymatora efektów leczenia. W obecności efektów grupowych i czasowych możesz użyć estymatorów różnicy w różnicach (DID) i potrójnych różnic (DDD). W obecności wielowymiarowych zmiennych współzależnych możesz użyć lasso. Jeżeli skutki przyczynowe są pośredniczone przez inną zmienną, należy zastosować mediację przyczynową z czynnikiem pośredniczącym, aby rozdzielić skutki bezpośrednie i pośrednie.
Wielokrotne imputowanie
Uwzględnij brakujące dane w próbie, używając wielokrotnej imputacji. Wybierz spośród metod jednowymiarowych i wielowymiarowych, aby imputować brakujące wartości w zmiennych ciągłych, ocenzurowanych, obciętych, binarnych, porządkowych, kategorycznych i zliczeniowych. Następnie, w jednym kroku, oszacuj parametry, używając imputowanych zestawów danych i połącz wyniki. Dopasuj model liniowy, model logit, model Poissona, model wielopoziomowy, model przetrwania lub jeden z wielu innych obsługiwanych modeli. Użyj polecenia mi lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą analizę MI.
Wielopoziomowe modele efektów mieszanych
Niezależnie od tego, czy grupowania w danych powstają w sposób zagnieżdżony (pacjenci zagnieżdżeni w klinikach, a kliniki zagnieżdżone w regionach), czy w sposób niezagnieżdżony (regiony skrzyżowane z zawodami), możesz dopasować model wielopoziomowy, aby uwzględnić brak niezależności w tych grupach. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, porządkowych i dotyczących przeżycia. Oszacuj wariancje losowych przecięć i losowych współczynników. Oblicz korelacje wewnątrzklasowe. Przewiduj efekty losowe. Oszacuj relacje, które są uśrednione dla populacji w odniesieniu do efektów losowych.
Analiza bayesowska
Dopasuj modele regresji bayesowskiej, używając jednej z metod łańcucha Markowa Monte Carlo (MCMC). Możesz wybierać spośród różnych obsługiwanych modeli lub nawet zaprogramować własny. Dostępne są rozbudowane narzędzia do sprawdzania zbieżności, w tym wiele łańcuchów. Obliczaj estymacje średniej a posteriori i wiarygodne przedziały dla parametrów modelu i funkcji parametrów modelu. Możesz wykonywać testy hipotez oparte zarówno na przedziałach, jak i na modelach. Porównuj modele, używając czynników Bayesa. Oblicz dopasowanie modelu, używając wartości predykcyjnych a posteriori i generuj prognozy. Jeśli chcesz uwzględnić niepewność modelu w swoim modelu regresji, użyj uśredniania modelu bayesowskiego.
Modele addytywne ryzyka względnego
Określ, w jaki sposób narażenie oddziałuje na siebie, narażając osoby badane na większe ryzyko wystąpienia interesującego wyniku. Na przykład możesz badać, w jaki sposób narażenie na dym papierosowy i azbest oddziałuje na siebie, zwiększając ryzyko zachorowania na raka płuc. Za pomocą polecenia reri programu Stata możesz mierzyć dwukierunkowe interakcje w addytywnym modelu ryzyka względnego, uwzględniając jednocześnie inne czynniki ryzyka. Wybierz spośród różnych obsługiwanych modeli, takich jak dwumianowy uogólniony liniowy, Poissona, ujemny dwumianowy, logistyczny, Coxa, parametryczny model przeżycia oraz parametryczny i półparametryczny model przeżycia z cenzurą interwałową. Oszacuj względne ryzyko nadmiarowe wynikające z interakcji (RERI), przypisywalnej proporcji (AP) i wskaźnika synergii (SI).
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Jupyter Notebook ze Statą
Jupyter Notebook jest szeroko stosowany przez badaczy i naukowców do dzielenia się pomysłami i wynikami w celu współpracy i innowacji. Jest to łatwa w użyciu aplikacja internetowa, która umożliwia łączenie kodu, wizualizacji, wzorów matematycznych, tekstu narracyjnego i innych bogatych mediów w jednym dokumencie („notatniku”) do interaktywnego przetwarzania i opracowywania. Możesz wywołać Stata i Mata z Jupyter Notebook za pomocą jądra IPython (interaktywny Python). Oznacza to, że możesz połączyć możliwości Pythona i Stata w jednym środowisku, aby Twoja praca była łatwa do odtworzenia i udostępniania innym.
Funkcje dla biostatystów
Analiza przeżycia
Przeanalizuj wyniki dotyczące czasu trwania — wyniki mierzące czas do zdarzenia, takiego jak awaria lub śmierć — przy użyciu specjalistycznych narzędzi Stata do analizy przeżycia. Weź pod uwagę komplikacje inherentne dla danych dotyczących przeżycia, takie jak czasami brak obserwacji zdarzenia (cenzura prawa, lewa i przedziałowa), osoby wchodzące do badania w różnym czasie (opóźnione wejście) i osoby, które nie są stale obserwowane przez cały okres badania (luki). Możesz oszacować i przedstawić na wykresie prawdopodobieństwo przeżycia w czasie. Lub modelować przeżycie jako funkcję współczynników przy użyciu modeli Coxa, Weibulla, logarytmiczno-normalnych i innych modeli regresji. Przewiduj współczynniki ryzyka, średni czas przeżycia i prawdopodobieństwo przeżycia. Czy w badaniu biorą udział grupy osób? Dostosuj korelację wewnątrzgrupową za pomocą modelu efektów losowych lub modelu wspólnej kruchości. Jeśli masz wiele potencjalnych współczynników, użyj lasso cox i elasticnet cox do wyboru modelu i przewidywania.
Wielopoziomowe modele efektów mieszanych
Niezależnie od tego, czy grupowania w danych powstają w sposób zagnieżdżony (pacjenci zagnieżdżeni w klinikach, a kliniki zagnieżdżone w regionach), czy w sposób niezagnieżdżony (regiony skrzyżowane z zawodami), możesz dopasować model wielopoziomowy, aby uwzględnić brak niezależności w tych grupach. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, porządkowych i dotyczących przeżycia. Oszacuj wariancje losowych przecięć i losowych współczynników. Oblicz korelacje wewnątrzklasowe. Przewiduj efekty losowe. Oszacuj relacje, które są uśrednione dla populacji w odniesieniu do efektów losowych.
Analiza bayesowska
Dopasuj modele regresji bayesowskiej, używając jednej z metod łańcucha Markowa Monte Carlo (MCMC). Możesz wybierać spośród różnych obsługiwanych modeli lub nawet zaprogramować własny. Dostępne są rozbudowane narzędzia do sprawdzania zbieżności, w tym wiele łańcuchów. Obliczaj estymacje średniej a posteriori i wiarygodne przedziały dla parametrów modelu i funkcji parametrów modelu. Możesz wykonywać testy hipotez oparte zarówno na przedziałach, jak i na modelach. Porównuj modele, używając czynników Bayesa. Oblicz dopasowanie modelu, używając wartości predykcyjnych a posteriori i generuj prognozy. Jeśli chcesz uwzględnić niepewność modelu w swoim modelu regresji, użyj uśredniania modelu bayesowskiego.
Moc, precyzja i wielkość próbki
Przed przeprowadzeniem eksperymentu określ wielkość próby potrzebną do wykrycia istotnych efektów bez marnowania zasobów. Czy zamierzasz obliczyć przedziały ufności dla średnich lub wariancji lub wykonać testy proporcji lub korelacji? Czy zamierzasz dopasować model proporcjonalnych zagrożeń Coxa lub porównać funkcje przeżycia przy użyciu testu log-rank? Czy chcesz użyć testu asocjacji Cochrana-Mantela-Haenszela lub testu trendu Cochrana-Armitage'a? Użyj polecenia power programu Stata, aby obliczyć moc i wielkość próby, utworzyć niestandardowe tabele i automatycznie wykreślić zależności między mocą, wielkością próby i wielkością efektu dla zaplanowanego badania. Możesz też użyć polecenia ciwidth, aby zrobić to samo, ale dla przedziałów ufności zamiast testów hipotez, obliczając wymaganą wielkość próby dla pożądanej precyzji przedziału ufności. Możesz też użyć gsdesign, aby obliczyć granice zatrzymania i wymagane rozmiary próby dla projektów sekwencyjnych grup. Zamiast poleceń użyj interaktywnego Panelu sterowania, aby wykonać analizę.
Regresje liniowe, binarne i liczbowe
Dopasuj klasyczne modele ANOVA i regresji liniowej relacji między ciągłym wynikiem, takim jak waga, a czynnikami determinującymi wagę, takimi jak wzrost, dieta i poziom ćwiczeń. Jeśli Twoja odpowiedź jest binarna, porządkowa, kategoryczna lub liczbowa, nie martw się. Stata ma również estymatory dla tego typu wyników. Użyj regresji logistycznej, aby oszacować iloraz szans. Oszacuj wskaźniki zapadalności za pomocą modelu Poissona. Przeanalizuj dopasowane dane przypadek–kontrola za pomocą warunkowej regresji logistycznej. Po dopasowaniu takich modeli dostępna jest szeroka gama narzędzi. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów. Oblicz liniowe i nieliniowe kombinacje parametrów.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Wielokrotne imputowanie
Uwzględnij brakujące dane w próbie, używając wielokrotnej imputacji. Wybierz spośród metod jednowymiarowych i wielowymiarowych, aby imputować brakujące wartości w zmiennych ciągłych, ocenzurowanych, obciętych, binarnych, porządkowych, kategorycznych i zliczeniowych. Następnie, w jednym kroku, oszacuj parametry, używając imputowanych zestawów danych i połącz wyniki. Dopasuj model liniowy, model logit, model Poissona, model hierarchiczny, model przetrwania lub jeden z wielu innych obsługiwanych modeli. Użyj polecenia mi lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą analizę MI.
Średnie marginalne, kontrasty i interakcje
Średnie marginalne i kontrasty pozwalają analizować relacje między zmienną wynikową a współczynnikami, nawet jeśli wynik jest binarny, liczbowy, porządkowy, kategoryczny lub przeżywalności. Oblicz skorygowane prognozy z współczynnikami ustawionymi na interesujące lub reprezentatywne wartości. Lub oblicz średnie marginalne dla każdego poziomu współczynnika kategorialnego. Porównuj skorygowane prognozy lub średnie marginalne za pomocą kontrastów. Jeśli masz dane wielopoziomowe i efekty losowe, efekty te są automatycznie integrowane, aby zapewnić szacunki marginalne (czyli uśrednione dla populacji). Po dopasowaniu niemal dowolnego modelu w Stata przeanalizuj wpływ interakcji współczynników i łatwo twórz wykresy, aby wizualizować te interakcje.
Wnioskowanie przyczynowe
Oszacuj eksperymentalne efekty przyczynowe na podstawie danych obserwacyjnych. Dzięki estymatorom efektów leczenia Stata możesz użyć ram potencjalnych wyników (kontrfaktycznych), aby oszacować na przykład wpływ struktury rodziny na rozwój dziecka lub wpływ bezrobocia na lęk. Dopasuj modele do wyników ciągłych, binarnych, liczbowych, ułamkowych i dotyczących przeżycia z binarnymi lub wielowartościowymi metodami leczenia, używając odwrotnego ważenia prawdopodobieństwa (IPW), dopasowania wyniku skłonności, dopasowania najbliższego sąsiada, korekty regresji lub podwójnie odpornych estymatorów. Jeśli przypisanie do leczenia nie jest niezależne od wyniku, możesz użyć endogenicznego estymatora efektów leczenia. W obecności efektów grupowych i czasowych możesz użyć estymatorów różnicy w różnicach (DID) i potrójnych różnic (DDD). W obecności wielowymiarowych zmiennych współzależnych możesz użyć lasso. Jeżeli skutki przyczynowe są pośredniczone przez inną zmienną, należy zastosować mediację przyczynową z czynnikiem pośredniczącym, aby rozdzielić skutki bezpośrednie i pośrednie.
Tabele epidemiologiczne
Chcesz analizować dane z prospektywnego badania (częstości występowania), badania kohortowego, badania przypadku i kontroli lub dopasowanego badania przypadku i kontroli? Tabele Stata dla epidemiologów ułatwiają podsumowanie danych i obliczanie statystyk, takich jak współczynniki częstości występowania, różnice współczynników częstości występowania, współczynniki ryzyka, różnice ryzyka, ilorazy szans i ułamki przypisywane. Możesz również analizować dane stratyfikowane — obliczać łączone szacunki Mantela-Haenszela, przeprowadzać testy jednorodności i standaryzować szacunki. Jeśli masz ekspozycję porządkową, a nie binarną, możesz wykonać test trendu.
Programowanie
Chcesz zaprogramować własne polecenia, aby wykonać oszacowanie, wykonać zarządzanie danymi lub zaimplementować inne nowe funkcje? Stata jest programowalna, a tysiące użytkowników Stata zaimplementowało i opublikowało tysiące poleceń dodanych przez społeczność. Polecenia te wyglądają i działają tak samo jak oficjalne polecenia Stata i są łatwo instalowane bezpłatnie przez Internet z poziomu Stata. Unikalną cechą środowiska programistycznego Stata jest Mata, szybki i skompilowany język z obsługą typów macierzy. Oczywiście, ma wszystkie zaawansowane operacje macierzowe, których potrzebujesz. Ma również dostęp do mocy LAPACK. Co więcej, ma wbudowane rozwiązywacze i optymalizatory, aby ułatwić implementację własnego maksymalnego prawdopodobieństwa, GMM lub innych estymatorów. Możesz również wykorzystać wszystkie funkcje szacowania i inne funkcje Stata z poziomu Mata. Wiele oficjalnych poleceń Stata jest zaimplementowanych w Mata.
PyStata - integracja z Pythonem
Współdziałaj z kodem Stata i kodem Pythona. Możesz bezproblemowo przesyłać dane i wyniki między Stata i Pythonem. Możesz używać Stata w Jupyter Notebook i innych środowiskach IPython. Możesz wywoływać biblioteki Pythona, takie jak NumPy, matplotlib, Scrapy, scikit-learn i inne ze Stata. Możesz używać analiz Stata z poziomu Pythona.
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Funkcje dla badaczy medycznych
Ogólne modele liniowe
Dopasuj modele jedno- i dwukierunkowe. Lub dopasuj modele z trzema, czterema lub nawet większą liczbą czynników. Analizuj dane z zagnieżdżonymi czynnikami, z czynnikami stałymi i losowymi lub z powtarzanymi pomiarami. Używaj modeli ANCOVA, gdy masz ciągłe zmienne współzmienne, i modeli MANOVA, gdy masz wiele zmiennych wynikowych. Dalsze badanie relacji między wynikiem a predyktorami poprzez szacowanie rozmiarów efektów i obliczanie najmniejszych kwadratów i średnich brzegowych. Przeprowadź kontrasty i porównania parami. Analizuj i kreśl interakcje.
Regresje liniowe, binarne i liczbowe
Dopasuj klasyczne modele ANOVA i regresji liniowej relacji między ciągłym wynikiem, takim jak waga, a czynnikami determinującymi wagę, takimi jak wzrost, dieta i poziom ćwiczeń. Jeśli Twoja odpowiedź jest binarna, porządkowa, kategoryczna lub liczbowa, nie martw się. Stata ma również estymatory dla tego typu wyników. Użyj regresji logistycznej, aby oszacować iloraz szans. Oszacuj wskaźniki zapadalności za pomocą modelu Poissona. Przeanalizuj dopasowane dane przypadek–kontrola za pomocą warunkowej regresji logistycznej. Po dopasowaniu takich modeli dostępna jest szeroka gama narzędzi. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów. Oblicz liniowe i nieliniowe kombinacje parametrów.
Moc, precyzja i wielkość próbki
Przed przeprowadzeniem eksperymentu określ wielkość próby potrzebną do wykrycia istotnych efektów bez marnowania zasobów. Czy zamierzasz obliczyć przedziały ufności dla średnich lub wariancji lub wykonać testy proporcji lub korelacji? Czy zamierzasz dopasować model proporcjonalnych zagrożeń Coxa lub porównać funkcje przeżycia przy użyciu testu log-rank? Czy chcesz użyć testu asocjacji Cochrana-Mantela-Haenszela lub testu trendu Cochrana-Armitage'a? Użyj polecenia power programu Stata, aby obliczyć moc i wielkość próby, utworzyć niestandardowe tabele i automatycznie wykreślić zależności między mocą, wielkością próby i wielkością efektu dla zaplanowanego badania. Możesz też użyć polecenia ciwidth, aby zrobić to samo, ale dla przedziałów ufności zamiast testów hipotez, obliczając wymaganą wielkość próby dla pożądanej precyzji przedziału ufności. Możesz też użyć gsdesign, aby obliczyć granice zatrzymania i wymagane rozmiary próby dla projektów sekwencyjnych grup. Zamiast poleceń użyj interaktywnego Panelu sterowania, aby wykonać analizę.
Średnie marginalne, kontrasty i interakcje
Średnie marginalne i kontrasty pozwalają analizować relacje między zmienną wynikową a współczynnikami, nawet jeśli wynik jest binarny, liczbowy, porządkowy, kategoryczny lub przeżywalności. Oblicz skorygowane prognozy z współczynnikami ustawionymi na interesujące lub reprezentatywne wartości. Lub oblicz średnie marginalne dla każdego poziomu współczynnika kategorialnego. Porównuj skorygowane prognozy lub średnie marginalne za pomocą kontrastów. Jeśli masz dane wielopoziomowe i efekty losowe, efekty te są automatycznie integrowane, aby zapewnić szacunki marginalne (czyli uśrednione dla populacji). Po dopasowaniu niemal dowolnego modelu w Stata przeanalizuj wpływ interakcji współczynników i łatwo twórz wykresy, aby wizualizować te interakcje.
Wielopoziomowe modele efektów mieszanych
Niezależnie od tego, czy grupowania w danych powstają w sposób zagnieżdżony (pacjenci zagnieżdżeni w klinikach, a kliniki zagnieżdżone w regionach), czy w sposób niezagnieżdżony (regiony skrzyżowane z zawodami), możesz dopasować model wielopoziomowy, aby uwzględnić brak niezależności w tych grupach. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, porządkowych i dotyczących przeżycia. Oszacuj wariancje losowych przecięć i losowych współczynników. Oblicz korelacje wewnątrzklasowe. Przewiduj efekty losowe. Oszacuj relacje, które są uśrednione dla populacji w odniesieniu do efektów losowych.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Wielokrotne imputowanie
Uwzględnij brakujące dane w próbie, używając wielokrotnej imputacji. Wybierz spośród metod jednowymiarowych i wielowymiarowych, aby imputować brakujące wartości w zmiennych ciągłych, ocenzurowanych, obciętych, binarnych, porządkowych, kategorycznych i zliczeniowych. Następnie, w jednym kroku, oszacuj parametry, używając imputowanych zestawów danych i połącz wyniki. Dopasuj model liniowy, model logit, model Poissona, model hierarchiczny, model przetrwania lub jeden z wielu innych obsługiwanych modeli. Użyj polecenia mi lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą analizę MI.
Analiza przeżycia
Przeanalizuj wyniki dotyczące czasu trwania — wyniki mierzące czas do zdarzenia, takiego jak awaria lub śmierć — przy użyciu specjalistycznych narzędzi Stata do analizy przeżycia. Weź pod uwagę komplikacje inherentne dla danych dotyczących przeżycia, takie jak czasami brak obserwacji zdarzenia (cenzura prawa, lewa i przedziałowa), osoby wchodzące do badania w różnym czasie (opóźnione wejście) i osoby, które nie są stale obserwowane przez cały okres badania (luki). Możesz oszacować i przedstawić na wykresie prawdopodobieństwo przeżycia w czasie. Lub modelować przeżycie jako funkcję współczynników przy użyciu modeli Coxa, Weibulla, logarytmiczno-normalnych i innych modeli regresji. Przewiduj współczynniki ryzyka, średni czas przeżycia i prawdopodobieństwo przeżycia. Czy w badaniu biorą udział grupy osób? Dostosuj korelację wewnątrzgrupową za pomocą modelu efektów losowych lub modelu wspólnej kruchości. Jeśli masz wiele potencjalnych współczynników, użyj lasso cox i elasticnet cox do wyboru modelu i przewidywania.
Tabele epidemiologiczne
Chcesz analizować dane z prospektywnego badania (częstości występowania), badania kohortowego, badania przypadku i kontroli lub dopasowanego badania przypadku i kontroli? Tabele Stata dla epidemiologów ułatwiają podsumowanie danych i obliczanie statystyk, takich jak współczynniki częstości występowania, różnice współczynników częstości występowania, współczynniki ryzyka, różnice ryzyka, ilorazy szans i ułamki przypisywane. Możesz również analizować dane stratyfikowane — obliczać łączone szacunki Mantela-Haenszela, przeprowadzać testy jednorodności i standaryzować szacunki. Jeśli masz ekspozycję porządkową, a nie binarną, możesz wykonać test trendu.
Modele addytywne ryzyka względnego
Określ, w jaki sposób narażenie oddziałuje na siebie, narażając osoby badane na większe ryzyko wystąpienia interesującego wyniku. Na przykład możesz badać, w jaki sposób narażenie na dym papierosowy i azbest oddziałuje na siebie, zwiększając ryzyko zachorowania na raka płuc. Za pomocą polecenia reri programu Stata możesz mierzyć dwukierunkowe interakcje w addytywnym modelu ryzyka względnego, uwzględniając jednocześnie inne czynniki ryzyka. Wybierz spośród różnych obsługiwanych modeli, takich jak dwumianowy uogólniony liniowy, Poissona, ujemny dwumianowy, logistyczny, Coxa, parametryczny model przeżycia oraz parametryczny i półparametryczny model przeżycia z cenzurą interwałową. Oszacuj względne ryzyko nadmiarowe wynikające z interakcji (RERI), przypisywalnej proporcji (AP) i wskaźnika synergii (SI).
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Jupyter Notebook ze Statą
Jupyter Notebook jest szeroko stosowany przez badaczy i naukowców do dzielenia się pomysłami i wynikami w celu współpracy i innowacji. Jest to łatwa w użyciu aplikacja internetowa, która umożliwia łączenie kodu, wizualizacji, wzorów matematycznych, tekstu narracyjnego i innych bogatych mediów w jednym dokumencie („notatniku”) do interaktywnego przetwarzania i opracowywania. Możesz wywołać Stata i Mata z Jupyter Notebook za pomocą jądra IPython (interaktywny Python). Oznacza to, że możesz połączyć możliwości Pythona i Stata w jednym środowisku, aby Twoja praca była łatwa do odtworzenia i udostępniania innym.
Funkcje dla socjologów
Metody badania
Niezależnie od tego, czy Twoje dane wymagają prostej ważonej korekty z powodu różnicowych współczynników próbkowania, czy też masz dane ze złożonego badania wieloetapowego, funkcje badania Stata mogą zapewnić Ci prawidłowe błędy standardowe i przedziały ufności dla Twoich wniosków. Po prostu określ odpowiednie cechy swojego projektu próbkowania, takie jak wagi próbkowania (w tym wagi na wielu etapach), klasteryzacja (na jednym, dwóch lub więcej etapach), stratyfikacja i poststratyfikacja. Następnie większość poleceń estymacji Stata może dostosować swoje szacunki, aby poprawić Twój projekt próbkowania.
Wielokrotne imputowanie
Uwzględnij brakujące dane w próbie, używając wielokrotnej imputacji. Wybierz spośród metod jednowymiarowych i wielowymiarowych, aby imputować brakujące wartości w zmiennych ciągłych, ocenzurowanych, obciętych, binarnych, porządkowych, kategorycznych i zliczeniowych. Następnie, w jednym kroku, oszacuj parametry, używając imputowanych zestawów danych i połącz wyniki. Dopasuj model liniowy, model logit, model Poissona, model wielopoziomowy, model przetrwania lub jeden z wielu innych obsługiwanych modeli. Użyj polecenia mi lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą analizę MI.
Wielopoziomowe modele efektów mieszanych
Niezależnie od tego, czy grupowania w Twoich danych powstają w sposób zagnieżdżony (uczniowie zagnieżdżeni w szkołach i szkoły zagnieżdżone w okręgach), czy w sposób niezagnieżdżony (regiony skrzyżowane z zawodami), możesz dopasować model wielopoziomowy, aby uwzględnić brak niezależności w tych grupach. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, porządkowych i przetrwania. Oszacuj wariancje losowych przecięć i losowych współczynników. Oblicz korelacje wewnątrzklasowe. Przewiduj efekty losowe. Oszacuj relacje, które są uśrednione dla populacji w odniesieniu do efektów losowych.
Dane panelowe
Wykorzystaj w pełni dodatkowe informacje, które dostarczają dane panelowe, jednocześnie radząc sobie ze specyficznymi trudnościami, jakie przedstawiają dane panelowe. Zbadaj niezmienne w czasie idiosynkratyczne cechy w obrębie każdego panelu, relacje między panelami i to, jak wyniki zainteresowania zmieniają się w czasie. Dopasuj modele liniowe lub nieliniowe dla wyników binarnych, liczbowych, porządkowych, ocenzurowanych lub przetrwania z estymatorami efektów stałych, efektów losowych lub uśrednionych dla populacji. Dopasuj modele dynamiczne lub modele z endogenicznością. Dopasuj bayesowskie modele danych panelowych.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Regresje liniowe, binarne i liczbowe
Dopasuj klasyczne modele liniowe relacji między ciągłym wynikiem, takim jak płaca, a czynnikami determinującymi płacę, takimi jak poziom wykształcenia, wiek, doświadczenie i sektor ekonomiczny. Jeśli Twoja odpowiedź jest binarna (na przykład zatrudniony lub bezrobotny), porządkowa (poziom wykształcenia) lub liczbowa (liczba dzieci), nie martw się. Stata ma estymatory maksymalnego prawdopodobieństwa — probit, uporządkowany probit, Poissona i wiele innych — które szacują relację między takimi wynikami a ich czynnikami determinującymi. Dostępna jest szeroka gama narzędzi do analizy takich modeli. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów lub dowolną liniową lub nieliniową kombinację parametrów.
Modelowanie równań strukturalnych (SEM)
Oszacowanie efektów mediacji, analiza relacji między nieobserwowanym ukrytym pojęciem, takim jak poziom konserwatyzmu danej osoby, a obserwowanymi zmiennymi mierzącymi konserwatyzm, modelowanie systemu z wieloma zmiennymi endogenicznymi i skorelowanymi błędami lub dopasowanie modelu ze złożonymi relacjami między zmiennymi ukrytymi i obserwowanymi. Dopasowanie modeli z wynikami ciągłymi, binarnymi, liczbowymi, porządkowymi, ułamkowymi i dotyczącymi przeżycia. Nawet dopasowanie modeli wielopoziomowych z grupami skorelowanych obserwacji, takimi jak dzieci w tych samych szkołach. Ocena dopasowania modelu. Obliczenie pośrednich i całkowitych efektów. Dopasowanie modeli poprzez narysowanie diagramu ścieżki lub użycie prostej składni polecenia.
Dostosowane prognozy, interakcje i moderacja
Skorygowane prognozy i średnie marginalne pozwalają analizować relacje między zmienną wynikową a współczynnikami, nawet jeśli wynik jest binarny, liczbowy, porządkowy lub kategoryczny. Oblicz skorygowane prognozy z współczynnikami ustawionymi na interesujące lub reprezentatywne wartości. Lub oblicz średnie marginalne dla każdego poziomu współczynnika kategorycznej. Porównuj skorygowane prognozy lub średnie marginalne za pomocą kontrastów. Jeśli masz dane wielopoziomowe lub panelowe i efekty losowe, efekty te są automatycznie integrowane, aby zapewnić szacunki marginalne (czyli uśrednione dla populacji). Po dopasowaniu niemal dowolnego modelu w Stata przeanalizuj wpływ zmiennych moderujących i łatwo twórz wykresy interakcji.
Modele wyboru
Modeluj swoje dane dotyczące wyboru dyskretnego. Jeśli na przykład Twoim wynikiem jest wybór absolwentów szkół średnich, aby pójść na studia, pójść do szkoły zawodowej lub podjąć pracę, możesz dopasować warunkowy model logit, wielomianowy model probitowy lub mieszany model logitowy. Czy Twoim wynikiem jest raczej ranking preferowanych alternatyw? Dopasuj model probitowy lub model logitowy o uporządkowanej randze. Niezależnie od dopasowania modelu, możesz użyć marginesów, aby łatwo zinterpretować wyniki. Oszacuj, jak bardzo odległość do najbliższej uczelni wpływa na prawdopodobieństwo zapisania się na studia, a nawet prawdopodobieństwo pójścia do szkoły zawodowej.
Analiza bayesowska
Dopasuj modele regresji bayesowskiej, używając jednej z metod łańcucha Markowa Monte Carlo (MCMC). Możesz wybierać spośród różnych obsługiwanych modeli lub nawet zaprogramować własny. Dostępne są rozbudowane narzędzia do sprawdzania zbieżności, w tym wiele łańcuchów. Obliczaj estymacje średniej a posteriori i wiarygodne przedziały dla parametrów modelu i funkcji parametrów modelu. Możesz wykonywać testy hipotez oparte zarówno na przedziałach, jak i na modelach. Porównuj modele, używając czynników Bayesa. Oblicz dopasowanie modelu, używając wartości predykcyjnych a posteriori i generuj prognozy. Jeśli chcesz uwzględnić niepewność modelu w swoim modelu regresji, użyj uśredniania modelu bayesowskiego.
Wnioskowanie przyczynowe
Oszacuj eksperymentalne efekty przyczynowe na podstawie danych obserwacyjnych. Dzięki estymatorom efektów leczenia Stata możesz użyć ram potencjalnych wyników (kontrfaktycznych), aby oszacować na przykład wpływ struktury rodziny na rozwój dziecka lub wpływ bezrobocia na lęk. Dopasuj modele do wyników ciągłych, binarnych, liczbowych, ułamkowych i dotyczących przeżycia z binarnymi lub wielowartościowymi metodami leczenia, używając odwrotnego ważenia prawdopodobieństwa (IPW), dopasowania wyniku skłonności, dopasowania najbliższego sąsiada, korekty regresji lub podwójnie odpornych estymatorów. Jeśli przypisanie do leczenia nie jest niezależne od wyniku, możesz użyć endogenicznego estymatora efektów leczenia. W obecności efektów grupowych i czasowych możesz użyć estymatorów różnicy w różnicach (DID) i potrójnych różnic (DDD). W obecności wielowymiarowych zmiennych współzależnych możesz użyć lasso. Jeżeli skutki przyczynowe są pośredniczone przez inną zmienną, należy zastosować mediację przyczynową z czynnikiem pośredniczącym, aby rozdzielić skutki bezpośrednie i pośrednie.
Programowanie
Chcesz zaprogramować własne polecenia, aby wykonać oszacowanie, wykonać zarządzanie danymi lub zaimplementować inne nowe funkcje? Stata jest programowalna, a tysiące użytkowników Stata zaimplementowało i opublikowało tysiące poleceń dodanych przez społeczność. Polecenia te wyglądają i działają tak samo jak oficjalne polecenia Stata i są łatwo instalowane bezpłatnie przez Internet z poziomu Stata. Unikalną cechą środowiska programistycznego Stata jest Mata, szybki i skompilowany język z obsługą typów macierzy. Oczywiście, ma wszystkie zaawansowane operacje macierzowe, których potrzebujesz. Ma również dostęp do mocy LAPACK. Co więcej, ma wbudowane rozwiązywacze i optymalizatory, aby ułatwić implementację własnego maksymalnego prawdopodobieństwa, GMM lub innych estymatorów. Możesz również wykorzystać wszystkie funkcje szacowania i inne funkcje Stata z poziomu Mata. Wiele oficjalnych poleceń Stata jest zaimplementowanych w Mata.
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Jupyter Notebook ze Statą
Jupyter Notebook jest szeroko stosowany przez badaczy i naukowców do dzielenia się pomysłami i wynikami w celu współpracy i innowacji. Jest to łatwa w użyciu aplikacja internetowa, która umożliwia łączenie kodu, wizualizacji, wzorów matematycznych, tekstu narracyjnego i innych bogatych mediów w jednym dokumencie („notatniku”) do interaktywnego przetwarzania i opracowywania. Możesz wywołać Stata i Mata z Jupyter Notebook za pomocą jądra IPython (interaktywny Python). Oznacza to, że możesz połączyć możliwości Pythona i Stata w jednym środowisku, aby Twoja praca była łatwa do odtworzenia i udostępniania innym.
Funkcje dla specjalistów zdrowia publicznego
Metody badania
Niezależnie od tego, czy Twoje dane wymagają prostej ważonej korekty z powodu różnicowych współczynników próbkowania, czy też masz dane ze złożonego badania wieloetapowego, funkcje badania Stata mogą zapewnić Ci prawidłowe błędy standardowe i przedziały ufności dla Twoich wniosków. Po prostu określ odpowiednie cechy swojego projektu próbkowania, takie jak wagi próbkowania (w tym wagi na wielu etapach), klasteryzacja (na jednym, dwóch lub więcej etapach), stratyfikacja i poststratyfikacja. Następnie większość poleceń estymacji Stata może dostosować swoje szacunki, aby poprawić Twój projekt próbkowania.
Wielokrotne imputowanie
Uwzględnij brakujące dane w próbie, używając wielokrotnej imputacji. Wybierz spośród metod jednowymiarowych i wielowymiarowych, aby imputować brakujące wartości w zmiennych ciągłych, ocenzurowanych, obciętych, binarnych, porządkowych, kategorycznych i zliczeniowych. Następnie, w jednym kroku, oszacuj parametry, używając imputowanych zestawów danych i połącz wyniki. Dopasuj model liniowy, model logit, model Poissona, model wielopoziomowy, model przetrwania lub jeden z wielu innych obsługiwanych modeli. Użyj polecenia mi lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą analizę MI.
Wielopoziomowe modele efektów mieszanych
Niezależnie od tego, czy grupowania w Twoich danych powstają w sposób zagnieżdżony (uczniowie zagnieżdżeni w szkołach i szkoły zagnieżdżone w okręgach), czy w sposób niezagnieżdżony (regiony skrzyżowane z zawodami), możesz dopasować model wielopoziomowy, aby uwzględnić brak niezależności w tych grupach. Dopasuj modele dla wyników ciągłych, binarnych, liczbowych, porządkowych i przetrwania. Oszacuj wariancje losowych przecięć i losowych współczynników. Oblicz korelacje wewnątrzklasowe. Przewiduj efekty losowe. Oszacuj relacje, które są uśrednione dla populacji w odniesieniu do efektów losowych.
Dane panelowe
Wykorzystaj w pełni dodatkowe informacje, które dostarczają dane panelowe, jednocześnie radząc sobie ze specyficznymi trudnościami, jakie przedstawiają dane panelowe. Zbadaj niezmienne w czasie idiosynkratyczne cechy w obrębie każdego panelu, relacje między panelami i to, jak wyniki zainteresowania zmieniają się w czasie. Dopasuj modele liniowe lub nieliniowe dla wyników binarnych, liczbowych, porządkowych, ocenzurowanych lub przetrwania z estymatorami efektów stałych, efektów losowych lub uśrednionych dla populacji. Dopasuj modele dynamiczne lub modele z endogenicznością. Dopasuj bayesowskie modele danych panelowych.
Metaanaliza
Połącz wyniki wielu badań, aby oszacować ogólny efekt. Użyj wykresów leśnych, aby zwizualizować wyniki. Użyj analizy podgrup i metaregresji, aby zbadać heterogeniczność badań. Użyj wykresów lejkowych i formalnych testów, aby zbadać stronniczość publikacji i efekty małych badań. Użyj analizy przycinania i wypełniania, aby ocenić wpływ stronniczości publikacji na wyniki. Wykonaj kumulatywną i pomijającą jedną metaanalizę. Wykonaj jednowymiarową, wielopoziomową i wielowymiarową metaanalizę. Użyj zestawu meta lub pozwól, aby interfejs Panelu sterowania poprowadził Cię przez całą metaanalizę.
Regresje liniowe, binarne i liczbowe
Dopasuj klasyczne modele liniowe relacji między ciągłym wynikiem, takim jak płaca, a czynnikami determinującymi płacę, takimi jak poziom wykształcenia, wiek, doświadczenie i sektor ekonomiczny. Jeśli Twoja odpowiedź jest binarna (na przykład zatrudniony lub bezrobotny), porządkowa (poziom wykształcenia) lub liczbowa (liczba dzieci), nie martw się. Stata ma estymatory maksymalnego prawdopodobieństwa — probit, uporządkowany probit, Poissona i wiele innych — które szacują relację między takimi wynikami a ich czynnikami determinującymi. Dostępna jest szeroka gama narzędzi do analizy takich modeli. Przewiduj wyniki i ich przedziały ufności. Testuj równość parametrów lub dowolną liniową lub nieliniową kombinację parametrów.
Modelowanie równań strukturalnych (SEM)
Oszacowanie efektów mediacji, analiza relacji między nieobserwowanym ukrytym pojęciem, takim jak poziom konserwatyzmu danej osoby, a obserwowanymi zmiennymi mierzącymi konserwatyzm, modelowanie systemu z wieloma zmiennymi endogenicznymi i skorelowanymi błędami lub dopasowanie modelu ze złożonymi relacjami między zmiennymi ukrytymi i obserwowanymi. Dopasowanie modeli z wynikami ciągłymi, binarnymi, liczbowymi, porządkowymi, ułamkowymi i dotyczącymi przeżycia. Nawet dopasowanie modeli wielopoziomowych z grupami skorelowanych obserwacji, takimi jak dzieci w tych samych szkołach. Ocena dopasowania modelu. Obliczenie pośrednich i całkowitych efektów. Dopasowanie modeli poprzez narysowanie diagramu ścieżki lub użycie prostej składni polecenia.
Dostosowane prognozy, interakcje i moderacja
Skorygowane prognozy i średnie marginalne pozwalają analizować relacje między zmienną wynikową a współczynnikami, nawet jeśli wynik jest binarny, liczbowy, porządkowy lub kategoryczny. Oblicz skorygowane prognozy z współczynnikami ustawionymi na interesujące lub reprezentatywne wartości. Lub oblicz średnie marginalne dla każdego poziomu współczynnika kategorycznej. Porównuj skorygowane prognozy lub średnie marginalne za pomocą kontrastów. Jeśli masz dane wielopoziomowe lub panelowe i efekty losowe, efekty te są automatycznie integrowane, aby zapewnić szacunki marginalne (czyli uśrednione dla populacji). Po dopasowaniu niemal dowolnego modelu w Stata przeanalizuj wpływ zmiennych moderujących i łatwo twórz wykresy interakcji.
Modele wyboru
Modeluj swoje dane dotyczące wyboru dyskretnego. Jeśli na przykład Twoim wynikiem jest wybór absolwentów szkół średnich, aby pójść na studia, pójść do szkoły zawodowej lub podjąć pracę, możesz dopasować warunkowy model logit, wielomianowy model probitowy lub mieszany model logitowy. Czy Twoim wynikiem jest raczej ranking preferowanych alternatyw? Dopasuj model probitowy lub model logitowy o uporządkowanej randze. Niezależnie od dopasowania modelu, możesz użyć marginesów, aby łatwo zinterpretować wyniki. Oszacuj, jak bardzo odległość do najbliższej uczelni wpływa na prawdopodobieństwo zapisania się na studia, a nawet prawdopodobieństwo pójścia do szkoły zawodowej.
Analiza bayesowska
Dopasuj modele regresji bayesowskiej, używając jednej z metod łańcucha Markowa Monte Carlo (MCMC). Możesz wybierać spośród różnych obsługiwanych modeli lub nawet zaprogramować własny. Dostępne są rozbudowane narzędzia do sprawdzania zbieżności, w tym wiele łańcuchów. Obliczaj estymacje średniej a posteriori i wiarygodne przedziały dla parametrów modelu i funkcji parametrów modelu. Możesz wykonywać testy hipotez oparte zarówno na przedziałach, jak i na modelach. Porównuj modele, używając czynników Bayesa. Oblicz dopasowanie modelu, używając wartości predykcyjnych a posteriori i generuj prognozy. Jeśli chcesz uwzględnić niepewność modelu w swoim modelu regresji, użyj uśredniania modelu bayesowskiego.
Wnioskowanie przyczynowe
Oszacuj eksperymentalne efekty przyczynowe na podstawie danych obserwacyjnych. Dzięki estymatorom efektów leczenia Stata możesz użyć ram potencjalnych wyników (kontrfaktycznych), aby oszacować na przykład wpływ struktury rodziny na rozwój dziecka lub wpływ bezrobocia na lęk. Dopasuj modele do wyników ciągłych, binarnych, liczbowych, ułamkowych i dotyczących przeżycia z binarnymi lub wielowartościowymi metodami leczenia, używając odwrotnego ważenia prawdopodobieństwa (IPW), dopasowania wyniku skłonności, dopasowania najbliższego sąsiada, korekty regresji lub podwójnie odpornych estymatorów. Jeśli przypisanie do leczenia nie jest niezależne od wyniku, możesz użyć endogenicznego estymatora efektów leczenia. W obecności efektów grupowych i czasowych możesz użyć estymatorów różnicy w różnicach (DID) i potrójnych różnic (DDD). W obecności wielowymiarowych zmiennych współzależnych możesz użyć lasso. Jeżeli skutki przyczynowe są pośredniczone przez inną zmienną, należy zastosować mediację przyczynową z czynnikiem pośredniczącym, aby rozdzielić skutki bezpośrednie i pośrednie.
Programowanie
Chcesz zaprogramować własne polecenia, aby wykonać oszacowanie, wykonać zarządzanie danymi lub zaimplementować inne nowe funkcje? Stata jest programowalna, a tysiące użytkowników Stata zaimplementowało i opublikowało tysiące poleceń dodanych przez społeczność. Polecenia te wyglądają i działają tak samo jak oficjalne polecenia Stata i są łatwo instalowane bezpłatnie przez Internet z poziomu Stata. Unikalną cechą środowiska programistycznego Stata jest Mata, szybki i skompilowany język z obsługą typów macierzy. Oczywiście, ma wszystkie zaawansowane operacje macierzowe, których potrzebujesz. Ma również dostęp do mocy LAPACK. Co więcej, ma wbudowane rozwiązywacze i optymalizatory, aby ułatwić implementację własnego maksymalnego prawdopodobieństwa, GMM lub innych estymatorów. Możesz również wykorzystać wszystkie funkcje szacowania i inne funkcje Stata z poziomu Mata. Wiele oficjalnych poleceń Stata jest zaimplementowanych w Mata.
Automatyczne raportowanie i konfigurowalne tabele
Stata jest przeznaczona do powtarzalnych badań, w tym do tworzenia dynamicznych dokumentów zawierających wyniki analizy. Twórz pliki Word lub PDF, wypełniaj arkusze kalkulacyjne Excel wynikami i formatuj je według własnych upodobań, a także miksuj wyniki Markdown, HTML, Stata i wykresy Stata, wszystko w Stata. Twórz tabele porównujące wyniki regresji lub statystyki podsumowujące, używaj domyślnych stylów lub stosuj własne, a następnie eksportuj tabele do Word, PDF, HTML, LaTeX, Excel lub Markdown i uwzględniaj je w raportach.
Jupyter Notebook ze Statą
Jupyter Notebook jest szeroko stosowany przez badaczy i naukowców do dzielenia się pomysłami i wynikami w celu współpracy i innowacji. Jest to łatwa w użyciu aplikacja internetowa, która umożliwia łączenie kodu, wizualizacji, wzorów matematycznych, tekstu narracyjnego i innych bogatych mediów w jednym dokumencie („notatniku”) do interaktywnego przetwarzania i opracowywania. Możesz wywołać Stata i Mata z Jupyter Notebook za pomocą jądra IPython (interaktywny Python). Oznacza to, że możesz połączyć możliwości Pythona i Stata w jednym środowisku, aby Twoja praca była łatwa do odtworzenia i udostępniania innym.
Blog
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Essential
Nazwa | Description | Lifetime |
---|---|---|
ADD_TO_CART | (Adobe Commerce only) Used by Google Tag Manager | 1 Year |
GUEST-VIEW | Stores the Order ID that guest shoppers use to retrieve their order status. Guest orders view. Used in Orders and Returns widgets | 1 Year |
LOGIN_REDIRECT | Preserves the destination page that was loading before the customer was directed to log in | 1 Year |
MAGE-BANNERS-CACHE-STORAGE | (Adobe Commerce only) Stores banner content locally to improve performance | 1 Year |
MAGE-MESSAGES | Tracks error messages and other notifications that are shown to the user | 1 Year |
MAGE-TRANSLATION-STORAGE | Stores translated content when requested by the shopper | 1 Year |
MAGE-TRANSLATION-FILE-VERSION | Tracks the version of translations in local storage | 1 Year |
PRODUCT_DATA_STORAGE | Stores configuration for product data related to Recently Viewed/Compared Products | 1 Year |
RECENTLY_COMPARED_PRODUCT | Stores product IDs of recently compared products | 1 Year |
RECENTLY_COMPARED_PRODUCT_PREVIOUS | Stores product IDs of previously compared products for easy navigation | 1 Year |
RECENTLY_VIEWED_PRODUCT | Stores product IDs of recently viewed products for easy navigation | 1 Year |
RECENTLY_VIEWED_PRODUCT_PREVIOUS | Stores product IDs of recently previously viewed products for easy navigation | 1 Year |
REMOVE_FROM_CART | (Adobe Commerce only) Used by Google Tag Manager | 1 Year |
STF | Records the time messages are sent by the SendFriend | 1 Year |
X-MAGENTO-VARY | Configuration setting that improves performance when using Varnish static content caching | 1 Year |
FORM_KEY | A security measure that appends a random string to all form submissions to protect the data from Cross-Site Request Forgery | 1 Year |
MAGE-CACHE-SESSID | The value of this cookie triggers the cleanup of local cache storage | 1 Year |
MAGE-CACHE-STORAGE | Local storage of visitor-specific content that enables ecommerce functions | 1 Year |
MAGE-CACHE-STORAGE-SECTION-INVALIDATION | Forces local storage of specific content sections that should be invalidated | 1 Year |
PERSISTENT_SHOPPING_CART | Stores the key (ID) of persistent cart to make it possible to restore the cart for an anonymous shopper | 1 Year |
PRIVATE_CONTENT_VERSION | Appends a random, unique number and time to pages with customer content to prevent them from being cached on the server | 1 Year |
SECTION_DATA_IDS | Stores customer-specific information related to shopper-initiated actions, such as wish list display and checkout information | 1 Year |
STORE | Tracks the specific store view/locale selected by the shopper | 1 Year |
Marketing
Nazwa | Description | Lifetime |
---|---|---|
CUSTOMER_SEGMENT_IDS | Stores your Customer Segment ID | 1 Year |
EXTERNAL_NO_CACHE | A flag that, indicates whether caching is on or off | 1 Year |
FRONTEND | Your session ID on the server | 1 Year |
GUEST-VIEW | Allows guests to edit their orders | 1 Year |
LAST_CATEGORY | The last category you visited | 1 Year |
LAST_PRODUCT | The last product you looked at | 1 Year |
NEWMESSAGE | Indicates whether a new message has been received | 1 Year |
NO_CACHE | Indicates whether it is allowed to use cache | 1 Year |
Functionality
Nazwa | Description | Lifetime |
---|---|---|
MG_DNT | Allows you to restrict Adobe Commerce data collection if you have custom code to manage cookie consent on your site | 1 Year |
USER_ALLOWED_SAVE_COOKIE | Used for cookie restriction mode | 1 Year |
AUTHENTICATION_FLAG | Indicates if a shopper has signed in or signed out | 1 Year |
DATASERVICES_CUSTOMER_ID | Indicates if a shopper has signed in or signed out | 1 Year |
DATASERVICES_CUSTOMER_GROUP | Indicates a customer's group. This cookie is stored as sha1 checksum of the customer's group ID | 1 Year |
DATASERVICES_CART_ID | Identifies a shopper's cart actions | 1 Year |
DATASERVICES_PRODUCT_CONTEXT | Identifies a shopper's product interactions. This cookie contains the customer's unique quote ID in the system | 1 Year |
Statistical
Nazwa | Description | Lifetime |
---|---|---|
_ga | Used by Google Analytics | 1 Year |
_ga_* | Used by Google Analytics | 1 Year |
Validate your login
Zaloguj
Stwórz nowe konto