StatSoft STATISTICA logo zoals bedoeld Naar de webshop
Making the World More Productive ®
Producten > Desktop-Lijn > STATISTICA Base


STATISTICA Base

STATISTICA Base omvat:


Bild

 Beschrijvende statistiek, gestructureerde Tabellen en exploratieve Data-Analyse

Beschrijvende Statistiek.  De software berekent algemeen beschrijvende statistiek alsook Medianen, Middelwaarden, Modaalwaarden, Kwartielen, gebruikersgedefinieerde Percentielen, varianties, standaardafwijkingen, kwartielafstanden, confidentie intervallen, scheefheidsverdelingen, harmonische- en geometrische methoden alsook vele speciale beschrijvende statistieken en diagnosen. Uitgebreide grafische mogelijkheden zoals verschillende typen Box-Whisker-Plots, histogrammen, bivariate Histogrammen (3D), 2D- en 3D-Scatterplots met beperkte waarnemingen, gewone, eenzijdige en trend geneutraliseerde verdelingsplots, Q-Q-Plots, P-P-Plots etc. De aanpassing van de normale verdeling wordt op basis van data aan de hand van geselecteerde tests gecontroleerd (Kolmogorov-Smirnov-, Lilliefors- en Shapiro-Wilks-Test). Buiten de normaal verdeling kan een verscheidenheid aan verdelingen worden toegepast.

Analyse naar Groepen.  Beschrijvende statistieken en grafieken zijn samen te stellen uit data afkomstig van één of meerdere groepsvariabelen. De gebruiker kan met slechts enkele muisclicks data naar bv. geslacht en leeftijd indelen om histogrammen, Box-Whisker-Plots, normale verdelingsplots, scatterplots etc. in categorieën samen te stellen. Indien meer dan twee categorische variabelen worden gekozen, worden de overlappende vensters en grafieken automatisch opgebouwd. Voor de continue variabelen die gegroepeerd zijn naar waarde is een aantal opties beschikbaar waarmee de waarde van de variabelen naar vooraf bepaalde intervallen wordt verdeeld. Als alternatief dient de functie om te hercoderen. Hercodering kan complex worden indien het betrekking heeft op alle variabelen uit het data bestand. Teneinde dit te voorkomen is een speciale hierarchische Break-Down procedure ontwikkeld, waarmee de gebruiker de data over max. 6 categorische variabelen kan verdelen. Vervolgens kan een veelheid van grafieken, beschrijvende statistiek en correlatie matrices voor subgroepen worden samengesteld. Talrijke formatterings- en labelling opties staan de gebruiker ter beschikking om tabellen en rapporten samen te stellen. Bij deze Breakdown-Procedure zijn ontwerpen met een extreme omvang (bv. 300 groepen voor 1 enkele groepsvariabele) te specificeren. De resultaten omvatten alle relevante ANOVA statistieken, de volledige ANOVA tabellen, de Levene test op variantie-homogeniteit etc. Zoals in alle andere modules van STATISTICA worden de berekeningen met uitgebreide nauwkeurigheid (viervoudige precisie) uitgevoerd. Vanwege de interactieve structuur van de software is data exploratie zeer eenvoudig. Exploratieve grafieken zijn direct uit de resultaat-tabellen vorm te geven, door met de muis de gekozen cellen te selecteren. Met een enkele muisclick zijn overlappende, complexe grafieken te tonen, die bij dookklikken grafiek voor grafiek laten zien. Uitsplitsingen van tabellen kunnen door de gebruiker voorgedefinieerd worden zodat het aantal benodigde muisclicks verder is te beperken. Alle exploratieve grafische technieken zijn geïntegreerd in de statistische methode om de grafische data-analyse door outlier eliminatie, subset selectie, matching en brushing te kunnen ondersteunen.

omhoog

 Correlaties

Een uitgebreide reeks opties is beschikbaar om de correlaties tussen de variabelen te onderzoeken. Alle gebruikelijke associaties zijn te hanteren; zoals Pearsons, Spearmans, Kendalls Tau, Gamma, tetrachorische r, Phi, Cramers, Contigent coëfficient, Sommers, Onzekerheidscoëfficienten, partiële- en deel correlaties, autocorrelaties etc. Niet lineaire regressie, regressie voor gecensureerde data en verdere afhankelijkheidsanalyse tussen variabelen zijn in de modules Algemene lineaire/niet-lineaire Regressie, Survival analyse en de STATISTICA Advanced (modelgroep hogere modellen) beschikbaar. Ontbrekende waarden kunnen bij de berekening van correlatie matrices uitgesloten worden en bijvoorbeeld door een gemiddelde waarde worden vervangen. Verschillende formatteringsopties zijn beschikbaar om de correlatiematrices in de resultaat tabellen weer te geven. Krachtige functionaliteit is beschikbaar voor de visualisatie van numerieke resultaten. Zodra de gebruiker door de resultaattabel navigeert dan zijn verscheidene grafische voorstellingen mogelijk (bv. scatterplots met betrouwbaarheidsintervallen, diverse 3D-bivariate histogrammen etc.)

Brushing en Outlier diagnose.  De gebruiker beschikt over uitgebreide brushing mogelijkheden zodat enkele datapunten in een scatterplot zijn te selecteren om de invloed op de regressie functies te beoordelen.

Weergave indeling van getallen.  Voor de weergave van de correlatie coëfficient worden diverse wereldstandaarden gehanteerd. Significante correlatie coëfficienten zijn automatisch te markeren. Iedere cel van de tabel valt met de weergave n of p uit te breiden. Gedetailleerde resultaten zijn te verkrijgen met inbegrip van beschrijvende statistieken. Zoals ook bij alle andere numerieke resultaten is voor de resultaattabel een zoom optie mogelijk. Grote matrices zijn te comprimeren met behulp van de zoom functie of door de kolombreedtes te verstellen. Daardoor wordt het zoeken naar coëfficiënten, die een bepaalde door de gebruiker opgegeven waarde overschrijden, eenvoudiger.

Scatterplots, gegroepeerde Analyses.  Tal van grafische opties zijn beschikbaar waarmee de relatie tussen variabelen te onderzoeken is. Deze omvatten bijvoorbeeld 2D en 3D scatterplots (met of zonder labels) om patronen te identificeren. Correlatie matrices kunnen gescheiden naar groeperingsvariabelen berekend worden. Gestructureerde tabellen liggen aan de basis van correlatiematrices. Weergave vindt plaats in rijen van resultaat tabellen (te gebruiken als input bij Structural Equation Modeling (SEM) en PATH-analyses (SEPATH, STATISTICA Advanced, modelgroep hogere modellen). Een volledige correlatie matrix is te illustreren in een spreidingsdiagram. Grote scatterplots zijn interactief te benaderen door het vergroten van de gekozen grafiekdelen via de zoom modus. Ook scatterplots laten zich opsplitsen in groeperingsvariabelen. Ook is een scatterplot te maken voor meerdere subsets van gegevens Diverse andere grafische methoden kunnen een bijdrage leveren in het zoeken naar patronen. Al deze handelingen vragen slechts enkele muisclicks en worden vereenvoudigd door het gebruik van snelkoppelingen. Een willekeurig aantal tabellen en grafieken is gelijktijdig op het scherm weer te geven, waardoor interactieve, verkennende analyses en vergelijkingen gemakkelijk zijn uit te voeren.

omhoog

 Elementaire Statistiek met resultaat tabellen

STATISTICA brengt alle numerieke resultaten in tabellen onder, die zonder verdere verandering als invoer voor volgende analyses kunnen fungeren. Daarom zijn de resultaten van tabellen van eerdere analyses te berekenen binnen de elementaire statistiek. Een tabel met gemiddelde waarden van 2000 variabelen valt samen te stellen en kan als input bestand dienen voor de analyse van de verdeling van de gemiddelde waarden. De elementaire statistiek is derhalve op elk moment tijdens uw analyse beschikbaar en kan worden toegepast op elke resultaat tabel.

Blokstatistieken.  Naast functies voor individuele gegevens wordt functionaliteit aangeboden gebaseerd op een willekeurige selectie van blokwaarden. Wanneer bijvoorbeeld een resultaat tabel met 2000 variabelen is samengesteld valt er bijvoorbeeld een blok van 200 variabelen te markeren die met een enkele handeling een multiple lijngrafiek toont voor een subset van 200 variabelen. Dit kan worden gebaseerd op rijen of kolommen van het geselecteerde blok. Met deze subset van variabelen valt een meervoudige lijnplot vanuit verschillende posities te maken.

omhoog

 Interaktieve Kansberekening

Een flexibele, interaktieve kansberekening is toegankelijk vanuit alle werkbalken. Het omvat een uitgebreide selectie: Beta, Cauchy, Chi-Quadrat, Exponential, Extreme Waarden, F, Gamma, Laplace, Lognormal, Logistisch, Pareto, Rayleigh, t (Student), Weibull en Z (Normaal).In het dialoogvenster zijn kleine grafieken met intensiteit en verdeling geïntegreerd, zodat de gebruiker wegwijs raakt met de eigenschappen van deze functies. De Mikro Roll-bars zijn hierbij inzetbaar (laatste cijfer, linker muisknop; voorlaatste paragraaf, rechter muisknop. De samengestelde grafieken zijn te bekijken waardoor de dialoog versterkt wordt. Zo kan de correlatie tussen argumenten, waarschijnlijkheid en verdeling interaktief worden onderzocht.

omhoog

 t-Tests (Onderscheid tussen groepen).

t-Tests kunnen worden uitgevoerd bij zowel afhankelijke als onafhankelijke steekproeven. Hotellings T2 (zie ANOVA/MANOVA) en GLM, General Linear Models (STATISTICA Advanced, modelgroep hogere modellen) valt te berekenen. Flexible opties zijn beschikbaar voor vergelijkingen tussen variabelen en gecodeerde groepen. Hierdoor zijn er meerdere opties beschikbaar voor diagnostische statistiek en voor grafieken. Een t-Test voor onafhankelijke steekproeven kan te maken hebben met proeven met gescheiden variantie, Levene tests, verschillende Box-Whiskers plots, histogrammen, verdelingsplots en scatterplots. Meer specifieke tests voor verschillen tussen groepen zijn onderdeel van andere modules.

omhoog

 Analyse van meervoudige antwoorden

Voor de verwerking van continue, categorische en multiple response variabelen zijn krachtige procedures beschikbaar. De lay-out en de tabel opmaak is te controleren door een verscheidenheid aan opties. Zo kunnen bijvoorbeeld tabellen die meervoudige antwoorden bevatten bepaald worden op basis van het aantal reakties. Meervoudige antwoord variabelen kunnen per paar verwerkt worden. Verschillende opties voor de behandeling van missing data zijn beschikbaar. Daarnaast zijn de frequentie tabellen op basis van willekeur door de gebruiker te categoriseren en te definieren naar complexiteit. Alle tabellen kunnen verder eenvoudig worden verwerkt in volwaardige rapporten. Op deze wijze kunnen meervoudige tabellen in een Break-Down stijl of met hiërarchische ordening worden gepresenteeerd. Iedere cel is te gebruiken door contigentie tabellen, rijen, kolommen, percentages; ook kunnen uitgebreide waarde labels aan de categorieën worden toegekend. De software is in staat om gecumuleerde of relatieve frequentie, Logit en Probit frequentie, verwachte frequenties bij een normaal verdeling (evenals Kolmogorov-Smirnov, Liliefors en Shapiro-Wilks) in contigentie tabellen te berekenen. Bij contigentie tabellen zijn de volgende statistische tests beschikbaar: Maximum likelihood en Yates-gecorrigeerde Chi-Quadrate, McNemars Chi-Quadrat, de exacte test van Fisher (een- en tweezijdig), Phi en de tetrachorische r; en aanvullende statistieken( Kendalls Tau (a, b), Gamma, Spearmans R, Sommers D, Onzekerheidscoëfficienten etc).

Grafieken.  Onder de grafische opties bevinden zich enkelvoudige, meervoudige en 3-D Histogrammen. Van meerdimensionale kruistabellen is een unieke frequentie interactie plot te produceren. Vele complexe grafieken kunen interactief beoordeeld worden.

omhoog

 Multiple Regressie

Multiple Regressie biedt een uitgebreide set procedures voor lineaire en niet-lineaire regressie in enkelvoudige, meervoudige, stapsgewijze, hiërarchische, quasi-lineaire modellen en modellen met en zonder constante Ridge regressie techniek. De software berekent een uitgebreide set van statistieken en geavanceerde diagnostische statistieken, waaronder de volledige regressie tabel (met standaard fouten voor B, Beta, een constante, R-square, aangepast R-square en de ANOVA tabel), matrices van partiële correlatiecoëfficienten, correlaties en covarianties van regressiecoëfficienten, de sweep matrix (matrix inverse), de Durbin - Watson statistiek, Mahalanobis en Cook's afstanden, verwijderde residuen voor observaties, betrouwbaarheidsintervallen van voorspellende waarden en nog veel meer.

Prognosewaarden en Residuen.  Voor de residuen en outlier analyse zijn vele plots beschikbaar; verscheidene Scatterplots, Histogrammen, enkelvoudige, eenzijdige, trend geneutraliseerde normaal verdelingsplots en partiële correlatie plots. De scores voor de individuele gevallen zijn te visualiseren met behulp van verkennende icon-plots en andere meerdimensionale grafieken die rechtstreeks zijn geïntegreerd. Reststoffen en voorspellingswaarden kunnen automatisch worden toegevoegd. Een prognose methode die de gebruiker toelaat what-if analyses uit te voeren kan interactief worden berekend.

Gegroepeerde analyse; gerelateerde techniek.  Analyse is mogelijk bij het ontwerp met een extreme omvang, bijvoorbeeld wanneer 500 of meer variabelen worden gebruikt. Een optie voor meervoudige regressie analyse op gegroepeerde gegevens is tevens voorzien (multiple regressie voor groepen). Een add-on met aanvullende technieken omvat modellen met duizenden variabelen, twee-traps kleinste kwadraat regressie, Box-Cox en Box-Tidwell transformaties.

omhoog


 Niet-parametrische technieken

Niet parametrische technieken bieden een uitgebreide selectie van beschrijvende en inferentiële statistiek, met inbegrip van gemeenschappelijke tests en een aantal specifieke methoden. In het bijzonder zijn de volgende tests beschikbaar: Wald-Wolfowitz' Runs-Test, Mann-Whitneys U-Test (met exacte waarschijnlijkheden in plaats van de Z-benadering voor steekproeven), Kolmogorov-Smirnov-Tests, Wilcoxon-Test voor onderling verbonden steekproeven, Kruskal-Wallis variantie analyse, mediaan-testen, tekentests, Friedmans variantie analyse, Cochrans Q-Test, McNemar-Test, Kendalls coëfficientie test, Kendalls Tau, Spearmans R, Fishers exacte Test, Chi-Quadrat-Tests, V-Quadrat statistiek, Phi, Gamma, Sommers d, contigentie coëfficienten en overige. Alle tests gebaseerd op rangen zijn te corrigeren voor steekproeven van kleine omvang. De grafieken zijn bij alle tests geïntegreerd: verscheidene Scatterplots, speciale Box-Whisker plots, lijn plots, histogramen en vele andere 2D en 3D beelden.

omhoog

 ANOVA / MANOVA

De functionaliteit ANOVA/MANOVA is een subset van GLM, General Linear Models, en kan univariate en multivariate variantie analyses met of zonder herhaalde meting uitvoeren. GLM maakt het mogelijk de lineaire modellen te specificeren met categorische en/of voorspellingsvariabelen en willekeurige effecten mee te wegen bij herhaalde metingen.

User interfaces.  Ontwerpen kunnen op de meest eenvoudige manier worden beschreven, door de afhankelijkheid van de actuele variabelen te specificeren. De meer complexe, technische wijze waarbij matrices met codes van dummy variabelen worden opgegeven is niet benodigd. Zelfs minder ervaren STATISTICA gebruikers zijn hierdoor in staat de meest complexe ontwerpen te helpen bouwen. ANOVA/MANOVA alsook GLM biedt de gebruiker 3 verschillende user interfaces:
(1) een Assistent, die u stap voor stap door het ontwerpproces leidt,
(2) een op een dialoog gebaseerde user interface waarbij u zelf de variabelen, codes, faktor-niveaus en ontwerpopties selecteert alsook,
(3) een ontwerp editor voorzien van trefwoorden op basis van een algemene ontwerpsyntax.

Berekeningsmethode.  Standaard gebruikt STATISTICA de parameterisatie voor factorieel ontwerp plus een schatting van de meest effectieve hypothese (Hocking, 1981). Indien het ontwerp onevenwichtig of onvolledig is, kunnen hypothesen Type I-, II-, III- en IV- alsook hypothesen Type V- en Type VI- berekend worden.

Resultaten.  De berekeningsmethode en de resultaatweergave is met ANOVA/MANOVA veelomvattend zodat het volledige scala van analytische methoden bij GLM beschikbaar komt. De resultaten omvatten ANOVA tabellen, univariate en multivariate gegevens bij herhaalde metingen met meer dan 2 niveaus, correcties volgens Greenhouse-Geisser en Huynh-Feldt, interactie plots, gedetailleerde beschrijvende statistiek, gedetailleerde residual statistieken, geplande vergelijkingen en post-hoc tests, tests voor aangepaste hypothesen, errors, gedetailleerde diagnose statistieken en plots (bijvoorbeeld een homogeniteit tests van varianties, percelen van de gemiddelde tegen de standaard-deviatie).

omhoog

 Verdelingsaanpassing

Deze functionaliteit maakt het mogelijk om een vergelijk te maken van de (empirische) verdeling van een variabele met een groot aantal theoretische verdelingen. Voor de gegevens aanpassing zijn normale, rechthoekige, exponentiële, gamma, lognormale, chi-kwadraat, Weibull, Gompertz, Binomiale, Poisson, geometrische en Bernoulli verdelingen beschikbaar. De geschiktheid kan worden bepaald met behulp van een chi-kwadraat test of de Kolmogrov-Smirnov sample test. De Lilliefors en Shapiro-Wilks test is uitgevoerd (zie afbeelding). Evaluatie van een bepaalde hypothetische verdeling kan gedaan worden met een gewoon en met een gecumuleerd histogram. Meer opties voor de verdelingsaanpassing zijn in STATISTICA Quality Control, modelgroep Proces-Analyse beschikbaar, waarbij maximum likelihood schattingen voor de parameters Beta-, Exponentieel-, Extreme Waarde- (Type 1,Gumbel), Gamma-, Lognormaal-, Rayleigh- en Weibull verdeling berekend kunnen worden. Ook automatische aanpassing is hierbij mogelijk.

Geïnteresseerd?


Ga de uitdaging aan met intelligentie op je werkplek.
Neem contact op voor een nadere kennismaking!

home omhoog