StatSoft STATISTICA logo zoals bedoeld flags Making the World More Productive ®




Producten > Desktop-Lijn > STATISTICA Advanced

STATISTICA Advanced

STATISTICA Advanced is een aanvullend product en omvat de volgende modelgroepen:

Modelgroep hogere modellen

Deze modelgroep biedt veel geavanceerde lineaire en niet-lineaire methoden, continue en categorische predictoren, interacties, hiërarchische modellen, ondersteuning bij automatische modelselectie evenals variantie componenten, tijdreeksanalyse en vele andere technieken. STATISTICA Advanced omvat de modelgroep hogere modellen, de modelgroep exploratieve technieken en de modelgroep Power-Analyse. Alle analyses zijn uitgerust met interactieve graphics en ingebouwde Visual Basic scripting. De volgende functionaliteit wordt aangeboden:

 Variantie-componenten en gemengde ANOVA/ANCOVA modellen

Variantie-componenten en gemengde ANOVA/ANCOVA modellen bieden speciale functionaliteiten om random effecten en/of factoren met vele niveaus te ontwerpen. Opties voor de behandeling van variantie componenten worden ook aangeboden in GLM, General Linear Models. De variantie componenten maken de ontwerp analyse mogelijk met vaste/random effecten. ANOVA/ANCOVA modellen van extreme grootte kunnen effectief geanalyseerd worden. De factoren kunnen honderden stappen omvatten. STATISTICA analyseert de gewone factoriële ontwerpen en berekent de gebruikelijke Type I, II en lll kwadraatsommen van de variantie analyse. Ook de tabel met de verwachte gemiddelde kwadraten, de variantie componenten, de coëfficienten van de noemer synthese en de volledige ANOVA tabel met samengestelde errors en bijbehorende vrijheidsgraden valt te berekenen op basis van tests (Satterthwaite methode). Daarnaast worden andere methoden voor het schatten van de variantie componenten ondersteund (maximum likelihood). Voor de maximum likelihood schatting van Newton-Raphson en Fisher valt het scoringsalgoritme te gebruiken. Er zijn verschillende opties beschikbaar om de gewogen en ongewogen variabelen en de betrouwbaarheidsintervallen te bepalen. Uitgebreide grafische opties kunnen worden gebruikt om de resultaten te visualiseren.

omhoog

 Survival- en Uitval analyse

Dit betreft een volledige reeks methoden voor het analyseren van gecensureerde data voor zowel biologisch-, medisch-, sociaal-, engineerings- en markt- onderzoek. Naast de berekening van sterfte tabellen met verschillende beschrijvende statistieken met inbegrip van de Kaplan-Meier schatting kan de gebruiker de survival functies via test procedures in verschillende groepen uitvoeren. Hiertoe behoren de Gehan-Test, Cox' F-Test, Cox-Mantel-Test, Log-Rang-Test und Peto & Petos generieke Wilcoxon-Test. Bovendien zijn Kaplan-Meier-Plots voor groepen samen te stellen waarbij de ongecensureerde grafiek waarnemingen door verschillende dot patronen worden gekenmerkt. STATISTICA biedt diverse methoden om de survival functies verder aan te passen (Exponentieel, Linear-Hazard, Gompertz en Weibull). Maximum likelihood schattingen zijn voor verschillende verdelingen, incl. de Weibull verdeling, in de module Quality Control, modelgroep Proces Analyse in te brengen. Tenslotte bevat STATISTICA de volledige uitvoering van de vier algemene modellen (Cox' Proportional Hazard Model, exponentiële Regressie, lognormale- en normale Regressiemodellen) met uitgebreide diagnostische statistieken. Voor de Cox regressie kan de gebruiker de steekproef zo opzetten dat verschillende baseline functies, coëfficientie vectoren en lagen benoemd worden. Ook zijn er functies beschikbaar om één of meer tijdsafhankelijke variabelen te definiëren. De tijdsafhankelijke covariaten kunnen gebruik maken van een flexibele formule. Ten slotte is een uitgebreide selectie van speciale grafieken en diagrammen beschikbaar om de interpretatie van de resultaten te vereenvoudigen (plots voor de survival functie, een voorbeeld van gecensureerde data, Hazard, kansdichtheid, plots voor de vergelijking van groepen, plots voor aanpassing van verdelingen en nog veel meer).

omhoog

 Algemene niet-lineaire Regressie (incl. Logit/Probit functie)

Met algemene niet-lineaire regressie kan de gebruiker aanpassingen verrichten aan een willekeurige set van niet lineaire modellen. In tegenstelling tot traditionele, niet lineaire regressie, speelt de grootte van het databestand hier geen enkele rol. Logit; logistische regressie is inbegrepen.

Schattingsmethoden.  De modellen kunnen door gebruikmaking van KQ of maximum likelihood schatting door de gebruiker aangepast worden. Op basis van het kleinste kwadraat criterium is de Levenberg-Marquardt en het Gauss-Newton algoritme zeer efficiënt in te zetten. Voor grote datasets of ingewikkelde niet-lineaire regressie is dit de aanbevolen methode voor de berekening van nauwkeurige schattingen. De gebruiker kan kiezen uit vier high-performance inschattingen, zelfs met geavanceerde numerieke problemen.

Modellen.  De gebruiker kan een modelvergelijk eenvoudig specificeren door een speciale editor te activeren. De vergelijkingen kunnen indicatorvariabelen bevatten. Bij de vergelijkingen kunnen de volgende verdelingen worden betrokken: Beta-, Binomial-, Cauchy-, Chi-Quadrat-, Exponentieel-, Extreme waarden-, F-, Gamma-, Geometrische, Laplace-, Logistische, Normale-, Lognormale-, Pareto-, Poisson-, Rayleigh-, Students t- alsook de Weibull-verdeling. De gebruiker kan alle aspecten van de schattingstechniek zoals startwaarden, stap maten en convergentie criteria volledig controleren. De meest gebruikte regressiemodellen zijn vooraf gedefinieerd en kunnen in het menu worden geopend. Dit geldt ook voor de Probit- en Logit-Regressie, het exponentiele regressie model en de lineaire regressie.Opgemerkt dient te worden dat STATISTICA ook implementaties van krachtige algoritmes voor aanpassing van GLM, General Linear Models ondersteunt.

Resultaten.  Naast de verschillende beschrijvende statistieken bevat STATISTICA parameterschattingen, hun standaard fouten, die onafhankelijk van de schattingen berekend worden (zie Validation Benchmarks  US-Link), de covariantie matrix, de prognose waarde, residuen en de goodness of fit (zoals de log likelihood van de geschatte/zero modellen). De prognose waarden en de residuen kunnen worden toegevoegd aan het bestand voor verdere analyse. Voor Probit en Logit modellen wordt winst of verlies automatisch berekend wanneer de parameters worden toegevoegd/verwijderd uit het model. Opties voor automatische, stapsgewijze regressie (vooruit en achteruit) , best-subset predictive selectie in Logit en Probit modellen worden bij de functionaliteit GLZ, Algemene lineaire/niet lineaire modellen aangeboden.

Grafieken.  Uitgebreide, geïntegreerde grafieken zijn beschikbaar, zoals 2D en 3D plots, zodat aanpassingen verduidelijkt worden en identificatie van outliers vereenvoudigd wordt. De gebruiker kan interactief de vergelijking van de aangepaste functies veranderen, zonder dat data opnieuw verwerkt dient te worden. Vele verdere speciale grafieken kunnen worden opgesteld.

omhoog

 Loglineaire Analyse

Dit omvat een volledige implementatie van de methoden voor het modelleren van loglineaire, meer-dimensionale frequentie tabellen. Een soortgelijk ontwerp is mogelijk bij GLZ, Algemene lineaire/niet-lineaire Modellen. STATISTICA analyseert tabellen tot en met zeven dimensies. Zowel volledige als onvolledige tabellen kunnen met structurele nullen worden geanalyseerd. Frequentie tabellen kunnen van enkele gegevens worden vervaardigd of ze kunnen direkt worden ingevoerd. Loglineaire analyse biedt een uitgebreide selectie van geavanceerde methoden voor het modelleren in een interactieve en flexibele omgeving. De gebruiker kan op elk punt in de analyse zowel de volledige tabel alsook de marginaal tabel zien. De aanpassing van alle marginale en partiële associatie-modellen kan worden geëvalueerd. Voor de selectie van het sterkste model, bevat STATISTICA een intelligente procedure voor automatische model selectie. De criteria voor goodness of fit kan worden aangegeven door de gebruiker. De 2D en 3D grafische opties zijn ontworpen voor het visualiseren van twee- en meerdimensionale frequentie tabellen.

omhoog

 Tijdreeksen

Tijdreeksen bevatten beschrijvende methoden, modellering, analyse en prognose zowel in de tijd als in frequentie-bereik. Al deze procedures zijn geïntegreerd; dat wil zeggen dat de resultaten van een analyse direct in de volgende analyse te gebruiken is. Daarnaast staan flexibele opties voor de grafische weergave van een of meerdere tijdreeksen beschikbaar. Meerdere rijen, bijvoorbeeld uit verschillende analyse stadia, kunnen worden beheerd waarbij de tijdreeksen zijn te bekijken en vergelijkingen gemaakt kunnen worden. STATISTICA volgt automatisch opeenvolgende analyses en houdt een logboek bij van veranderingen en resultaten. Informatie over de veranderingen wordt opgeslagen in lange variabele labels, zodat bij het opslaan van nieuw gecreëerde variabelen de historie behouden blijft.

Transformaties, Modellering, Plots, Auto-correlaties.  Met de beschikbare transformaties kan de gebruiker patronen in tijdreeksen onderzoeken zoals de-trending, het verwijderen van auto-correlaties, voortschrijdende gemiddelden, of bewegende medianen (ongewogen en gewogen, door gebruiker gedefinieerde Daniel -, Tukey-, Hamming-, Parzen- of Bartlett-gewichten). Daarnaast wordt smoothing met behulp van bewegende medianen, eenvoudige exponentiële afvlakking, differentiatie, integratie, residu vorming, verschuiving, 4253H filtering en nog veel meer geboden. Analyse van de auto-correlatie, gedeeltelijke auto-correlatie en cross correlatie maakt hier tevens deel van uit.

ARIMA tijdreeksen met interventie analyse.  De volledige techniek van ARIMA is voorhanden. De modellen kunnen een constante bevatten en de rij kan voor het begin van de analyse aangepast worden. Deze aanpassingen worden ongedaan gemaakt nadat de ARIMA prognoses zijn berekend, zodat de standaardfouten zichtbaar worden. Maximum likelihood kwadraatsommen zijn te berekenen. De ARIMA tijdreeksen zijn zo ontworpen dat modellen met lange seizoensgebonden perioden (bv. perioden van 30 dagen) eenvoudig zijn aan te passen. Parameterschattingen behoren tot de mogelijkheden. Voorspellingen zijn te berekenen, standaardfouten worden inzichtelijk waarmee deze gegevens worden toegevoegd aan het bestand. ARIMA residuen zijn op vele manieren te onderzoeken en te visualiseren. Ook interventie-analyses behoren tot de mogelijkheden. Verschillende, gelijktijdig optredende interventies zijn te modelleren, als één-, twee- parametrisch of als tijdelijke interventies. Voor de bestudering van het effect kunnen de grafieken worden ingezet. Voorspellingen zijn te berekenen voor alle interventie-modellen, die vervolgens grafisch zijn weer te geven.

Exponentiele afvlakking met en zonder seizoenscomponent.  Alle 12 (gebruikelijke) modellen voor exponentiële afvlakking zijn inzetbaar. Voor de modellen valt een additief of multiplicatief seizoensgebonden (en/of lineaire, exponentiele en/of gedempte trend) te specificeren. Het Holt-Winter-Model valt hierbij ook goed te gebruiken. De gebruiker kan de startwaarde van de exponentiële reeks, trend en seizoenscomponent specificeren. Bovendien kan gestart worden met een raster zoekopdracht om de optimale smoothing parameter te bepalen. De tabellen met de zoekresultaten bevatten de gemiddelde fout, de gemiddelde absolute fout, de som van de kwadraten van de fout, mean square error, de gemiddelde procentuele fout en de gemiddelde absolute procentuele fout. De kleinste waarde van de indices wordt gemarkeerd in de tabel met de resultaten. Ook is er een automatische zoekfunctie en een optimalisatie functie beschikbaar. De resultaten van resp. de exponentiële afvlakking, de residuen en het vereiste aantal prognosen, zijn gereed voor verdere analyse en plotting. Een samenvattend plot bepaald de toereikendheid van elk model, terwijl de residuen worden afgezet tegen de rechter y-as.

Klassieke Seizoensopruiming (Census I-Methode).  De gebruiker kan de lengte van de seizoensgeboden periode bepalen en een keuze maken tussen het additief of multiplicatieve seizoens-model. STATISTICA berekent de voortschrijdende gemiddelden, verhoudingen of verschillen, de seizoensgebonden factoren, de seizoensgecorrigeerde reeks, de afgevlakte trend-cyclus en de onregelmatige componenten. Deze componenten zijn beschikbaar voor verdere analyse, om zo via histogrammen en plots de toereikendheid van het model te bepalen.

X11-Seizoenscorrectie (Census II-Methode).  Deze seizoenscorrectie procedure voor de maanden en kwartalen is origineel afkomstig van het US Bureau voor de Statistiek (Census) en omvat een aangepaste X11 versie. De dialogen en opties zijn gebaseerd op de definities en gemaakte afspraken. De gebruiker kan hierbij ook factoren aangeven voor werkdagen en seizoensinvloeden. Standaard opties zijn de evaluatie van extreme waarnemingen, de berekening van seizoensgebonden factoren alsook de trend cycle component. Verschillende typen voortschrijdende gemiddelden zijn ook automatisch te selecteren.

Polynomial Distributed Lags Analyse.  De implementatie van de Distributed Lags methodiek in Tijdreeksen schat modellen met onbeperkte lags (tijdverschoven waarden) alsook modellen met beperkte Lags volgens Almon. Voor het onderzoek naar de verdeling van de variabelen van het model staan diverse grafieken ter beschikking.

Spectrale analyse (Fourier-Analyse) en Kruis-spectrum analyse.  Deze methode is speciaal ontwikkeld voor ongewoon lange tijdreeksen met meer dan 250.000 waarnemingen. Anderzijds zijn er echter geen strikte voorwaarden gesteld aan de lengte van de reeks. De gebruiker kan kiezen voor padding (het toevoegen van nullen op het einde) of het inkorten van de serie. De voor de analyses uit te voeren standaard transformaties omvatten tapering, oftewel in mindering brengen op de gemiddelde waarde en de-trending. Eenvoudige spectraal analyses omvatten frequentie resultaten, perioden, sinus- en cosinus coëfficienten en spectraal dichtheids-schattingen. Deze schattingen zijn te verkrijgen op basis van voorafgestelde data-velden ((Daniell, Hamming, Bartlett, Tukey, Parzen). Voor zeer lange rijen is dit een nuttige optie. Deze optie zorgt ervoor dat alleen een door de gebruiker gedefinieerde data set wordt weergegeven in aflopende volgorde. Grote pieken of spectrale dichtheden zijn dan in lange tijdreeksen makkelijker te herkennen. De gebruiker kan de Kolmogorov test uitvoeren om te bepalen of de waarden exponentieel zijn verdeeld. Voor een lange tijdreeks periode kan het gewenst zijn de spectrale dichtheid te tonen zodat de resolutie wordt verhoogd. Bij de Kruis-spectrum analyse worden de resultaten van een spectrum analyse voor iedere afzonderlijke kruisrij (reële en imaginaire), co-spectrale dichtheid, kwadratuur spectrum, cross-amplitude, gain-waarden en fase spectrum berekend. Al deze statistieken kunnen worden uitgezet tegen de frequentie, periode, log-periode, hetzij voor alle perioden of alleen voor een aangepaste periode. Een aantal van de grootste waarden kunnen worden gepresenteerd in een overzichtstabel in aflopende volgorde. De resultaten zijn beschikbaar voor verdere analyse met andere methoden van bijvoorbeeld tijdsreeksanalyse.

Methode van voorspellen (op regressiebasis).  Deze methode is gebaseerd op regressie (inclusief regressie van oorsprong, niet-lineaire regressie en interactieve what-if prognose).

omhoog

 Structural Equation Modeling (SEM) en PATH-analyses (SEPATH™)

STATISTICA omvat uitgebreide modelleringen voor Monte Carlo analyse die op een flexibele wijze zijn opgebouwd tot SEPATH. De module SEPATH is een "state-of-the-art" programma met een intelligente gebruikersinterface. Het biedt een uitgebreide selectie van modellen en procedures waarbij het zelfs mogelijk is het gebruik van een syntax te vermijden bij de meest complexe modellen. Met behulp van een editor valt de analyse te vereenvoudigen. In tegenstelling tot andere programma's voor structuurvergelijking is het beheersen van een programmeertaal niet vereist. Volledige functionaliteit van SEPATH wordt geboden met vele geavanceerde procedures. STATISTICA kan matrices van correlaties, covarianties en momenten (gestructureerde middelwaarde, modellen met konstanten) analyseren. Alle modellen (ook complexe) kunnen met behulp van een analyse wizard gespecificeerd worden. SEPATH berekent met behulp van optimalisatie-methoden de standaardfout voor gestandaardiseerde modellen en voor modellen die zijn aangepast aan de correlatie matrices. De resultaten omvatten een uitgebreide set van diagnostische statistieken, die dateren uit recente onderzoek op het gebied van structural equation modeling. De gebruiker kan modellen van meerdere groepen aanpassen, waarbij voor iedere groep vaste, vrije of beperkende parameters gespecificeerd kunnen worden. De documentatie van SEPATH bevat talrijke gedetailleerde beschrijvingen van literatuur voorbeelden over confirmatieve factoranalyse, pathway-analyse, congeneric tests en longitudinale factoranalyse.

Monte Carlo (SEPATH).  SEPATH bevat krachtige functionaliteit om Monte Carlo analyses uit te voeren. De gebruiker kan data van voorgedefinieerde modellen gebruiken, die op de normale of scheve verdeling zijn gebaseerd. Er kunnen Bootstrap schattingen worden berekend alsook verdelingen voor verschillende diagnostische statistieken worden toegepast op basis van Monte Carlo analyses. Daarnaast zijn veel grafische opties beschikbaar om de resultaten te visualiseren.
 
 
 

omhoog

 General Linear Models (GLM)

GLM analyseert effecten van categorische of continu onafhankelijke variabelen op één of meer continue afhankelijke variabelen. GLM is zeer geavanceerd en heeft brede toepassingsmogelijkheden. Het bevat vele opties, grafieken en diagnostische tools. GLM biedt mogelijke oplossingen voor controversiële problemen. Alle standaard resultaten worden met GLM berekend, met inbegrip van ANOVA tabellen met univariate en multivariate tests en beschrijvende statistiek. GLM levert resultaten en grafieken die meestal niet beschikbaar zijn in andere programma's. Daarnaast is GLM een eenvoudige methode om lineaire combinaties uit te testen, mogelijke fouten te achterhalen en herhaalde metingen en interacties te testen. Verdere informatie over GLM  US-Link.

 Generalized Linear/non-linear Models (GLZ)

GLZ wordt toegepast om lineaire en niet-lineaire relaties tussen variabelen op te sporen en het effect van een categorische- of continu voorspellende variabele te identificeren. Onder de specifieke toepassingen van GLZ behoren de binomiale en de multinomiale logit regressie, de probit regressie en signaaldetectie modellen. GLZ zal statistieken berekenen voor alle standaard resultaten die overeenkomen met likelihood tests, Wald en scoringstests etc. De gebruikers interface en de ontwerp processen komen overeen met GLM, ARM en pai. De gebruiker kan eenvoudig ANOVA of ANCOVA achtige modellen specificeren. Nieuwkomers hoeven dan ook geen moeilijkheden te verwachten bij de toepassing van GLZ. Er is een uitgebreide tool selectie beschikbaar voor model checking, diagnose van afwijkend gedrag, Pearson residuen, Chi-kwadraat etc. Verdere informatie over GLZ  US-Link.

 Algemene Regressie modellen (GRM)

ARM biedt gebruikers een uiterst flexibele wijze om resultaten in een algemeen lineair model weer te geven. Ook stapsgewijze regressie en modelontwikkeling van continue en categorische voorspellende waarden lenen zich uitstekend voor de GRM techniek. Ook is ARM als geen ander in staat de analyse beperkingen bij modellen met continue voorspellende waarden op te heffen. Daarnaast biedt ARM ook veel opties voor Pareto parameterschattingen, logistische regressie, partiële en semi-partiële correlatie etc. Verdere informatie over GRM  US-Link.

 Partial Least Square Models (PLS)

Pai biedt algoritmes voor univariate en multivariate partiële kleinste kwadraat vraagstukken. Pai berekent resultaten voor alle gangbare pai analyses. Er zijn vele mogelijkheden voor grafische opties; opties die gewoonlijk niet in andere modellen zijn te vinden. Als voorbeeld dienen de twee-dimensionale Plots voor alle output statistieken. Aangezien pai een overeenkomstige gebruikers interface kent als GLM, ARM en GLZ kan de functionaliteit op eenvoudige wijze worden geactiveerd. Zelfs beginners kunnen ermee omgaan. Pai is ook geschikt voor data mining, vooral wanneer er sprake is van de combinatie van klein aantal dimensies/groot aantal predictors. De afgelopen jaren is pai erg populair geworden, diverse algoritmes zijn nog in ontwikkeling. Verdere informatie over PLS  US-Link.

omhoog



Modelgroep Exploratieve Technieken

De modelgroep Exploratieve Technieken reikt van Cluster-analyse tot en met discriminantie-analyse. Deze modelgroep bevat veel interactieve visualisatie tools voor patroon herkenning alsook geïntegreerde Visual Basic scripting. De modelgroep Exploratieve technieken omvat de volgende methoden:


 Cluster-analyse

Alle methoden van clustering zijn hierbij inbegrepen (k-Means, hiërarchisch, 2-voudig agglomerend). STATISTICA kan zowel omgaan met gegevens- als met afstandsmatrices, zoals correlaties. De gebruiker kan situaties, variabelen of beiden baseren op een groot aantal afstandsmaten (Euklidisch, kwadraat Euklidisch, City-block (Manhattan), Chebychev, Power-Afstanden, Percentage niet overeenstemmend, en 1-Pearsons r). Als fusie-regels staan enkelvoudige Linkage, complete Linkage, gewogen en ongewogen groepsgemiddelde, Ward methodiek alsook andere technieken ter beschikking. Het opslaan van afstandsmatrices is mogelijk voor verdere analyse. Bij de k-Means methodiek heeft de gebruiker de volledige controle over het eerste cluster. Hier kunnen ontwerpen van extreme grootte worden verwerkt. De hiërarchische methode kan omgaan met matrices van 1000 variabelen of 1 miljoen afstanden. In aanvulling op de resultaten van een cluster-analyse zijn additionele beschrijvende statistieken beschikbaar. De grafische mogelijkheden omvatten boom diagrammen, matrix plots, grafische voorstelling van fusie protocollen, plots van de gemiddelde waarde voor de k-Means methode etc

 Factor-analyse

Factor-analyse wordt aangevuld met een aantal diagnostische statistieken en een breed scala aan verkennende grafieken. STATISTICA voert principale componenten analyse, de gewone en de hiërarchische factor analyse door tot 300 variabelen. Meer gedetailleerde modellen zijn uit te voeren met de SEPATH methodiek.
 
 
 

 PCA en Classificatie-analyse

PCA en Classificatie analyse omvat de eigen waarden (normaal, cumulatief, relatief), factor ladingen en factor waarden die aan de bestanden kunnen worden toegevoegd (grafisch als symbool en interactief gehercodeerd). Hier zijn de meer technische statistieken en indicatoren bij inbegrepen. Voor rotatie methoden zijn Varimax, Equimax, Quartimax, Biquartmax rotaties beschikbaar. De factorruimte kan geplot worden met behulp van 2D of 3D puntgrafieken gelabelled met variabele punten. Andere geïntegreerde grafieken zijn screening plots, diverse scatterplots, staafdiagrammen en lijn plots. Nadat een factoroplossing is gevonden kan de gebruiker de correlatie-matrix opnieuw berekenen om de goodness of fit van het model te kunnen bepalen. Zowel de individuele gegevens als de correlatie matrices kunnen dienen als input voor deze methode. Confirmatieve factor-analyse en daarmee samenhangende analyse kan worden gebruikt met behulp van SEPATH. Stap voor stap wordt de gebruiker door het proces geleid.

omhoog

 Canonische-analyse

Deze analyse biedt een nuttige aanvulling op ANCOVA/MANCOVA en discriminantie-analyse. Hierbij kunnen zowel individuele gegevens alsook correlatie-matrices worden verwerkt. Alle statistieken van de canonische correlatie-analyse, zoals eigenwaarden, eigen vectoren, redundantie coëfficienten, canonische gewichten, belasting, gewonnen afwijking, significante tests worden bij de resultaten betrokken. De scores van de canonische variabelen kunnen worden berekend voor elke situatie (toegevoegd aan het data-bestand en geïllustreerd met iconplots). Geïntegreerde graphics zijn inbegrepen (percelen van eigenwaarden, canonische correlaties, scatterplots etc.). Voor confirmatieve analyse tussen latente variabelen is SEPATH meer geschikt. Geavanceerde methoden voor progressief voorspellende variabelen voor MANOVA/MANCOVA ontwerpen lenen zich goed voor Algemene Regressie Modellen (GRM).

 Betrouwbaarheids- en Item-Analyse

Voor de opzet en evaluatie van vragenlijsten dient de Betrouwbaarheids- en Item-Analyse. Ook hier kunnen uitgebreide toepassingen van STATISTICA worden geanalyseerd. De gebruiker kan de betrouwbaarheid van statistieken berekenen voor alle items van een schaal, subsets interactief selecteren of vergelijkingen maken van de subsets (via split-half of split-part). In een enkele run kan de gebruiker zowel de betrouwbaarheid van het totaal als van de subschalen beoordelen. Zodra items worden geëlimineerd, wordt direct de nieuwe betrouwbaarheid berekend, zonder dat het bestand opnieuw moet worden gelezen. Het resultaat bestaat uit correlatie matrices en beschrijvende statistieken voor de items (Cronbachs Alpha, gestandaardiseerde Alpha, Inter-Item correlatie, de complete ANOVA schaal-tabel, de volledige set van item statistieken, de split-half betrouwbaarheid en de correlatie tussen de twee lijsten). Een serie van grafieken, waaronder diverse geïntegreerde scatterplots, histogrammen en lijn percelen en een selectie van interactieve what-if regels ondersteunen de ontwikkeling van schalen. Op deze wijze kan de gebruiker de verwachte betrouwbaarheid berekenen, indien een aantal items aan de schaal wordt toegevoegd. Nu kan het aantal benodigde items voor een betrouwbaar resultaat worden vastgesteld. De gebruiker kan ook de vertraging van de (gecorrigeerde) correlatie schatting met de huidige schaal en een extern criterium bepalen.

omhoog

 Classificatie- en Regressiebomen

De meest actuele algoritmes worden toegepast voor het ontwikkelen en testen van de robuustheid van classificatie-bomen. Een classificatie-boom voorspelt de verbondenheid van een object uit de waarde van de voorspellende variabelen. (Voor meer geavanceerde methodes voor classificatie-bomen, flexibele opties voor modelontwikkeling, interactieve tools voor patroon herkenning, classificatie- en regressie Tree Models (GTrees™) en (Chi-square Automatic Interaction Detection) CHAID verwijzen wij de gebruiker naar STATISTICA Data Miner. Classificatie-bomen zijn te maken op basis van categorische of ordinale voorspellende variabelen. Hierbij kunnen zowel univariate als multivariate splits ingezet worden. De analyse opties zijn een allesomvattende split (zoals THAID en CART), op discriminatie gebaseerde split, unbiased selectie van variabelen (zoals in QUEST), directe stop regels (zoals bij FACT), of bottom-up bepalen, zoals in CART. Voor de prestaties kan misclassificatie, gegeneraliseerde chi-kwadraat, G-Kwadraat of Gini Index geschikt zijn. De gebruiker kan bovendien de v-waarde tijdens boom ontwikkeling, de v-waarde voor de fout inschatting, de grootte van de SE-Regel, de minimale knooppunt grootte, de beginwaarde van de random nummer generatie en alfa waarden voor de selectie van variabelen opgeven. Ter ondersteuning van de analyse zijn er geïntegreerde grafische opties beschikbaar

omhoog

 Correspondentie-analyse

Deze methodiek is in staat om eenvoudige en meervoudige correspondentie-analyse uit te voeren. Als input accepteert STATISTICA code variabelen voor de berekening van kruistabellen. Ook zijn data bestanden mogelijk met frequenties en coderings-variabelen. Bij een correspondentie analyse kan het Burt model worden gekozen. STATISTICA berekent de verschillende tabellen: rij percentages, kolom percentages, totaal percentages, verwachte waarden, standaarddeviaties en ook de chi-kwadraat waarde. De statistiek kan grafisch worden weergegeven in 3D histogrammen en met behulp van een animatiefilm worden bekeken. De correspondentie-analyse berekent de eigen waarden en eigen vectoren en levert diagnostische statistiek van de vertraging in elke dimensie. Het aantal dimensies valt handmatig te selecteren ook kan er een cut-off waarde voor het maximale percentage worden vastgelegd. STATISTICA berekent de gestandaardiseerde waarde van de coördinaten voor elke rij en kolom. Er is een keuze te maken tussen: Profielen, Kolommen, Rij- en kolom profielen en canonisch. Voor elke dimensie en elke rij of kolom berekent STATISTICA de vertraging, kwaliteit en cosinus waarde. U kunt ook de matrices in de resultaattabellen bekijken. Zoals bij alle andere resultaattabellen kan nu STATISTICA Visual Basic opgestart worden om bijvoorbeeld een niet standaard methode voor de berekening van coördinaten te ontwikkelen. U kunt de waarden en de bijbehorende statistiek laten berekenen en de resultaten met de reguliere rij en met de kolom vergelijken. Extra invoer kan worden verwerkt in een multiple correspondentie analyse. In aanvulling op 3D histogrammen, die berekend worden voor alle tabellen is ook het opzetten van een 1D, 2D en 3D grafiek mogelijk. Rij en kolom punten kunnen ook worden gecombineerd tot een enkel beeld, samen met eventuele extra punten. Elk item heeft een andere kleur en markering, zodat verschillende soorten punten in de plots makkelijk zijn te herkennen. Alle punten krijgen labels. Hiertoe is een optie beschikbaar.

 Multidimensionale schaalbaarheid

Bij Multidimensionale schaalbaarheid zijn matrices van overeenkomsten, verschillen of correlaties tot en met 9 dimensies te analyseren. De start configuratie kan door de gebruiker worden bepaald of kan via de Classificatie-Analyse worden ingegeven. De software maakt gebruik van een iteratieve methode voor het minimaliseren van de onzekerheid en het berekenen van de stress waarde. De gebruiker kan het iteratieve proces overzien en de veranderingen in de waarden bekijken. De resultaten worden weergegeven in overzichtelijke 2D en 3D scatterplots. De stress waarde (raw F) en Kruskals stress coefficient S zijn hierbij inzichtelijk. De goodness of fit is te beoordelen met Shepard diagrammen (d-d en d-ster). Zoals gebruikelijk zal STATISTICA de laatste configuratie opslaan.

omhoog

 Discriminantie-analyse

Deze methode omvat meerdere stapsgewijze invullingen en bevat ook de methode ADM, Algemene Modellen voor Discriminantie-Analyse aanvullend op ANOVA/ANCOVA overeenkomstige modellen. STATISTICA voert voorwaartse/achterwaartse (stapsgewijze) analyse uit voor blokken van variabelen. Naast de vele grafieken en in te stellen parameters biedt STATISTICA een brede keuze voor de classificatie voor oude en nieuwe situaties, zodat het ideale model goed valt te ontwikkelen. De mogelijkheden bestaan uit: Wilks' Lambdas, partiële Lambdas, F-voor opname/uitsluiting, de p-Niveaus, de tolerantie-waarde en R-kwadraat. STATISTICA draagt zorg voor een volledige canonische analyse en levert de waarden, de cumulatieve waarden voor alle roots en hun p-niveaus, de coëfficienten van de gestandaardiseerde en niet gestandaardiseerde discriminantie functies, de matrix van de structurele coëfficienten, de gemiddelde waarde van de discriminant en de waarden van discriminant functies (scores) voor elke situatie. De uitkomsten worden automatisch aan het data-bestand toegevoegd. De geïntegreerde grafieken omvatten histogrammen van de scores binnen een groep en voor alle groepen gezamenlijk. Speciale scatterplots tonen de groepsverbondenheid van individuele situaties. Te denken valt aan: Box-Whisker-Plots, Verdelingsplots etc. Ook worden de classificatiefuncties voor iedere groep berekend. Voor de classificatie kan gekozen worden uit: de Mahalanobis-afstanden, de Posteriori-waarschijnlijkheid of de werkelijke classificatie. De scores van iedere individuele situatie kan met iconplots en meerdimensionale grafieken bekeken worden. De resultaten worden meteen in de tabellen geïntegreerd, zodat up-to-date analyses zijn uit te voeren. Ook kan de classificatie matrix worden aangevraagd. De gebruiker heeft meerdere opties om de a-prior waarschijnlijkheden te specificeren. Verdere keuze selecties zijn te maken om gekozen situaties in te sluiten/uit te sluiten.

 Algemene modellen voor Discriminantie-Analyse (GDA)

Dit betreft een toepassing en uitbreiding van het algemene lineaire model waarbij zich classificatie problemen voordoen. Net zoals bij de discriminant-analyse dient GDA toegepast te worden voor standaard en stapsgewijze analyse. GDA implementeert discriminantie-analyse als een speciale situatie ten opzichte van GLM, General Linear Models. Op deze wijze biedt het uiterst nuttige analysemethoden die innovatief, efficiënt en zeer krachtig zijn. De specificatie van een categorisch afhankelijke variabele is toegestaan. Ten behoeve van de analyse wordt de groepsverbondenheid gecodeerd met een indicator variabele, zodat alle technieken mogelijk zijn. In de resultaten van GDA zijn diverse residualstatistieken van GRM en GLM voorhanden. GDA biedt krachtige en efficiënte tools voor toegepast onderzoek en data mining. ADM berekent standaard resultaten voor discriminant analyse, de canonische analyse, classificatie statistieken (inclusief Mahalanobis afstanden, huidige classificatie bij analyse en validerings monsters, misclassificatie matrix etc.). Voor verdere informatie over GDA, zie hier  US-Link.

omhoog



Modelgroep Poweranalyse

StatSoft heeft op basis van bewezen technologie functionaliteit toegevoegd voor efficiënte planning en analyse van onderzoek. De modelgroep Poweranalyse ondersteunt de gebruiker bij de planning van een steekproefomvang. Het biedt ook diverse hulpmiddelen om alle Power aspecten rondom statistische tests en bij de berekening van steekproeven te adresseren.

Poweranalyse omvat de volgende thema's:

Berekening van steekproefomvang:  Poweranalyse berekent steekproefomvang als functie van een zgn. Type 1 fout en berekent de effectsterkte in diverse statistische tests (bijvoorbeeld: 1- en 2-sample tests, contrasten, ANOVA, chi-kwadraat, F-test of rank test).

Schatting van betrouwbaarheidsintervallen:  In de statistiek heeft dit onderwerp recent veel aandacht gekregen, zowel in de planning als in de interpretatie. STATISTICA kan worden gebruikt voor een groot aantal belangrijke statistische variabelen (bijvoorbeeld gestandaardiseerde effectgrootte van de variantie, correlatie coëfficienten of verschillen tussen steekproefverhoudingen) om de betrouwbaarheidsintervallen te berekenen. De geschatte waarden kunnen op hun beurt worden gebruikt voor de berekening van de steekproefomvang in latere studies.

Berekening van statistische verdelingen:  In aanvulling op de reeds beschikbare verdelingen binnen STATISTICA biedt Poweranalyse speciale opties voor de kwaliteit van de berekening (niet-centraal t, F en Chi-kwadraat, Binomial, exacte verdeling van correlatie coëfficienten etc.).

Poweranalyse maakt het de gebruiker mogelijk de optimale steekproef omvang te bepalen. Het voorkomt onnauwkeurige bevindingen die te wijten zijn aan kleine aantallen, verspillingen en beperkte middelen. De kwaliteit van de onderzoeksresultaten kan hiermee verder worden verbeterd. Gedetaillieerde informatie over Poweranalyse treft u hier aan hier  US-Link.

Geïnteresseerd?


Ga de uitdaging aan met intelligentie op je werkplek.
Neem contact op voor een nadere kennismaking!

home omhoog