Automatisierung
Salford Predictive Modeler
Der SPM® 8 umfasst über 70 vordefinierte Szenarios (im Grunde Experimente), die darauf basieren, wie führende Modellanalytiker ihre Arbeit strukturieren. Wir bezeichnen diese als „Automatisierungen“. Diese „Automatisierungen“ oder Experimente erstellen automatisch mehrere Modelle, sodass der Analytiker verschiedene Möglichkeiten sofort erkennen kann.
Beispiel 1: Anwendungen im Bankbereich
Automate Shaving
Mit Automate Shaving können Teilmengen von informativen Daten in großen Datensätzen mit korrelierenden Variablen innerhalb der Kontodaten identifiziert werden. Mit einer Automatisierung können Sie eine erhebliche Modellreduktion mit wenigen (oder gar keinen) Einschränkungen bei der Modellgenauigkeit erreichen. Beginnen Sie z. B. mit der vollständigen Liste von Variablen, und führen Sie ein automatisiertes Shaving vom Anfang der Liste aus, mit dem Variablen eliminiert werden, die in der Lernstichprobe vielversprechend aussehen, aber nicht generalisiert werden können. Später können Sie das Shaving vom Ende der Liste ausführen, um automatisch einen Großteil der redundanten und unnötigen Prädiktoren zu eliminieren. Fahren Sie dann mit dem „Shaving-Fehler“ fort, um schnell die informativste Teilgruppe von Merkmalen zu ermitteln.
Im Gegensatz zu herkömmlichen Data Mining-Werkzeugen bietet Automate Shaving mehr als nur eine Liste der Variablenwichtigkeiten. Der Analytiker erhält außerdem eine Reihe von Teilgruppen/Variationen der Variablenwichtigkeiten, mit denen er schnell die endgültige Variablenliste optimieren und festlegen kann. So entfallen ständig wiederholte Tests. Bei der professionellen Modellierung wird normalerweise viel Zeit und Aufwand darauf verwendet, die Liste der Variablenwichtigkeiten zu optimieren. Mit Automate Shaving wird dieser Vorgang automatisiert.
Beispiel 2: Betrugserkennung
Automate Priors
In typischen Betrugserkennungsanwendungen muss der Analytiker verschiedene Sätze von Regeln identifizieren, die zu verschiedenen Betrugswahrscheinlichkeiten führen. Entscheidungsbäume und die Gradient Boosting-Technologie in TreeNet® werden normalerweise eingesetzt, um Klassifizierungsregeln zur Betrugserkennung zu erstellen. Klassifikationsbäume werden auf der Grundlage eines bestimmten, vom Benutzer bereitgestellten Satzes mit A-priori-Wahrscheinlichkeiten konstruiert.
Mit einem Satz von A-priori-Wahrscheinlichkeiten wird erzwungen, dass die Bäume nach Regeln mit hohen Betrugswerten suchen, während andere Sätze zu Bäumen mit weniger strengen Annahmen führen. Um optimal von baumbasierten Regelsuchansätzen profitieren zu können, probieren Analytiker eine große Anzahl von verschiedenen Konfigurationen für A-priori-Wahrscheinlichkeiten aus. Dieser Prozess wird in „Automate Priors“ komplett automatisiert. Dies führt zu einer großen Sammlung von Regeln, die von Betrugssegmenten mit extrem hoher Sicherheit und geringem Umfang bis hin zu Betrugssegmenten mit mittlerer Sicherheit und großem Umfang reichen. Sie können z. B. kleine Segmente mit 100 % Betrugswahrscheinlichkeit oder ein großes Segment mit einer geringeren Betrugswahrscheinlichkeit oder eine beliebige Zwischenstufe ermitteln.
Beispiel 3: Marktforschung – Umfragen
Automate MVI (Indikatoren für fehlende Werte)
In vielen Umfragen kommt es vor, dass ein Großteil der Informationen fehlt. Häufig können oder wollen die Teilnehmer eine Frage nicht beantworten. Neben den bewährten Verfahren von Salford Systems beim Umgang mit fehlenden Werten ermöglicht eine neue Automatisierungsfunktion den Analytikern, automatisch mehrere Modelle zu generieren, z. B. folgende: 1) ein Modell, das die Antwort nur auf der Grundlage des Musters der fehlenden Werte prognostiziert, 2) ein Modell, das automatisch Dummy-Indikatoren für fehlende Werte zusätzlich zu den ursprünglichen Prädiktoren erstellt und/oder 3) ein Modell auf der Grundlage einer modulspezifischen internen Behandlung von fehlenden Werten.
Beispiel 4: Anwendung im Ingenieurbereich
Automate Target
In modernen Ingenieursanwendungen kann im Rahmen der Versuchsplanung eine große Sammlung von Stichprobenpunkten unter unterschiedlichen Betriebsbedingungen erfasst werden. Dabei kann es schwierig sein, verschiedene gegenseitige Abhängigkeiten zwischen den unterschiedlichen Parametern zu ermitteln. Temperaturen können z. B. klar voneinander abhängig sein, oder es könnte sich um unbekannte Funktionen anderer Betriebsbedingungen wie Druck und/oder Drehzahl handeln. Automate Target bietet Ihnen leistungsstarke Funktionen zum automatischen Untersuchen und Extrahieren aller gegenseitigen Abhängigkeiten zwischen Prädiktoren. „Abhängigkeiten“ bezeichnet hierbei eine potenziell nichtlineare multivariate Beziehung, die weit über die einfache herkömmliche Korrelationen hinausgeht. Darüber hinaus bietet diese Automate-Funktion als Nebeneffekt allgemeine Möglichkeiten zur Imputation von fehlenden Werten, was besonders für die Modellierungsmodule sehr hilfreich ist, in denen fehlende Werte nicht direkt behandelt werden.
Beispiel 5: Internetwerbung
Automate Sample
Bei der Platzierung von Onlinewerbung muss zwischen der genutzten Datenmenge und der Zeit, die zum Erstellen des Modells benötigt wird, abgewogen werden. Für die Onlinewerbung können praktisch unbegrenzt große Datenmengen vorliegen. Auch wenn im Idealfall alle Daten einbezogen werden sollten, gibt es in der Praxis immer eine Grenze, wie viele Daten in der Echtzeitbereitstellung genutzt werden können. Mit Automate Sample können Analytiker automatisch die Auswirkungen des Lernstichprobenumfangs auf die Modellgenauigkeit untersuchen. Sie könnten z. B. feststellen, dass die Verwendung von 200.000.000 Transaktionen in Bezug auf die Modellgenauigkeit keine weiteren Vorteile gegenüber 100.000.000 Transaktionen hat.
Beispiel 6: Anwendung im Microarray-Bereich
Automate TARGETSHUFFLE
Microarray-Untersuchungsdatensätze werden durch eine extrem hohe Anzahl von Prädiktoren (Genen) und eine sehr eingeschränkte Anzahl von Datensätzen (Patienten) charakterisiert. Dies führt zu einer großen Mehrdeutigkeit, da auch eine zufällige Teilmenge von Prädiktoren ein augenscheinlich gutes Modell ergeben kann. Mit Automate TARGETSHUFFLE können Sie bestimmen, ob die Leistung des Modells so genau ist, wie es scheint. Automate TARGETSHUFFLE erstellt automatisch eine große Anzahl von Hilfsmodellen auf der Grundlage von zufällig gemischten Zielvariablen. Indem die tatsächliche Modellleistung mit der Referenzverteilung verglichen wird (keine Abhängigkeitsmodelle), kann eine abschließende Entscheidung zur Modellleistung getroffen werden. Durch diese Technologie könnten einige der gerade veröffentlichten Arbeiten zur Microarray-Forschung in Frage gestellt werden. Wenn ein Datensatz mit einer bewusst zerstörten Zielabhängigkeit zu einem Modell mit einer guten Genauigkeit führen kann, ist es zweifelhaft, sich auf das ursprüngliche Modell zu verlassen.
UNSER UNTERNEHMEN
Minitab unterstützt Unternehmen dabei, durch intelligente Datenanalysen die Effizienz zu steigern und die Qualität zu verbessern.
Salford Predictive Modeler® 8
Die integrierte Softwaresuite für das maschinelle Lernen von Minitab
CART®
Bei dem CART®-Modellierungsmodul des SPM handelt es sich um einen ultimativen Klassifikationsbaum, mit dem das Feld der komplexen Analysen revolutioniert und das heutige Zeitalter der Datenwissenschaft eingeläutet wurde.
Random Forests®
Das Random Forests®-Modellierungsmodul nutzt die Leistungsstärke von verschiedenen alternativen Analysen, Zufallsstrategien und Ensemble Learning.
MARS®
Das MARS®-Modellierungsmodul ist ideal für Benutzer, die Ergebnisse in einer Form bevorzugen, die der herkömmlichen Regression ähnelt, während gleichzeitig wesentliche Abweichungen von der Linearität und Wechselwirkungen erfasst werden.
TreeNet®
TreeNet® Gradient Boosting ist das flexibelste und leistungsstärkste Data Mining-Werkzeug des SPM und liefert durchgängig extrem genaue Modelle.
Preise
Wenden Sie sich an uns, um Informationen zu Preisen zu erhalten.
Programm für Universitäten
Unser Programm für Universitäten umfasst die Modellierungsmodule SPM®, CART®, MARS®, TreeNet® und Random Forests® und bietet deutlich reduzierte Lizenzierungsgebühren für Bildungseinrichtungen.
Automatisierung
Über 70 vordefinierte Szenarios (im Grunde Experimente), die darauf basieren, wie führende Modellanalytiker ihre Arbeit strukturieren.