自动化

Salford Predictive Modeler

SPM® 8 附带了 70 多个预打包的方案,这些基本上都是受领先模型分析人员构造他们的建模作品的启发而得到的试验方案。我们称之为“自动化方案”。这些“自动化方案”或试验可以自动创建多个模型,以便分析人员可以查看所做的各种选择。

 

示例 1:银行应用

Automate Shaving

Automate Shaving 有助于确定大型数据集内那些在帐户数据内含有相关变量的信息性数据子集。使用自动化,可以毫不费力或者非常轻松地完成重大模型缩减,以便对准确度进行建模。例如,从一个完整的变量列表开始,从顶部运行自动化剃除,以便去除那些在学习样本上看上去突出但无法广义化的变量。之后,您可以从底部运行剃除,以便自动去除大量冗余的、不必要的预测变量。接着,您可以看到“剃除错误”,这样就能快速瞄准信息性最强的功能子集。

与典型的数据挖掘工具不同,Automate Shaving 不只是提供典型的变量重要性列表。它还为分析人员提供了一整套变量重要性子集/变异,让分析人员可以快速优化/选择最终变量列表,而不必花费精力进行反复检验。专业建模人员通常投入了大量时间和精力来优化变量重要性列表,而现在 Automate Shaving 可以自动执行此过程。

 

示例 2:欺诈检测

Automate Priors

在典型的欺诈检测应用中,分析人员非常关注如何确定会导致不同欺诈概率的不同规则集。决策树和 TreeNet® 梯度推进技术通常用于构建用来检测欺诈的分类规则。它们会基于用户提供的一组特定的先验概率构造任何分类树。

一组先验将强制树搜索具有高欺诈水平的规则,而另一组先验将生成假设有点松散的树。为了充分利用基于树的规则搜索方法,分析人员会尝试大量不同的先验概率配置。而该过程可以在 Automate Priors 中完全自动执行。得到的结果是一个大型规则集,涵盖了从只能提供较少支持的极高置信欺诈分段到提供广泛支持的中等置信欺诈分段的整个范围。例如,可以确定欺诈率为 100% 的小分段,也可以查找欺诈概率较小的大分段,以及介于大分段和小分段之间的任何内容。

 

示例 3:市场研究 - 调查

Automate MVI(缺失值指示符)

在任何调查中,都可能会缺失很大一部分信息。通常,记者不回答问题的原因要么是他们不知道,要么是他们无法回答。除了 Salford Systems 在处理缺失值方面的专业性外,还新增了一个自动化功能,让分析人员可以自动生成多个包括以下内容的模型:1) 仅基于缺失值模式的模型预测响应;2) 自动创建虚拟缺失值指示符以及原始预测变量集的模型;3) 依赖引擎特定的缺失值内部处理的模型。

 

示例 4:工程应用

Automate Target


在现代工程应用中,作为试验设计的一部分,会在各种操作条件下收集大型抽样点集合。确定不同参数之间的相互依赖性可能具有很大的挑战性。例如,多个温度可以完全相互依赖,或者可以是其他操作条件(如压力和/或分辨率)的某些未知函数。Automate Target 为您提供了可自动探索和提取预测变量之间相互依赖性的强大方法。这里的“依赖性”是指可能非线性的多变量关系,可能超出了传统的简单关联。此外,Automate Target 还有一个强大的附带作用,那就是它提供了一些常规的缺失值插补方法,这对于那些不直接处理缺失值的建模引擎非常有用。

 

示例 5:Web 广告

Automate Sample

对于在线广告投放应用,用户必须平衡所用数据与完成模型构建所需时间之间的关系。在 Web 广告领域,数据量几乎是无限的。因此,虽然您希望使用所有可用的数据,但总会需要针对实际部署中可以使用的数据量实施一定的限制。Automate Sample 可以帮助分析人员自动探索学习样本数量对模型准确度的影响。例如,您可能发现,使用 200,000,000 个事务与使用 100,000,000 个事务相比,对提高模型准确度没什么作用。
 

示例 6:微阵列应用

Automate TARGETSHUFFLE

微阵列研究数据集的特征为:预测变量(基因)数量巨大;记录数(患者)极其有限。这会产生极大的歧义,因为即使随机的预测变量子集也可能会产生看上去似乎不错的模型。Automate TARGETSHUFFLE 可以帮助您确定模型功能是否像看上去那么准确。Automate TARGETSHUFFLE 将自动基于随机抽取的目标变量构造出大量辅助模型。通过对比实际模型性能与参考分布(非依赖模型),即可对模型性能做出最终判断。此技术可能会对微阵列研究领域中当前已发表的部分论文产生质疑。如果包含特意损坏的目标依赖项的数据集可以为您提供高准确度的模型,则依赖原始模型会变得非常可疑。

我们的工作

Minitab 产品通过智能数据分析 帮助企业提高效率并改进质量。

Salford Predictive Modeler® 8
Minitab 的机器学习软件集成套件

Cart Logo

CART®

SPM 的 CART® 建模引擎是绝佳的分类树,为高级分析领域带来创新,开启了崭新的数据科学时代。

Random Forest Logo

Random Forests®

Random Forests® 是一个建模引擎,充分利用了多个备选分析、随机化策略和集成学习的功效。

Mars Logo

MARS®

The MARS® 是一个建模引擎,充分利用了多个备选分析、随机化策略和集成学习的功效。

Treenet Logo

TreeNet®

TreeNet® 梯度推进是 SPM 中一款最灵活、最强大的数据挖掘工具,能够按照统一的方式生成非常准确的模型。

Pricing Icon

定价

有关定价信息,请联系我们。

University Icon

大学计划

我们的大学计划旨在以显著降低的许可费用向教育社区提供 SPM®、CART®、MARS®、TreeNet® 和 Random Forests® 建模引擎。

Automation Icon

自动化

预打包了 70 多种方案,这些基本上都是受领先模型分析人员构造他们的建模作品的启发而得到的试验方案。