IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库建立,而后能够借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。html
那么使用IBM SPSS Modeler访问数据库自有算法有什么优点呢?主要是两方面:算法
1.数据库内的算法经常与数据库服务器紧密集成,这有助于提升性能。数据库
2.在“数据库内”构建和存储的模型不只由可访问数据库的应用程序共享,且更易于在这些应用程序中部署。服务器
接下来咱们以Microsoft Analytics Services为例,介绍如何配置以及使用数据库内建模功能。网络
IBM SPSS Modeler支持集成下列Analysis Services算法包括:ide
安装与配置:工具
在您的机器上,必须安装如下模块:性能
1. 配置IBM SPSS Modeler:优化
在IBM SPSS Modeler中,在菜单栏的工具-->选项-->帮助应用程序,选择Microsoft面板,以下图:htm
勾上以后,会在下面的面板节点上多了一项数据库建模,列出了Microsoft Analysis Services支持的数据库内建模算法,以下图:
2. 配置 SQL Server
该配置可实如今数据库内进行评分。
在 SQL Server 主机上建立如下注册表键:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP
为该键添加以下 DWORD 键值:
AllowInProcess 1
完成上述更改后,从新启动SQL Server。
3. 配置Microsoft Analysis Services
创建IBM SPSS Modeler 与Microsoft Analysis Services 进行通讯。
经过MS SQL Server Management Studio 登陆到分析服务器。
访问“属性”对话框,右键单击服务器名称,而后选择属性。
选中显示高级(全部)属性复选框。
更改如下属性:
将 DataMining\AllowAdHocOpenRowsetQueries 的值更改成 True(缺省值为False)。
将 DataMining\AllowProvidersInOpenRowset 的值更改成 [all] (完好省值)。
4. 为SQL Server 建立 ODBC DSN
经过使用 Microsoft SQL Native Client ODBC 驱动程序,建立一个指向数据挖掘过程当中使用的 SQL Server 数据库的 ODBC DSN。余下的驱动程序设置应使用缺省设置。
对于此DSN,请确保选中了使用集成的 Windows 认证。
5. 启用 SQL 生成和优化
从IBM SPSS Modeler菜单中选择:工具—>流属性—>选项—>优化面板,勾选上全部选项内容以下图:
使用Microsoft Analysis Services 算法生成模型
以上内容配置完成后,便可使用数据库内的算法生成模型。以下图:
源节点从SQL Server数据库中读取,终端节点又写回到SQL Server数据库中,中间使用的是Microsoft的决策树算法,整个计算过程都在数据库中实现。
介绍到这里,咱们就了解了,如何使用数据库内算法进行建模的过程,常常会有朋友问说,使用这里的决策树算法和使用IBM SPSS Modeler封装好的决策树算法,结果会有什么不一样?预测结果固然是会有差别的了。自己决策树算法就包含多种,像C&R、CHAID、C5.0、QUEST等,每一个算法计算逻辑就不同,所以计算获得的结果天然也不同,前面咱们已经介绍过C&R、CHAID、C5.0这三种算法,他们核心的差别就是选择最佳分组变量和分割点的标准,而Microsoft Analysis Services决策树是使用线性回归来肯定决策树分割位置,它能够用于分类属性和连续属性的预测建模。那么到底选择什么算法为优呢,前面已经介绍了,使用数据库内建模的好处,你们能够综合考虑,结合实际场景和数据预测结果的评估再作选择。