使用Oracle数据挖掘API方法详解(二)

 
   | |

导读:本文介绍了Oracle支持两种兼容的API以访问数据库中的数据挖掘功能。一种是PL/SQL API,另一种为Java API。

关键词:Oracle PL/SQL Java API Oracle数据挖掘API

正在加载数据...

  数据挖掘API

  Oracle支持两种兼容的API以访问数据库中的数据挖掘功能。第一种是PL/SQL API,其中包括DBMS_DATA_MINING程序包,另一种也是Java API,称为Oracle数据挖掘Java API。因为J Cells目前最适合访问Java API,所以需要以可直接从Java对其进行访问的方式打包PL/SQL API。两个主要的 Oracle 数据挖掘概念是设置和模型。设置概念基本围绕带有两列(setting_name和setting_value)的设置表构建;其中 setting_name 是挖掘算法使用的属性名,而 setting_value 是与该属性相对应的值。

  DBMS_DATA_MINING程序包包含若干过程,包括CREATE_MODEL和APPLY。CREATE_MODEL过程根据设置表(作为过程的参数之一提供)中的值为给定挖掘函数和数据集创建挖掘模型。该过程简单且易于使用。实际上,由用户来为要创建的模型、要使用的挖掘函数、包含要使用的数据的表、要建模的列以及设置表提供名称。这一方法的优点在于所有不同算法都可以类似的方法调用。每种算法的微调都整合至设置表中,但在很多情况下,各种设置系数可由算法本身自动决定。设置表中条目的复杂性根据用户的专业技术背景和算法而有所不同。许多专业用户可能希望手动设置所有可能的系数,而我们中的多数人更可能乐意系统自动给出适用设置。Oracle提供了一个要用作设置键的常量列表,以及命名为常量或数字间隔的值。

  表 1:algo_name(算法名)设置键的值

  algo_name(算法名)设置键的值

  Oracle的算法名 (algo_name) 键的常量值如上所示。对于其中的每一个值,使用了可能键和值的不同集等。以下(图 2)显示了向导函数是如何将这些键映射到树结构,并允许用户通过操纵该设置树定义设置表的。

  作为Oracle数据库中创建的挖掘模型,DBMS_DATA_MINING.APPLY过程用于将该模型应用到新数据集。而且,这是一个易于使用的过程,要求只输入挖掘模型名、包含新数据集的表名、用于识别新数据集中行的列以及结果数据集名。Java类OracleMiningModel (below)在调用预测、评分或 apply方法时,都会利用该APPLY过程。此外,DBMS_DATA_MINING程序包包含若干根据类型将各个模型详细信息作为结果集或以XML格式返回的函数。这些细节函数也可通过使用OracleMiningModel类的实例(代表数据库中的不同模型)进行访问。

  此处可通过创建一个称为 OracleModelSettings的Java类以Java打包(PL/SQL)设置概念,该类具有灵活的构造函数和各种签名,包括


public OracleModelSettings ( String modelSettingsName,
    Connection databaseConnection, 
    String[] keyToValueStringMap) 
  throws SQLException

 
  keyToValueStringMap 只是表单“ -> ”的字符串数组。该数组详细说明了设置表的行,以及负责在数据库中维护设置表的类。

  类似地,此处也可通过创建一个称为OracleMiningModel的Java类以Java打包模型概念,该类具有构造函数和各种签名,包括


public OracleMiningModel ( String modelName,
   OracleModelSettings oms,
   String[] keyToValueStringMap) 
   boolean recreate)
  throws SQLException

  此处使用keyToValueMappings数组来确定在Oracle数据库中创建数据挖掘模型所需的算法以及其他命名属性。该类的用途就是创建和维护数据挖掘模型。此外,OracleMiningModel 类还定义了用于检索以及将该模型应用到新数据集的方法。这些方法包括以下各项,此处只显示了一小部分。


public OracleResultSet infoAprioriAssociationRules(int topn)
public OracleResultSet infoAprioriFrequentItemsets(int topn)
public OracleResultSet infoAdaptiveBayesNetwork()
public OracleResultSet infoAIMinimumDescLength()
public OracleResultSet infoKMeans()
public OracleResultSet infoNaiveBayes()
public OracleResultSet infoNonnegativeMatrixFactorization()
public OracleResultSet infoOCluster()
public OracleResultSet infoSupportVectorMachines()
public XMLType infoDecisionTree()
public Object getPrediction(String[] signature, double[] doubleVal)
public HashMap score(String[] signature, double[] doubleVal)
public OracleResultSet apply( String dataTable, 
    String caseID, 
    String resultTable, 
    String schema, 
    boolean overwrite)

  除了具有上述签名外,所有的方法可能都会引发SQL意外。一旦可以从两个简单类来管理数据挖掘功能后,就可调用该电子表格平台来访问任何可用的数据挖掘算法,以在 Oracle数据库中建模数据集。


使用Oracle数据挖掘API方法详解
 使用Oracle数据挖掘API方法详解(一)
 使用Oracle数据挖掘API方法详解(二)
 使用Oracle数据挖掘API方法详解(三)

原文出处:http://tech.ddvip.com/2009-01/1232158193106115_2.html
 
来源:豆豆网    
 
 
 
 
 

Oracle数据与应用集成

 
Oracle的收购策略在2010年伊始又有了一个梦幻般的开始,就在昨天,他们宣布收购数据质量管理软件厂商Silver Creek Systems。
 
在OpenWorld大会上,Oracle的管理层再次强调他们将为企业用户提供更加紧密的整合产品,为用户减轻负担。
 
Oracle计划在今年十月的OpenWorld 2009大会上展出最新的Primavera项目组合管理软件,他们对项目管理软件市场虎视眈眈。
 
如果过去的半年没有了Oracle,IT市场将变得黯淡无光。在过去的六个月中,Oracle完成了里程碑式的收购;发布了融合中间件产品;公司的高级管理层也发生了变动。
 
根据公司7月份的软件价目表,Oracle悄无声息地在数据库企业管理软件包上涨价40%,许多专家都针对涨价策略提出了自己的看法。

热门技术手册排行

 

在本次的技术手册中,我们为您提供了PL/SQL的基础知识以及专家指导,包括了PL/SQL中的数据类型简介、PL/SQL函数与触发器以及PL/SQL中的存储过程等,相信您无论是高手还是菜鸟都可以获得有帮助的信息。

 

本系列文章由三部分组成,为Oracle数据库管理员(DBA)面试成功的必备手册。本专题内容囊括从DBA最初的面试开始,从写“杀手简历”到求职信、到面试过程到Oracle认证再到上升到公司高层最后到你成为公司里的明星DBA。专家为你一一指点迷津,最终让你登上成功的宝座。

 

要成为一名DBA,你需要具备哪些素质?DBA的薪酬待遇如何?DBA的职业道路究竟可以走向何方?我们将在本次的技术手册中为您一一解答。

 

在本次技术手册中,我们将对SQL Server存储过程的调试进行详细的介绍,包括了基础的调试方法和在调试过程中出现的T-SQL性能问题和解决方法。

 

本技术专题主要围绕sql server设计这个话题展开,侧重介绍了sql server集簇索引的设计、如何创建sql server索引、如何优化索引、索引的能与不能、处理sql server 2000索引碎片技巧以及维护sql server索引以实现查询优化等等。

查看更多
 
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
电子邮件地址:
请输入您的电子邮件地址
密码:
下次自动登录