用SQL Server提供的函数处理XML文档

 
   | |

导读:在本文中,我们讨论了如何使用SQL Server提供的OPENROWSET函数来处理XML文档,并给出了具体步骤。

关键词:OPENROWSET T-SQL存储过程 SQL Server XML

正在加载数据...

【TechTarget中国原创】自SQL Server 2000发布以来,处理XML数据就成为了数据库管理员们经常讨论的一个话题。常见的用法是前端应用程序以入参方式传给存储过程XML文档。然而,有时你会遇到要处理一个文件夹中一组XML文件,将它们加载到数据库中并随后处理到SQL Server数据表的情况。这一点更困难,而且介绍如何来做的文档资料也很少。

  你可以在几种技术中做选择,但这些技术大部分都十分复杂。我曾用过SQL Server集成服务(SSIS),数据转换服务(DTS)和自己编写的Windows应用程序来读取和加载文件。然而,我最喜欢的技术是采用OPENROWSET函数来实现它。该函数提供了极大的灵活性,因为你可以在T-SQL存储过程中从各个角度控制整个过程。

【TechTarget中国原创】自SQL Server 2000发布以来,处理XML数据就成为了数据库管理员们经常讨论的一个话题。常见的用法是前端应用程序以入参方式传给存储过程XML文档。然而,有时你会遇到要处理一个文件夹中一组XML文件,将它们加载到数据库中并随后处理到SQL Server数据表的情况。这一点更困难,而且介绍如何来做的文档资料也很少。

  你可以在几种技术中做选择,但这些技术大部分都十分复杂。我曾用过SQL Server集成服务(SSIS),数据转换服务(DTS)和自己编写的Windows应用程序来读取和加载文件。然而,我最喜欢的技术是采用OPENROWSET函数来实现它。该函数提供了极大的灵活性,因为你可以在T-SQL存储过程中从各个角度控制整个过程。

  采用这种方法的第一步是创建一个只有一列的表,并把该列定义为XML数据类型。临时表也可以:

  CREATE TABLE #WorkingTable

  (Data XML)

  然后,你可以使用OPENROWSET函数,把数据加载到这个表中的一行:

  INSERT INTO #WorkingTable

  SELECT * FROM OPENROWSET (BULK 'D:\Temp\Sample.xml', SINGLE_BLOB) AS data

  现在,你可以把该表#WorkingTable数据列中的值放到一个变量里,然后调用OPENXML函数来解析XML文档,并根据需要使用这些XML数据。在本例中,XML文档内容非常简单,如下图:

  OPENXML函数需要从临时表中读取这些数据,示例代码如下:

  DECLARE @XML AS XML, @hDoc AS INT
  SELECT @XML = Data FROM #WorkingTable
  EXEC sp_xml_preparedocument @hDoc OUTPUT, @XML
  SELECT *
  FROM OPENXML(@hDoc, '/root/data', 1)
  WITH (Col1 VARCHAR(5) '@parm1',
  Col2 VARCHAR(5) '@parm2')
  EXEC sp_xml_removedocument @hDoc

  这段查询的输出结果如下图所示:

  这是所有OPENXML语句的基本语法。在这里,你可以给“root/data”段,“@parm1””和其他XPath表达式添加更复杂的XML内容。这样你可以处理更复杂的XML文档内容中的数据。下面就是一个XML内容更复杂一些的例子,其中列出了一些费用清单数据:

  正如你所看到的,该XML文档有三级内容,需要的数据在“Customer ID”,“Order ID”和“Item ID”三个节点中。在示例代码中,你可以看到我们从“Item ID”节点开始往回解析,从而获取到“Customer ID”和“Order ID”的值:

  DECLARE @XML AS XML, @hDoc AS INT
  SELECT @XML = Data FROM #WorkingTable
  EXEC sp_xml_preparedocument @hDoc OUTPUT, @XML
  SELECT *
  FROM OPENXML(@hDoc, '/root/Customer/Order/Item')
  WITH (CustomerId INT '../../@ID',
  OrderId INT '../@ID',
  ItemId INT '@ID',
  Qty INT '@Qty')
  EXEC sp_xml_removedocument @hDoc

  执行后,会产生如下图所示的结果集:

  如果我们使用同样的该XML文档,给第二个客户添加一个订单,我们就会看到如下图的输出内容:

  正如我前面说的,我们从XML文档内容的“Item”节点开始处理。如果我们从文档的“Customer”节点开始,并向下解析该文档,我们得到的输出就是不正确的。那样的话,我们就只能得到文档中每一个“Customer ID”的第一个“item”。

  OPENXML函数会得出不正确的结果集,如下图:

  SELECT *
  FROM OPENXML(@hDoc, '/root/Customer')
  WITH (CustomerId INT '@ID',
  OrderId INT 'Order/@ID',
  ItemId INT 'Order/Item/@ID',
  Qty INT 'Order/Item/@Qty')

  在本文中,我们讨论了使用“XPath”最简单的例子。要了解更复杂的实例,你可以参考微软官方的“XPath语法”选项,来提高使用T-SQL语句XML引擎的能力。

 
查看全文
 
 
 
 
 

SQL/T-SQL

 
SQL Server中的OPENROWSET函数提供了极大的灵活性,因为你可以在T-SQL存储过程中从各个角度来控制整个过程。
 
EXCEPT操作符的工作方式与INTERSECT操作符相反。产生的最终结果集只包含在第1个查询中返回而不在第2个查询中返回的值。
 
INTERSECT操作符的执行与UNION操作符很相象,而它们的区别是,前者不返回所有值,而只返回同时包含在操作符两边的表的值。
 
当多个查询通过一个UNION操作符进行连结时,数据库引擎默认会根据查询指定的顺序来处理查询操作。
 
SQL Server可以组合多个查询到一个语句中,以产生单个结果集。为了将查询连接在一起,我们可以使用UNION、INTERSECT或EXCEPT操作符。
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
电子邮件地址:
请输入您的电子邮件地址
密码:
下次自动登录