SQL Server 机器学习在运营数据领域“火力全开”

日期:2017-3-20作者:Mike Matchett

【TechTarget中国原创】

人工智能是IT领域的一个热门话题,微软正在致力于实现SQL Server与机器学习工具的整合,以方便用户更好进行运营数据管道分析

当今最热门的趋势之一,就是使用人工智能和机器学习技术来增强传统业务应用。可能下一代数据中心应用平台将会支持的实时联机事务处理分析功能。为什么不把这个利器应用到业务上,实现更为精准的商业洞察呢?

但是,修改运行在生产环境的程序代码,添加机器学习算法的优化将是一项艰巨的工作。大多数IT相关人士都是不情愿的,甚至完全拒绝——将已经部署的业务应用从根本上重建,在他们看来是不能忍受的。不过,软件厂商已经推出了一些在现有应用上集成机器智能的新方法。微软就是众多供应商之一,它正致力于推动SQL Server机器学习工具与数据库软件的整合。

从基本上看,在现有商业应用上增加机器学习和商业智能,这意味着构造一个机器学习模型来识别数据中的模式、自动增加数据标签,或进行新信息的分类。这个模型还应该能够评估商业行为,对商机进行评级,或进行客户行为预测。有时,这个智能功能会公开呈现给终端用户,但有时对于终端客户来说,在这些应用程序上添加的智能功能是相对透明的。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者>更多

Mike Matchett
Mike Matchett

Mike Matchett is a senior analyst and consultant at Taneja Group.

SQL Server可用性与扩展>更多

相关推荐

技术手册>更多

  • 数据库管理系统选型指南

    理解不同类型的DBMS有哪些特点,以及再何时、何处(场景)使用它们是十分必要的。在这本电子书中,我们就将进行一个详细的介绍,希望能够为您的数据库选型起到帮助、指导作用。

  • SAP HANA实用手册

    在选择SAP HANA的时候,CIO需要关注哪些问题?在产品的选型、实施与上线阶段,都有哪些经验可以借鉴?在本次的TechTarget电子书中,我们将为您一一解读。它也将成为企业选择HANA时,最有实用价值的参考资料。

  • 电子书:如何选择NoSQL数据库

    很多企业关系自己是否应该从传统数据库转到NoSQL数据库,应该选择什么样的数据库?本书详列了相应的技巧和案例,供您参考。

  • 2013数据库工程师薪酬调查报告

    TechTarget数据库网站每两年就会进行一次“数据库工程师薪酬调查”,对不同行业、不同层次的数据库技术从业者的薪酬待遇情况进行一次摸底。

TechTarget

最新资源
  • 安全
  • 存储
  • CIO
  • SOA
  • 虚拟化
  • 服务器
【TechTarget中国原创】

人工智能是IT领域的一个热门话题,微软正在致力于实现SQL Server与机器学习工具的整合,以方便用户更好进行运营数据管道分析

当今最热门的趋势之一,就是使用人工智能和机器学习技术来增强传统业务应用。可能下一代数据中心应用平台将会支持的实时联机事务处理分析功能。为什么不把这个利器应用到业务上,实现更为精准的商业洞察呢?

但是,修改运行在生产环境的程序代码,添加机器学习算法的优化将是一项艰巨的工作。大多数IT相关人士都是不情愿的,甚至完全拒绝——将已经部署的业务应用从根本上重建,在他们看来是不能忍受的。不过,软件厂商已经推出了一些在现有应用上集成机器智能的新方法。微软就是众多供应商之一,它正致力于推动SQL Server机器学习工具与数据库软件的整合。

从基本上看,在现有商业应用上增加机器学习和商业智能,这意味着构造一个机器学习模型来识别数据中的模式、自动增加数据标签,或进行新信息的分类。这个模型还应该能够评估商业行为,对商机进行评级,或进行客户行为预测。有时,这个智能功能会公开呈现给终端用户,但有时对于终端客户来说,在这些应用程序上添加的智能功能是相对透明的。

在传统的数据科学和分析行为中,机器学习模型通常被构建、训练和运行在单独的分析系统中。应用于事务性工作流的模型需要具备一个特定的方法,这个方法需要保证它们能够正确运行在运营数据上,此外,它还需要另一个方法来支持持续的机器学习培训(例如,学习新的数据)。

用机器学习处理数据管道

在广阔的IT世界中,许多企业都热衷于无服务器计算和基于Lambda函数的云服务,在上述场景中,对数据流和事件触发的响应只需要运行很少的代码。但这在数据库世界中并不是个新颖的解决方案,因为存储过程已经存在几十年了。它有效地缩短了计算过程与数据之间的距离,这是当今大部分大数据工具的核心理念。

数据库存储过程适用于数据密集型的建模任务,如培训,但它也可以集成机器学习功能到应用程序的数据流中。这种形式的集成,让一些事务应用程序可以直接利用嵌入式智能,无需修改任何原有的应用代码。此外,在数据上应用机器学习模型,能够方便下游用户之间随时共享运营智能功能。

这些对于SQL Server用户意味着什么?从2015年收购Revolution Analytics开始,微软一直加大在R语言(一个强大的数据科学和分析环境)领域的投资。这么做的理由很充分:许多数据分析师首先学会的是使用R语言进行高级统计工作,如构建数据挖掘可视化,进行机器学习模型编程进行数据分析等。

通过SQL Server R Service,微软增加了SQL Server数据库引擎执行R语言的能力。因此,SQL Server的机器学习应用程序可以使用存储过程与R服务器紧密集成,从而让业务分析师利用R语言和其广泛的机器学习库来处理运营数据管道。

SQL Server 机器学习变的更为容易

此外,vNext更新增加了对MicrosoftML,SQL Server的机器学习库的支持,最大限度地减少了整合R模型与SQL Server数据时所需要的编码量。MicrosoftML降低了企业应用机器学习技术的门槛:它目前提供了几种类型的内置机器学习模型,微软表示,用户仅需要编写很少量的R语言代码就可以使用这些模型。这意味用户可以更有效利用这些模型,并相对独立的维护这些代码,不必与应用核心代码进行耦合。以类似的方式,新的数据事件可以触发其他预存的R代码来动态的训练和更新模型。

管理任何内嵌在数据库存储过程的代码,特别是被序列化存储的代码,是具有相当挑战性的。但在这里,微软宣称,使用SQL Server管理模型数据已经有了很多成功的先例。在这种情况下,机器学习模型变成另一种由SQL Server管理的数据对象。

例如,在一个大规模的物联网应用场景中,用户可以创建独特的预测模型,分析和预测每个连接设备的操作行为。如果有数以百万计的设备,这意味着模型管理数百万不同的模型--这是一个不小的任务,但存在着潜在的巨大运营效益。

R-based预测模型与SQL Server的集成显示了微软为下一代商业应用提供平台的决心——这些商业应用将整合事务处理与高级动态分析,以便更好的进行智能分析。有了这些SQL Server机器学习方法,任何现有的应用程序都可以很容易的集成机器学习工具。通过使用数据库存储过程,你可能不需要改变任何应用相关代码。

所有的这一切都可以运行在公共云中。微软Azure正在迅速成为云数据科学平台,云端SQL Server现在也已能够嵌入机器学习工具,Azure的用户现在可以很容易地应用先进的分析技术,优化并加速其业务流程。