日前, Gartner 发布了 2019 年版面向数据科学与机器学习工具的魔力象限。Gartner 的魔力象限是在某一特定时间内对市场情况进行的图形化描述,根据 Gartner 的定义,它描述了 Gartner 依据标准对该市场内的厂商所进行的分析。

Gartner 表明,现在用于数据科学的东西正在敏捷发生改变。该公司在其新的数据科学和机器学习渠道的陈述中称,咱们正处于 “大爆炸” 中。 Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第1张

日前, Gartner 发布了 2019 年版面向数据科学与机器学习东西的法力象限。Gartner 的法力象限是在某一特定时间内对商场状况进行的图形化描绘,依据 Gartner 的界说,它描绘了 Gartner 依据规范对该商场内的厂商所进行的剖析。Datanami 的 Alex Woodie 为咱们解读了 2019 年版面向数据科学和机器学习东西的法力象限。

Gartner 表明,现在用于数据科学的东西正在敏捷发生改变。该公司在其新的数据科学和机器学习渠道的陈述中称,咱们正处于 “大爆炸” 中。

1 月 28 日,Gartner 发布了《数据科学和机器学习渠道法力象限》(Magic Quadrant for Data Science and Machine Learning Platforms),并表明:“数据科学和机器学习商场是健康、活泼的,很多供货商供给了一系列产品。这个商场正在阅历一场‘大爆炸’,这场‘大爆炸’不只从头界说了应由谁来做数据科学和机器学习,还从头定了数据科学和机器学习应怎么完成。”

剖析师小组将数据科学渠道界说为归纳场所,在这里,数据科学家、民间数据科学家和开发人员不只可以得到构建数据科学运用所需的一切中心功用,还可以将它们嵌入到现有业务流程和办理中,并对其进行办理和保护。

数据科学和机器学习渠道有必要满意低要求,并包含以下东西:

♦ 提取和预备数据;

♦ 以交互方法探究和可视化数据;

♦ 工程数据特征和构建猜测模型;

♦ 与周围根底设施集成,测验并布置这些模型。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第2张

Gartner 数据科学与机器学习渠道法力象限(图:Gartner)

Gartner 以为,整合和凝聚力是要害,假如运用程序(尤其是开源产品)仅仅简略地将各种包和库绑缚起来,那么这样的产品并不能视为真实的渠道。

虽然这些中心要求为数据科学和机器学习渠道奠定了根底,但不同的供货商在怎么完成这些需求上存在着很大的差异。Gartner 指出,专业数据科学家或许更喜爱用 Python 或 R 编写代码,而其别人更喜爱数据科学笔记本的易用性,如 Jupyter。还有一些不太懂技能的人更喜爱用鼠标在界面上点击,由于对他们来说这样很直观。

领导者象限

在领导者象限中,Gartner 列入了四家供货商,包含:KNIME、RapidMiner、TIBCO Software、SAS。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第3张

在 Gartner 的评价中,KNIME 独占鳌头,这归功于客户的大力支撑、广泛的产品组合以及商场上 “最平衡的” 愿景之一。苏黎世公司的产品系列(包含开源 KNIME Analytics 产品和商业 KNIME Server 产品)被誉为剖析范畴的 “瑞士军刀”。对深度学习、中级用户供给的的易用性以及与其他包集成的高档功用的支撑受到了称誉,可是,功用和可扩展性被视为缺陷,以及对物联网的吸引力也很有限。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第4张

Rapid Miner 也是独占鳌头,这得益于它在易用性和支撑杂乱数据科学才能之间的平衡。这款软件支撑深度学习技能并布置到 GPU,Gartner 好像很喜爱 Rapid Miner 为机器学习布置供给更高的透明度。它与开源东西的整合有利于数据科学家。首要重视点是数据预备和可视化、答应和定价、模型操作。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第5张

TIBCO 从挑战者象限中迈出了一大步,购买了一系列剖析范畴的企业,包含 Jaspersoft、Spotfire、Statistica 和 Alpine Data,并将它们整合到一致的渠道中。Gartner 很赏识 TIBCO 的这一点:供给端到端作业流程集成以及物联网功用,尤其是流式剖析的整合。它潜在的问题包含功用和稳定性、数据办理及操作方面的问题。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第6张

SAS 是这份名单上的多年竞争者。实际上它有多个经过评价的渠道。它的 Enterprise Miner 产品在一系列目标中供给了强壮牢靠的功用,而可视化数据发掘与机器学习(Visual Data Mining and Machine Learning,VDMML)在数据预备和扩大方面得分很高。很高的客户满意度和强壮的商场占有率稳固了 SAS 的方位。但 Gartner 也指出了 SAS 存在的一些缺陷,特别是在定价和产品一致性方面,SAS EM 的用户体会并没有到达大众的预期,并且 SAS 的开源方法对 Gartner 来说是个问号。

挑战者象限

挑战者象限适当空荡,在这一象限中只要两家供货商: Alteryx 和 Dataiku。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第7张

Alteryx 经过坚持其 “履行才能”(Y 轴),但却失去了一些 “视觉完好性”(X 轴)。Gartner 在端到端管道中提及了加州 Irvin 公司的民间数据科学才能,剖析师小组表明,虽然 Alteryx 有这种才能,但商场以为 Alteryx 仅仅一种数据预备东西,这一观念掩盖了它真实的价值。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第8张

Dataiku 的数据科学作业室(Data Science Studio,DSS)因其促进不同利益相关者(从数据工程师到科学家)之间协作的方法而取得好评。Gartner 还喜爱它为机器学习作业流程带来的主动化,以及模型投产后的办理和监控。陈述称,Dataiku 存在的一些问题包含可扩展性、定价以及对流式剖析和物联网用例的支撑。

有远见者象限

有远见者象限如此拥挤不堪,只要不到七家新的供货商在这一象限里抢夺方位。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第9张

Databricks 于 2 月 5 日取得了 2.5 亿美元的风投。Databricks 对整个剖析生命周期的支撑、对混合云战略的支撑以及支撑各种用户的才能,给 Gartner 留下了深入的形象。用户对依据 Spark 的产品给予了高度评价,据 Gartner 称,文档是 Databricks 的加分项之一。可是,定价、合同商洽及监督、办理和毛病扫除与调试的潜在问题都是 Databricks 的潜在缺陷。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第10张

Gartner 表明,这是 DataRobot 在有远见者象限中初度露脸,这要归功于它 “为增强数据科学和机器学习设定了规范”,客户因而有了强壮的体会,这有助于公司在已有忠诚客户群上取得吸引力。出售履行、定价、可扩展性问题以及 “增强剖析” 空间或许的商品化都是一起重视的问题。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第11张

H2O.ai 在 2 月 5 日召开了 H2O 国际大会,由于商场竞争剧烈,以及客户对其才能的一些忧虑。但,其中心开源机器学习组件的功用依然是 H2O.ai 的强项,它依据 GPU 的深度学习和无人驾驶人工智能的主动机器学习才能令 Gartner 形象深入。可是,关于非开发人员来说,学习曲线过于峻峭,并且短少办理才能,数据拜访和数据预备的才能也短缺,这些都是令人忧虑的问题。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第12张

据 Gartner 的说法,Mathworks 在满意以财物为中心的职业客户的需求方面有着 “惊人的力气”(该公司在制造商和工程安排中有着多年的经历)。因而,MathWorks 从挑战者象限向有远见者象限迈出了巨大的一步。它供给的 MATLAB 因其 “民间工程师” 才能而广受赞誉,而实时流媒体、深度学习和仿真的集成数据预备和支撑,给人们留下了深入的形象。Dings 很难被非工程师运用,并且不支撑 Google Cloud Platform,短少主动机器学习才能也是其晦气因素。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第13张

Microsoft 凭仗依据云端的产品取得了不错的成果,包含 Azure Machine Learning、Azure Data Factory、Azure HDInsight、Power BI。Microsoft 与第三方协作的方法,尤其是 Databricks 的 Spark 产品,对各种数据人物(包含入门级的机器学习爱好者)的支撑也是一个加分项。机器学习过程中的主动化是一个问题,一切不同东西的一致性也是如此。短少本地化才能也约束了它的适用性。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第14张

虽然 IBM 在 2019 年依然留在有远见者象限,但它现已失去了优势。IBM Watson Studio 产品的全面性得到了 Gartner 的称誉,该产品为专家和民间数据科学家供给服务。将 SPSS 建模器集成到 Watson Studio 中也得到了称誉。可是,IBM 重塑产品和改变战略的频率是 Gartner 重视的问题,由于取得完好的端到端功用还需求多个产品的答应授权。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第15张

Google 在数据科学和机器学习渠道排名方面体现适当不错,很大程度上这要归功于 Google 的云端上广泛的可用东西。它的中心数据科学渠道包含 Cloud ML Engine、Cloud AutoML、TensorFlow 和 BigQuery ML。可是 Google 也供给了共同的硬件,包含 Tensor 处理单元(Tensor Processing Unit,TPU)、Kaggle 众包以及一系列其他产品。对 Google 来说,可扩展性和速度是 Google 的优势。可是,这些东西之间短少端到端的一致性是个问题,并且也短少可用性。别的,短少本地化产品也是个问题。

特定范畴者象限

特定范畴者象限有四家供货商。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第16张

SAP 的 Predictive Analytics(PA)产品与 HANA 严密集成,使其合适 SAP HANA 客户。处理大型 HANA 数据集和江模型布置到 SAP 运用的才能是强项。SAP 对一致机器学习架构的愿景也是如此,它与 Leonardo 机器学习基金会相关。可是,产品的一致性、不断改变的人工智能战略以及客户体会,都是对这家德国巨子晦气的标志。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第17张

Domino Data Lab 从有远见者象限降级,这首要反映了其感知履行才能的下降。Gartner 很赏识 Domino 的产品战略,尤其是它专心于协作和构建端到端解决方案。它与开源和专有产品的整合才能是额定的优势,它的可扩展性也是如此。可是,依据 Gartner 的查询,Domino 侧重于专家数据科学家,这让民间数据科学家感到不满,并且它还短少一些数据预备、主动化和增强功用。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第18张

Anaconda 依然归于特定范畴者类别。Anaconda 产品的首要优势在于它可以触摸开源 Python 社区,该社区持续推进数据科学的立异。它扩展开源 Python 的才能也是个优势。可是依据 Gartner 的说法,成功运用 Anaconda 渠道所需的专业知识是一个警示,Python “森林” 的杂乱性也是一个问题。对开源社区的依靠也使客户在需求某些特定内容时处于下风(Gartner 运用了模型操作化的示例),全体的一致性水平也是缺陷之一。

Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代  工具 性能 数据 第19张

Datawatch 是法力象限的新成员,于 2018 年 1 月收买了 Angoss,Angoss 在该范畴具有超越 20 年的经历。Datawatch 产品的一致性和易用性得到了 Gartner 的称誉,其文本剖析和优化引擎组件被标记为高于平均水平。客户支撑也是一个加分项,但,数据预备才能的短少,以及产品的整体远景和收买带来的不确定性拉低了 Datawatch 的成果。

原文链接:

https://www.datanami.com/2019/02/08/the-big-bang-of-data-science-and-ml-tools/

转载请说明出处
知优网 » Gartner陈述:正处于数据科学与机器学习东西 “大爆炸”的年代

发表评论

您需要后才能发表评论