现在很多厂商都说自己的产品是大数据分析软件。如果只是根据功能去区分这些产品,的确是件难事,因为很多工具具有相似的特征和功能。此外,有些工具的差异是非常细微的。

怎么挑选最适合的大数据分析软件?(怎么挑选最适合的大数据分析软件公司)  大数据 分析 软件 第1张

现在许多厂商都说自己的产品是大数据剖析软件。假如仅仅依据功用去差异这些产品,的确是件难事,由于许多东西具有类似的特征和功用。此外,有些东西的差异是十分纤细的。所以,要害差异要素或许仍是要依据企业的才能以及在数据剖析方面的老练度,要点考虑如安在易用性、算法杂乱性和价格之间寻觅平衡。

咱们将在本文对九个干流大数据剖析软件厂商的产品进行比照,即Alteryx、 IBM、KNIME.com、 Microsoft、 Oracle、 RapidMiner、SAP、 SAS 和 Teradata,其间有的厂商供给的东西不止一个。这些厂商别离代表着大数据剖析商场的不同方面。咱们将结合之前文章中说到的特色,对这些产品进行比照,看这些产品是怎么满意企业用户的事务需求。

剖析师的专业知识和技能。有些东西的方针受众是新手用户,有的是专业数据剖析师,有的则是针对这两种受众规划的。

像IBM SPSS Modeler、RapidMiner东西、Oracle Advanced Analytics、SAP Predictive Analytics主动剖析版别这些产品,一般针对的人群是没有或只要一点计算学或数据剖析布景的用户。用户对数据进行剖析、开发剖析模型和规划剖析作业流,根本不需求编程。每个厂商都把中心剖析组件深藏在直观的用户界面下,引导剖析师进行数据预备、剖析、模型规划和验证等剖析进程,可是他们选用的办法或许有所不同,尤其是把一个独立的产品(如RapidMiner)和一个套件产品(如Oracle产品)的一部分进行比照时,尤为不同。

像IBM SPSS Statistics、KNIME Analytics Platform、SAP Predictive Analytics专家剖析模块、微软Revolution Analytics和Teradata Aster Discovery Platform这些东西,供给的功用杂乱程度远远超乎专家级用户的预期。Oracle 针对Hadoop的R高档剖析法(ORAAH)是Oracle大数据软件衔接套件中的一部分,它供给了R界面,用来办理Hadoop散布式文件体系(HDFS)数据和用R语言中编写映射(mapper)和概括(reducer)功用。这种灵敏性关于更高水平的数据科学家来说更具吸引力。

Alteryx和SAS EnterpriseMiner可以依据用户专业知识的水平调整功用,首要适用于这两类用户。整体而言,在支撑更高档剖析技能和模型评分方面,以及包含神经网络、相关剖析和可视化功用等更广泛的剖析功用方面,SAS Enterprise Miner和IBM的SPSS东西愈加别出心裁。

剖析多样性。依据不同的用户事例和运用,企业用户或许需求支撑不同类型的剖析功用,运用特定类型的建模(例如回归、聚类、切割、行为建模和决策树)。这些功用现已可以广泛支撑高水平、不同办法的剖析建模,可是仍是有一些厂商投入数十年的精力,调整不同版别的算法,添加愈加高档的功用。了解哪些模型与企业面对的问题最相关,依据产品怎么最好地满意用户的事务需求进行产品评价,这些都十分重要。

越老练和高端(也相对更贵重)的东西具有的剖析广度极大。Oracle Data Miner包含了一系列闻名的机器学习办法,支撑聚类、猜测性发掘和文本发掘。IBM SPSS产品的两个版别都供给多套剖析技能和模型。SAS Enterprise Miner支撑许多算法和技能,包含决策树、时刻序列、神经网络、线性和逻辑回归、序列和网络线路剖析、购物篮剖析和衔接剖析。

新一代(有时价格更为廉价)产品支撑不同的模型,可是算法杂乱程度或许较窄。Alteryx Analytics Gallery的模型库存包含以下功用,如回归剖析、决策树、相关规矩剖析、分类和时刻序列剖析。KNIME包含文本发掘、图画发掘和时刻序列剖析的办法,也从其他开源项目(如Weka、R和JFreeChart)集成机器学习算法。

剖析多样性的另一方面是编程语言和计算东西(如R)的集成,将现有库和用户自定义功用进行集成。事实上,与R集成可以说是越来越要害的差异点。Alteryx Designer、微软Revolution Analytics、SAS Enterprise Miner、Teradata Aster Discovery Platform、Oracle ORAAH和KNIME的剖析渠道,都供给R的接口,支撑R的集成。

数据规划剖析。要剖析的数据规划触及许多方面,如结构化和非结构化信息,传统的本地数据库和数据仓库、依据云端的数据源,大数据渠道(如Hadoop)上的数据办理等。可是,不同产品对非传统数据湖(在Hadoop内或其他用于供给横向扩展的NoSQL数据办理体系内)上的数据办理供给的支撑程度纷歧。怎么挑选产品,企业有必要考虑获取和处理数据量及数据品种的特定需求。

扩展和高功用支撑。是否需求可扩展的功用,这是由企业数据量和剖析需求决议的。小型企业数据量较小,运用的产品可以不具备与可用资源扩展的功用特色,例如低端东西的入门级版别(如RapidMiner、 KNIME、 微软 Revolution R Open、Alteryx Designer),可以在桌面体系上运转,不需求额定的服务器组件。

大型企业很有或许需求剖析的数据集库存更大,用户群更广。这就提出了两个额定的要求——高功用和协作便利性。产品关于高功用构架的适应性表明具有可扩展性,大多数产品可以依据Hadoop的并行性进行适应性改动,或许选用其他可以完成更快运算的办法。

一切的这些产品或多或少可以支撑Hadoop,包含IBM SPSS Modeler和SPSS Statistics、RapidMiner的商业组件Radoop(可以将Studio前端和服务器剖析引擎衔接到存储在Hadoop上的数据)、Oracle Big Data Discovery 和ORAAH东西、KNIME的Big Data Extension 和Cluster Execution插件。Teradata Aster Discovery Platform经过Teradata的MPP构架处理高功用需求。SAP Predictive Analytics的专家剖析版别可以履行内存数据发掘,高效处理大容量数据剖析。微软R Enterprise则运用Revolution Analytics的ScaleR模块处理高功用需求,这是一个支撑平行化的大数据剖析算法的归纳库。选用SAS Enterprise Miner的评分算法也可以在Hadoop环境内布置和履行。

协作。企业规划越大,越有或许需求跨部门、在许多剖析师之间同享剖析、模型和运用。企业假如有许多剖析师散布在各部门,对成果怎么进行解说和剖析,或许会需求添加更多的同享模型和协作的办法。IBM的SPSS Modeler Gold版别供给了协作功用,RapidMiner的Server产品支撑同享和协作。Alteryx Analytics Gallery供给的机制可以与外部组织成员同享云端的高档剖析运用。KNIME供给商业扩展,支撑团队协作。SAS Enterprise Miner客户服务器构架可以经过同享模型和其他作业产品,让事务用户和数据剖析师增强协同协作。

厂商规划和产品集成。咱们可以依据厂商规划对产品进行比较。关于咱们一般所说的超级大型厂商而言,大数据剖析东西仅仅是很多产品东西中的一套产品罢了。假如你地点的企业规划很大,一般需求和厂商谈整套产品东西在整个企业规划的企业级答应,那么可以挑选像IBM、SAS、SAP或许Oracle这种超级大型厂商。

大型厂商的大数据剖析东西仅仅更大的东西生态体系中的一部分。可以假定,来自同一个超级大型厂商的产品至少已集成的,而且旨在一同运用。此外,有些人更喜爱与大型厂商打交道,是由于觉得大企业的顾客服务愈加安稳牢靠。另一方面,这样的大数据剖析东西或许只可以作为更大软件答应协议的一部分才可以购买。

规划小点的厂商,如KNIME、Alteryx和RapidMiner,收入首要来自答应授权和支撑少数大数据剖析产品。小型厂商或许可以让你更严密地与他们的产品办理和立异团队进行触摸,你或许可以影响产品路线图或改善功用的发展方向。在价格和答应协议所包含的特性方面,小型厂商或许愈加灵敏。可是,与小型厂商协作的危险也需求留意,如安稳性、用于支撑的可用资源和企业或许被收买的或许性,这些都会影响客户关系。

答应证书和保护预算。简直一切厂商的产品都分不同的版别,购买费用和整个运营本钱各不相同。IBM、Oracle、RapidMiner、Teradata和微软的产品依据不同等级区别版别,答应证书费用与特性、功用、对剖析数据的量或许产品可运用的节点数的约束成正比。KNIME和RapidMiner供给免费或开源版别,对技能支撑收费或许对企业级运用版别进行收费。相对而言,KNIME、RappidMiner和Alteryx对数量少的用户收取的答应费用较低。你假如考虑SAS和SAP的产品,需求直接找他们询价。

大数据剖析软件的商场或许让人找不到北,可是咱们期望,本系列收购攻略文章可以协助你更好地了解大数据剖析软件可以带给企业什么优点,协助你更好地差异干流大数据剖析产品和东西。

转载请说明出处
知优网 » 怎么挑选最适合的大数据分析软件?(怎么挑选最适合的大数据分析软件公司)

发表评论

您需要后才能发表评论