企业应慎重选择一款大数据设备,以便确保其对于企业业务的价值。

  企业应稳重挑选一款大数据设备,以便保证其关于企业事务的价值。

为您企业找到适宜的大数据设备(为您企业找到适宜的大数据设备和产品)  企业 设备 大数据 第1张

  好像挑选一款单一的、优化架构的办法来处理大数据是有必定含义的。

  一款专门由硬件和软件组合所树立起来的设备明显应该要比手艺胡乱凑集起来的设备要好许多,不是吗?

  上述这一逻辑已然在数据办理人员的圈子中得到了广泛的认同。

  例如,甲骨文现已收买了Exadata公司,并创建了一款被称为甲骨文大数据设备的体系。该结合了Sun的硬件与各种不同的软件办法,以便在一款设备中处理不同类型的数据。

  而IBM公司在收买了Netezza公司之后,也采纳了相似的办法,创建了一套被称为PureData的设备。

  别的,戴尔和惠普也都有推出一系列的大数据运用设备;Teradata公司收买了Aster公司,并随后推出了其集成的大数据渠道;日立数据体系具有超级横向扩大渠道(Hyper Scale-Out Platform,HSP);而EMC公司则推出了其数据核算设备;存储专家DataDirect Networks公司有其被命名为SFA12K的大数据设备。

  企业可以有许多不同的办法来进行大数据剖析——自行构建办法,并将大数据作为服务仅仅一对常用的组合,但这些办法都充满了问题,而供货商正在尽力帮助您企业防止。关于企业对大数据的运用而言,选用一款大数据设备的办法好像正风行一时,但大数据设备的挑选是否真的好像其看上去那么简略呢?

  要深化发掘,首要就要充沛了解究竟什么是大数据。

  关于大数据的五大特性

  往往在太大都时分,大数据依然仅被重视到了其巨大的数据信息量。但是,假如是这样的话,那么这应该仅仅一个很多数据的问题,而不是大数据;巨大的数据量仅仅大数据的五大特征之一。

  想要充沛了解大数据所带来的问题,就有必要了解大数据的其他几个方面的特性,以及由这几大特性归纳效果所为大数据国际发明的问题和供给的相关机会。

  如前所述,有海量的数据被处理。但是,假如全部这些被处理的数据都是正式的、结构化的数据,那么,具有恰当的横向扩展核算、存储和网络渠道的规范数据库应该是满足的。

  当您看到数据品种的多样性时,这些问题才真实开端突显,混合了结构化数据和非结构化数据的数据调集亟待进行处理。大大都的数据具有必定的层次结构,不管其承载的载体是否是一个微软Word文档的格局;或是以逗号分隔的机器对机器的数据;或是图画,视频或音频数据。然后是数据的传输速度的特性,这一特性这有2个方面。首要是数据被呈现给剖析环境的速度。例如,实时数据剖析处理物联网的数据,往往需求处理很多小数据包的数据,没有人可以推迟来使其减缓。其次是剖析得出成果的速度。

  例如,在金融交易中,与其他交易员比较,下流的交易员得到成果往往要略微晚几毫秒的时刻。而在出产线上,关于某个问题的辨认往往需求在其成为一个问题之前采纳举动,这样才可以使得出产线得以继续运营,而不是停掉整条出产线来进行处理。大数据的准确性这一特性也很重要。糟糕的数据剖析往往会导致质量很差的输出。

  因而,任何大数据体系有必要可以检查其所剖析的数据的质量,或许上游的数据源是可以值得信赖的。***的一大特性是大数据的价值。其实,这一点才是真实驱动企业进行任何大数据活动项意图推进要素。其应该在大数据的五大特性中被排在***位。进行大数据剖析的决议方案有必要树立在其价值之上,然后使得企业得出相应成果:这种剖析是否真的是值得的?

  其关于企业事务活动及其成功的真实影响在何处?在某些情况下,Quocirca公司现已看到了大数据剖析所带来的一些发展,由于这“好像的确是个好主意”——但在为何要运用这种IT资源的背面有必要要有厚实的商业理由。因而,任何向您企业吹捧一款大数据体系的供货商,都有必要有相应的信息来针对您企业大数据的每种特性。因而,将各个方面的数据都归入联系数据库中,不逼迫结构化数据作为二进制大目标不应是处理大数据的办法。

  相同,那些在象牙塔中声称联系型数据库的日子现已完毕了,全部全部数据都可以归入一款继续的Hadoop存储或NoSQL数据库的说法也是过错的。但是,针对专业的不同数据体系采纳一种断开衔接的办法也将无法见效。例如,对数据减缩非耐久的Hadoop体系选用MapReduce,别离联系和非联系的耐久性存储将导致无法处理大数据速率的要求。

  单一的剖析办法

  关于真实的大数据剖析,大数据的五大特性需求加以处理,而数据以一种单一的办法会聚,实践可以进行事务剖析。这便是设备的办法发挥其效果的时分了。经过凭借Hadoop环境,并将其在同一台设备中与联系型和非联系型数据存储进行混合,智能化可内置于整个体系,以保证恰当的数据在恰当的时刻驻留在适宜的存储中。所需的剖析层可以优化,以保证功能是契合剖析意图。这是一个全部相关供货商都在为之战役的一个战场。

  但是,仍有人以为购买一个大的数据设备需求留意的范畴。关于大大都安排而言,大数据将触及很多的数据。为了供给所需的剖析速度,大数据设备中的大大都将有很多的内存,使内存剖析产生。因而,保证设备有满足的内存是收购大数据设备所需考虑的一大要害。该设备将需求扩展,太小的内存将导致数据体系的交给将比预期的慢,然后数据就会在低速存储体系中进出。检查设备是否是朴实旋转的,根据磁力盘额。跟着固态存储器的呈现,从磁盘检索数据的速度已大幅添加,但仍远低于存储体系。运用固态存储器的体系比运用磁盘的速度快得多。此外,要留意混合体系,其是顶部层的固态和较低层的磁盘存储的一个混合。除非有一个智能的软件办理随时驻留在此的数据,当剖析体系企图从内存中获取数据看到数据不在那里,然后下降到固态,发现数据不存在,并下降到磁盘,并将数据从那里归入到内存时,有或许是首要的功能问题。

  展望未来

  现在需求寻求将Hadoop,NoSQL与联系型数据库聚集到一同的体系的办法。但是,也可以展望未来。很长一段时刻,Quocirca主张不要运用Hadoop作为一个耐久性存储,而不是取决于其MapReduce的才能,作为数据过滤器,来下降在任何环境所需剖析的数据量。

  MapR公司是Apache Drill项意图领军,而Hortonworks则推出了其Hive Stinger方案,两大项目均显现了在在Hadoop存储中启用SQL查询的许诺。比如IBM和Actian公司这样的供货商,有商业化的Hadoop-SQL产品,可以处理一些现在Hadoop作为一个耐久性存储的速度问题。在NoSQL终端的数据存储,Basho公司则采纳一种不同的办法。经过启用其Riak NoSQL数据库节点的网格,每个节点处理大数据的不同方面,他们期望可以发明出“全部规矩的其间一环”:一个可以针对不同数据类型的改变速度处理数据压缩的数据库。

  ***,寻觅不会将您捆绑在特定工作办法的体系。运用现有的商业智能(BI)体系的技术现已树立,而无需学习新的技术,大数据体系的挑选应该可以使现有的BI东西可以分层。现在,大数据剖析仍处于相对不成熟的水平。企业自行打造的办法不太或许可以供给出资回报率,而一款专业的大数据设备则或许仅仅在短时刻内处理了某个问题。因而,企业应慎重挑选一款大数据设备,保证该项事务的价值足以补偿您企业的该项开销。

转载请说明出处
知优网 » 为您企业找到适宜的大数据设备(为您企业找到适宜的大数据设备和产品)

发表评论

您需要后才能发表评论