几个最近被Apache擢升为顶级的大数据项目也值得您额外关注。事实上,他们中的一些所构建和发展的生态系统,很可能将对Spark 发起挑战。结合本周举行的“ApacheCon北美峰会”(ApacheCon North America conference)和“Apache大数据峰会”(Apache: Big Data events),本文将归纳那些你应该知道的Apache的大数据项目。

世界各地很多的安排,他们运用的数据现在日益巨大而杂乱,运用传统的数据处理程序已无法再进行优化剖析及取得洞悉。而这正是的新一代的大数据运用程序要处理的问题。近期Apache软件基金会(ASF)又将一批风趣的开源大数据项目结业为的Apache尖端项目。这意味着,这些项目将能够得到活跃的开展和社区的大力支撑。

你不知道的六大Apache大数据项目新星(apache 大数据项目)  Apache 大数据项目 开源 第1张

大多数人都听过的Apache Spark,一个针对Streaming, SQL,机器学习和图形处理的内置模块的大数据处理架构。 IBM和其他公司正在投入数十亿美金开发资金到Spark项目,NASA和SETI Institute正在运用Spark的机器学习才能,协作剖析TB数量级的外太空无线信号数据,寻觅外星智能生命存在的方法。

但是,其他几个最近被Apache擢升为尖端的大数据项目也值得您额定重视。事实上,他们中的一些所构建和开展的生态体系,很或许将对Spark 建议应战。结合本周举办的“ApacheCon北美峰会”(ApacheCon North America conference)和“Apache大数据峰会”(Apache: Big Data events),本文将概括那些你应该知道的Apache的大数据项目。

下面是六个正在冉冉鼓起的项目:

Kylin

Apache近来宣告其Kylin项目,一个始于eBay的开源大数据项目在eBay现已结业为尖端项目。Kylin是一个开源的分布式剖析引擎,旨在供给在Apache Hadoop之上SQL接口的多维剖析引擎(OLAP),可支撑超大数据集。它已广泛在eBay和其他一些安排中被选用。

“Apache Kylin的孵化之旅现已证明Apache软件基金会(ASF)开源办理的价值,以及环绕项目建造开源社区和生态体系的强壮力气。”Apache Kylin副总裁Luke Han(韩卿)说: “咱们的开源社区是世界上最大的本乡开发者参加的社区,彻底按照The Apache Way的社区运作方法。”

作为一个抢先的依据Hadoop的OLAP处理方案,Apache Kylin填补了大数据与人运用之间的空白,他弥补说道:“使剖析人员,最终用户,开发者和数据爱好者能够在大规模数据集上进行亚秒级推迟的交互式剖析。依据这些才能,Apache Kylin将商业智能(BI)带回Apache Hadoop以释放出大数据的价值。”

Lens

Apache近来宣告,Apache Lens,一个开源的大数据和剖析东西,也现已从Apache孵化器结业成为一个尖端项目(TLP)。依据公告:“Apache Lens是一个一致的剖析渠道,以一致视图方法为剖析查询供给了优化的履行环境。Apache Lens旨在经过供给一个跨多个数据存储的单一视图来横向打通数据剖析中遇到的异构单元。”

“经过在数据之上供给一个在线的剖析处理(OLAP)模型,Lens无缝地集成Hadoop和传统数据仓库,供给一致的外部接口。它一同供给体系中查询前史、核算和查询的生命周期办理。”

“在ASF中孵化Apache Lens是一段奇特的阅历” Apache Lens的副总裁Amareshwari Sriramadasu说:“Apache Lens从最终用户视点动身,为大数据剖析处理了一个难题,它使得事务用户、剖析师、开发者和其他用户,能够轻松的进行杂乱的数据剖析,而不需求了解底层的数据架构。”

Ignite

ASF还宣告Apache Ingite成为了一个尖端项目,一个经过开源方法树立的内存数据网络。Apache Ignite是一个高性能的整合的分布式的内存数据网络,实现在大规模数组上进行实时的核算和交互。Apache社区成员以为“或许比传统的硬盘或闪存技能要快几个数量级。它的规划使现有的以及各种新的运用能够轻松的布置在一个价格适合的行业标准的大规模并行架构的硬件上。”

Brooklyn

ASF宣告Apache Brooklyn已成为一个TLP(尖端项目)。“这标志着该项意图社区和产品在ASF优异的流程和准则下办理有方。”Brooklyn是用于整合跨多个数据中心的运用程序的蓝图和办理渠道,并适用于各种云端软件。

Brooklyn 声称:“跟着现代运用程序正在由更多个部件组成,微服务架构又逐步鼓起,布置以及已布置运用的演化越来越成为一个难题。Apache Brooklyn的蓝图供给了一个明晰简练的方法,在布置到公共云或私有基础设施之前,来标准运用,及它的组件、装备和组件之间的关联性。这种树立在自主核算理论的基础上的战略办理,会不断地评价运转运用程序,修改以坚持它的运转健康和目标优化,例如本钱和呼应才能。”

Brooklyn现已在一些知名企业中运用。云服务商Canopy和Virtustream已在Brooklyn上供给产品。IBM也现已大规模的运用Brooklyn,以将很多作业从AWS迁移到IBM Softlayer之上。

Apex

本年4月,Apache软件基金会将Apex项目提升至尖端项目。它被称为“运用在Apache Hadoop生态体系的大规模,高吞吐量,低延时,能容错的,一致的大数据流和批量处理渠道。” Apex与Apache Hadoop资源办理渠道YARN,一同作用于Hadoop作业集群。

Tajo

最终,Apache Tajo,一个抢先的Apache Hadoop之上的开源数据仓库体系,成为另一个你需求了解的大数据项目。Apache声称Tajo供给了针对Hadoop、第三方数据库以及商用BI东西的快速抓取才能。

明显,虽然Apache Spark招引了很多的眼球,但它不是仅有需求你重视的来自Apache的大数据东西。本年接下去,Apache或许会将更多引人注意图大数据项目晋级为尖端项目,这些项目必将由此取得更好的开发资源和更多的获益。

转载请说明出处
知优网 » 你不知道的六大Apache大数据项目新星(apache 大数据项目)

发表评论

您需要后才能发表评论