开源大数据技术Hadoop,在今年刚好满十岁。在大数据的第一个十年,Hadoop成功地让大数据成为最被看好的技术,这股大趋势,不仅影响资讯科技的走向,更成为商业热烈讨论的议题。

 大数据的下一步:AI、ML、DL(大数据的开始) 大数据 AI ML DL 第1张

开源大数据技能Hadoop,在本年刚好满十岁。在大数据的第一个十年,Hadoop成功地让大数据成为最被看好的技能,这股大趋势,不只影响资讯科技的走向,更成为商业火热评论的议题。

之所以如此,一方面是随著网际网络、云端运算、才智举动设备的遍及,使得Google、Facebook、Twitter等大型互联网公司的用户数量,出现爆炸性生长,为了敷衍全球用户的规划,这些闻名互联网技能公司纷繁投入大数据技能,使得大数据成为顶尖技能的方针,瞬间成了抢手的当红炸子鸡。

另一方面,这些互联网公司不仅仅选用Hadoop这样的开源大数据技能,更招聘软件高手开发契合自己需求的大数据技能,再将这些大数据软体的程式码开源。如此一来,既招引更多高手参加开发,亦回馈开发社群,而这样的效应,也使得大数据开源技能的开展,如火如荼,至今与Hadoop相关的开源软件已超越一百个,构成巨大的Hadoop生态圈。

在接下来的第二个十年,大数据将会怎么开展呢?本年中,我参加在大数据范畴颇负盛名的Strata & Hadoop World技能大会,本来我等待这场以大数据技能Hadoop为名的技能会议,首要讨论的议题,应该环绕著Hadoop生态圈的开源大数据技能;但是,在两天的大会主题讲演,不管上台的是Google、Microsoft这样的世界大厂,或是百度、阿里巴巴、蚂蚁金服、小米等我国网路大公司,谈的都是人工才智(Artificial Intelligence,AI)、机器学习(Machine Learning,ML)、深度学习(Deep Learning,DL)等AI议题。

纵使那两天的下午议程傍边,仍有很大的份额,在讨论大数据即时剖析、串流运算等议题,但是大会主秀——通常是科技公司展示实力的主题讲演,却是不谋而合谈AI、ML及DL等技能议题。

在这些本来便是大数据技能领头羊的眼中,很明显地,人工才智、机器学习与深度学习是大数据的下一步,也是大数据第二个十年的兵家必争之地。

但是,迈向第二个十年后,大数据就不再重要了?其实并否则,这些技能仍然重要,仅仅下个十年的开展,将是以AI为导向的大数据。关于这部份,咱们能够从催生Spark、Mesos的柏克莱AMPLab实验室来调查。

在大数据第一个黄金十年的后半段,以微批次串流运算技能窜红的Spark,引领风流,而Spark的诞生地——柏克莱大学AMPLab,却将在2016年末吹熄暗号。AMPLab由两位具有软体创业经历的教授掌管,在现在的6年计画期间,推进许多开源软体研讨专案,最闻名的当属涣散式资源管理体系Mesos、串流运算渠道Spark、涣散式记忆体贮存体系Alluxio(之前称为Tachyon),在单个范畴都居于技能抢先的位置。

已然AMPLab有如此重要的研讨奉献,为何完毕呢?由于柏克莱实验室的传统,遍及以5至6年投入研讨,处理一个重要的问题,现在AMPLab现已完成了阶段性任务:打造开源大材料剖析技能,接下来,他们将以新建立的实验室RISELab,处理大数据的下一个新问题。

新问题是什麽呢?从实验室的称号Real-time Intelligent Secure Execution,即可看出端倪。在上个阶段,AMPLab是从大数据批次材料处理技能,开展至大数据剖析技能,而下个阶段的RISELab,则要战胜即时材料处理的问题,开展出即时决议计划的使用。他们的方针是,研宣布比Spark的反响速度快100倍、输出快1000倍的新一代大数据技能,而且结合线上机器学习与更自动化的演算法,在保证材料加密安全与隐私,且不献身效能的情况下,从即时材猜中做即时决议计划。

未来6年RISELab能否达到方针,尚无人能知。但很必定的是,大数据的下一步,是以AI为导向的新一代大数据。

转载请说明出处
知优网 » 大数据的下一步:AI、ML、DL(大数据的开始)

发表评论

您需要后才能发表评论