海量数据分成两块,一是系统建设技术,二,海量数据应用。

从事大数据相关的作业 怎么自学打基础?(大数据基础如何自学)  大数据 第1张

海量数据分红两块,一是体系建造技能,二,海量数据使用。

先说体系建造,现在干流的技能是HADOOP,首要根据mapreduce的分布式结构。现在能够先学习这个。可是我的观念,在分布式体系出来之前,首要是集中式架构,如DB2,oracle。为什么现在用分布式架构,那是由于现在集中式架构受限于IO功能,出来速度慢,假如又一种硬件技能,能够很快地处理海量数据,功能上能满意需求,那么集中式架构优于分布式架构,由于集中式架构安稳,运维压力小。现在的集中式架构要么功能达不到要求,要么便是过于贵重。我等待一种技能呈现,能够十分快地传输和处理数据,那么集中式架构将再次进入人们眼球。再说海量数据使用。海量数据使用首要是数据发掘和机器算法。详细有不同的使用场景,如个性化查找和引荐,交际网络发现,精准营销,精准广告,实时***途径,人工智能等等。看你想做体系支撑技能仍是与事务结合的使用技能。

假如现在学体系建造技能,能够读下如下书本:

从事大数据相关的作业 怎么自学打基础?(大数据基础如何自学)  大数据 第2张

假如学数据发掘和机器算法,引荐先看数据发掘导论,统计分析原理,Mahout,R,MATLAB

转载请说明出处
知优网 » 从事大数据相关的作业 怎么自学打基础?(大数据基础如何自学)

发表评论

您需要后才能发表评论