根据统计,目前受访者选择的最常用方法包括回归、聚类、可视化、决策树/规则以及随机森林; 只有20%的受访者使用深度学习方法; 我们同时对各种方法在“行业”与“学术”层面的普及度进行了汇总。

【51CTO.com快译】依据计算,现在受访者挑选的最常用办法包含回归、聚类、可视化、决策树/规矩以及随机森林; 只要20%的受访者运用深度学习办法; 咱们一起对各种办法在“职业”与“学术”层面的遍及度进行了汇总。

本次查询的问题十分简略:

您在曩昔十二个月中曾在实践运用傍边挑选哪些数据科学/机器学习办法与东西?

依据732名受访者供给的成果,得出以下结论:

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第1张

2017年运用规划最广的十大数据科学与机器学习办法

本次查询的受访者均匀运用7.7种东西/办法。

接下来,咱们比较了本年查询傍边运用规划最广的前16种办法,并将其与上一年的成果进行了比对,如下图。

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第2张

2017年与2016年前16大数据科学/机器学习办法比对

咱们注意到,随机森林、可视化与深度学习的运用份额明显添加,而K-nn、PCA以及Boosting则有所下降。梯度推进机本年则***上榜。

虽然取得了令人瞩目的成功,但依据此次查询,仅有20%的受访者实践运用深度学习办法。

与上一年比较,本年增加幅度***的东西/办法包含:

  • 贝叶斯办法,增加49%,由2016年的11.7%增加至2017年的17.5%。
  • 随机森林,增加32%,由2016年的35.1%增加至2017年的46.2%。
  • 深度学习,增加20%,由2016年的17.2%增加至2017年的20.6%。
  • 生计剖析,增加13.5%,由2016年的7.5%增加至2017年的8.5%。
  • 可视化,增加9%,由2016年的46.7%增加至2017年的51.0%。

2017年的榜单还迎来一众全新办法,详细包含:

  • 梯度推进机, 20.4%
  • 卷积网络, 15.8%
  • 递归神经网络(简称RNN), 10.5%
  • 隐马尔可夫模型 (简称HMM), 4.6%
  • 强化学习, 4.2%
  • 马尔可夫逻辑网络, 2.5%
  • 生成对立网络 (简称GAN), 2.3%

运用份额下降最明显的包含:

  • 古怪值分化(简称SVD),下降48%,由2016年的15.4%下降至2017年的8.1%
  • 图形/链结/交际网络剖析,下降42%,由2016年的14.0%下降至2017年的8.1%
  • 遗传算法/进化办法,下降42%,由2016年的8.3%下降至2017年的4.8%
  • EM,下降36%,由2016年的6.4%下降至2017年的4.1%
  • 优化,下降26%,由2016年的23.2%下降至2017年的17.2%
  • Boosting,下降20%,由2016年的30.6%下降至2017年的24.6%
  • PCA,下降14%,由2016年的40.5%下降至2017年的34.7%

职业归属

各职业的办法/东西运用状况为:

  • 职业/个人,63%,均匀东西运用量为8.3款
  • 学生,15%,均匀东西运用量为5.7款
  • 研究人员/学术人员,11%,均匀东西运用量为7.8款
  • 其它,11%,均匀东西运用量为7.1款

补白:只要35名受访者挑选了政府/非营利性安排——因为样本规划太小,因而管中窥豹我将其归入“其它”类别傍边。

下面为16种排名靠前的办法及其误差倾向成果

详细计算办法为:误差(办法,归属)=份额(办法,归属)/份额(办法)-1

假如误差值为正,则意味着该办法的运用频率高于均匀水平。假如为负值,则代表该办法的运用频率低于均匀水平。

举例来说,支撑向量机(简称SVM)具有28.7%的受访者运用份额,但在研究人员集体内则具有44.4%的运用份额,因而误差(SVM,研究人员)=44.4%/28.7% - 1 = 54.9%.

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第3张

前16大数据科学办法及其归属联系倾向性

接下来,咱们将调查各项数据科学办法在职业/学术界之间的吸引力。

以下图表所示为各项数据科学办法在各职业与学术界(学术界界说为学生+研究人员集体)中的吸引力排名:职业吸引力(办法)=份额(办法,职业)/份额(办法,学术界)-1

其间“职业”运用频率***的办法为:

增量建模(接连第二年登顶)

  • 反常/误差检测
  • 梯度推进机
  • “学术界”最喜爱与深度学习相关的先进议题:
  • 生成对立网络 (简称GAN)
  • 强化学习
  • 递归神经网络(简称RNN)
  • 卷积网络

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第4张

数据科学办法及其职业/学术界吸引力

条状图形的宽度对应其运用份额,色彩则对应职业/学术界吸引力。

***,全球各区域的参加度为:

  • 欧洲, 39%
  • 美国/加拿大, 33%
  • 亚洲, 14%
  • 南美洲, 6.0%
  • 澳大利亚/新西兰, 4.8%
  • 非洲/中东, 3.8%

下表所示为避实就虚办法的详细数据,按整体运用份额排序。

表中各列分别为:

办法:数据科学办法

  • 2017年与2016年改变百分比:与2016年比较的运用份额改变状况
  • 整体运用状况百分比:受访者运用该办法的百分比
  • 职业运用状况百分比:职业类受访者运用该办法的百分比
  • 学生运用状况百分比:学生受访者运用该办法的百分比
  • 研究人员运用状况百分比:研究人员受访者运用该办法的百分比

表一:数据科学办法运用状况

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第5张

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第6张

更多AI内容,请重视大众号:AI推手

 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘) 数据科学 机器学习 排名 第7张

【51CTO译稿,协作站点转载请注明原文译者和出处为51CTO.com】

转载请说明出处
知优网 » 2017年尖端数据科学与机器学习方法排行榜(机器学习与数据挖掘)

发表评论

您需要后才能发表评论