亚马逊工程师Eugene Yan等人打造了一个论文合集,在这个GitHub项目中,持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。

本文经AI新媒体量子位(大众号ID:QbitAI)授权转载,转载请联络出处。

工欲善其事,必先利其器。

在作业中着手施行自己的ML项目之前,了解范畴里的前沿发展,吸收前人的经历,是很有必要的。

不过,现在arXiv上每天都有成百篇新论文冒头,哪些值得看?

为此,亚马逊工程师Eugene Yan等人打造了一个论文合集,在这个GitHub项目中,继续同享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。

这份GitHub 2.3k星的ML论文清单拿好,作业用得上  GitHub 代码 开发者 第1张

这些论文/文章包括24种不同分类,从查找排名到NLP、CV,都能在这里找到:

数据质量

数据工程

数据发掘

分类

回归

引荐算法

查找排名

嵌入

自然语言处理

序列建模

猜测

计算机视觉

强化学习

反常检测

图形

优化

信息提取

弱监督

生成

功率

验证和A/B测验

伦理道德

实践

失利

现在标星2.3k。

以引荐算法为例。

关于不同的职业,事务不同很大。即便算法根底结构迥然不同,想要训练出精准的引荐模型,细节上仍是有许多不同之处。

而这份清单,收集了电商、视频、音乐、课程种种不同事务的引荐算法技能博客/论文。

这份GitHub 2.3k星的ML论文清单拿好,作业用得上  GitHub 代码 开发者 第2张

比方阿里的《Behavior Sequence Transformer for E-commerce Recommendation in Alibaba》。

论文介绍了行为序列Transformer在阿里电子商务引荐体系中的使用。

研究人员提出,使用Transformer模型来捕捉用户行为序列背面的次序信号,以增强个性化引荐的有效性,进步点击量。通过试验验证后,他们将该模型布置在了淘宝线上,证明与基线比较,该办法能明显进步在线点击率。

论文链接:
https://arxiv.org/abs/1905.06874

在视频个性化引荐方面,YouTube、网飞、TikTok的技能计划都有录入。

这份GitHub 2.3k星的ML论文清单拿好,作业用得上  GitHub 代码 开发者 第3张

比方YouTube这篇引证次数到达1039次的《Deep Neural Networks for YouTube Recommendations》。

论文要点介绍了深度学习给YouTube引荐体系带来的巨大功能进步。首要,研究人员具体介绍了深度候选征途模型和深度排名模型。然后,研究人员还在论文中共享了从规划、迭代到保护一个具有海量用户的大规模引荐体系这个过程中,取得的实践经历和启示。

论文地址:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

别的,比较风趣的是,这份论文/文章列表还录入了一些失利的经历。

比方Google Photos在给相片打标签时,从前严峻翻车:把黑人符号成了“大猩猩”。

最近大火的GPT-3,则没有处理前代GPT-2的“成见”问题,在生成的文字中,总是将穆斯林和暴力、逝世联络在一起。

关于作者

这一项意图首要保护者,是亚马逊使用科学家Eugene Yan。

他本科毕业于新加坡办理大学,专业是心理学和人力资源办理,后于佐治亚理工学院获计算机科学硕士学位。

现在的首要作业是使用顾客数据,构建机器学习体系以进步用户体会。

传送门

项目地址:
https://GitHub.com/eugeneyan/applied-ml

 这份GitHub 2.3k星的ML论文清单拿好,作业用得上 GitHub 代码 开发者 第4张

转载请说明出处
知优网 » 这份GitHub 2.3k星的ML论文清单拿好,作业用得上

发表评论

您需要后才能发表评论