假如你有一个一千列和一百万行的数据集。无论你从哪个角度看它——小型,中型或大型的数据——你不可能看到它的全貌。将它放大或缩小。使它能够在一个屏幕里显示完全。由于人的本质,如果能够看到事物的全局的话,我们就会有更好的理解。有没有办法把数据都放到一张图里,让你可以像观察地图一样观察数据呢?

假设你有一个一千列和一百万行的数据集。不管你从哪个视点看它——小型,中型或大型的数据——你不可能看到它的全貌。将它扩大或缩小。使它可以在一个屏幕里显现彻底。因为人的实质,假如可以看到事物的大局的话,咱们就会有更好的了解。有没有方法把数据都放到一张图里,让你可以像调查地图相同调查数据呢?

将深度学习拓扑数据剖析结合在一起彻底可以达到此意图,而且还捉襟见肘。

1、它能在几分钟内创立一张数据图,其间每一个点都是一个数据项或一组相似的数据项。

根据数据项的相关性和学习形式,体系将相似的数据项组合在一起。这将使数据有仅有的表明方法,而且会让你更明晰地洞悉数据。可视化图中的节点由一个或多个数据点构成,而点与点之间的链接则代表数据项之间高相似性。

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第1张

2、它展现了数据中的形式,这是运用传统商业智能无法辨认的。

下面是个事例,展现的是算法是怎么只是经过剖析用户行为来辨认两组不同的人群。典型的特征区别,黄色和蓝色点:女人和男性。

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第2张

假如咱们剖析行为类型,咱们会发现,其间一组大部分是发送信息(男性),而另一组则多为接纳信息(女人)。

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第3张

3、它能在多层面上辨认分段数据

分段数据表现在多种层面上——从高层次分类到具有相同数据项的分组。

在一个Netflix数据集的比方中,每个数据项是一部电影。最高层次的一组是音乐,孩子,交际和成人电影。中层次的部分包括不同分段:从印度片和港片到惊悚片和恐怖片。在低层次中是电视连续剧分组,比方“全能管家”,“办公室”,“奥秘博士”等。

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第4张

4、它能剖析任何数据:文本,图画,传感器数据,乃至音频数据。

任何数据都可以被分段并了解,假如可以将它展现为数字矩阵,其间每一行是一个数据项,列是一个参数。下面这些是最常见的用例:

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第5张

5、假如你引导它,它能学习更杂乱的依靠联络。

挑选一组数据项,将它们分组,算法就会发现一切相关或相似的数据项。重复这个进程数次,那么神经网络可以学习到它们之间的差异,比方Mac硬件,PC硬件和一般电子文本的差异。

对20000篇归于20个不同主题的文章进行了开始剖析,得出一个密布的点云图(左图)。在运用深度学习迭代几回之后,算法会将它们进行分类,错误率只是1.2%(右图)。

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第6张

6、即便没有监督它也可以学习

深度学习和自编码器模拟了人类大脑活动,而且可以在数据会集自动辨认高层次的形式。例如,在谷歌大脑方案中,自编码器经过“观看”一千万条YouTube视频截取的数字图画,成功地学习并辨认出人和猫脸:

深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)  学习 拓扑 数据分析 第7张

我最近在运用拓扑数据剖析和深度学习,并开宣布一套东西,它将这些技能转化成了一个用户友爱型界面,可以让人们调查数据并发现潜在联络。

转载请说明出处
知优网 » 深度学习和拓扑数据剖析的六大惊人之举(拓扑数据分析)

发表评论

您需要后才能发表评论