Excel是一款不错的数据分析工具,但是,如果你只有这一款工具,则会大大影响你的工作效率。相比之下,R 更好用,而且提供的工具集模块更完整。而缺点在于不是非常易于上手,用户一开始相对要花很多时间学习使用。如果坚持下去,就会有所收获,不仅对数据更了解,还提高了自己的能力...

终极对决:R 与 Excel 在数据分析傍边的优劣势比照(r和excel)  R语言 数据分析 第1张

我从事数据剖析作业现已有十年之久。开端是出于作业需求,我的司理给我一堆数据,我需求处理这些数据。其时我一贯运用的东西是 Excel,由于这是我熟练掌握的一款东西。三年前,我开端接触到 R,一开端由于功用太多而坚决抵抗运用。后来我开端揣摩怎么运用。现在我根本不怎么运用 Excel 了。这仅仅我个人的观念,可是假如你要剖析数据,R 更担任这项使命。下面来说说为什么 R 更适合数据剖析。

终极对决:R 与 Excel 在数据分析傍边的优劣势比照(r和excel)  R语言 数据分析 第2张

这两款东西的运用方法天壤之别。运用 Excel 时,能够经过鼠标点击完结大部分作业,你能够拜访界面内不同方位的各种东西。因而 Excel 十分便于运用(游刃有余),可是用 Excel 处理数据十分费时,并且假如接手一个新项目,你有必要单调地重复这些流程。运用 R 时,则经过代码完结一切操作。你把数据载入内存,然后运转脚原本研讨并处理数据。这个东西或许不行人性化,可是有以下几点优点。

我以为,从概念上来说,R 更便于运用。假如你在处理多列数据,尽管你仅仅在处理单个使命,可是却会看到一切的数据。而运用 R 时,数据都在内存中,只要调出数据才干看到。假如你在转化或核算,你会处理相关列或行的子集,其他一切数据都在后台。我觉得这样更便于重视手头的使命。完结使命后,可将其保存在某个数据帧中,其间只包括所需的列或行数据。你建立了正确的数据集,可处理当时的问题。这样做看似无关紧要,但实际上大受裨益。

凭借 R,就能够对其他数据集轻松重复相同的操作。由于一切数据都是经过代码进行处理和研讨,因而对新的数据集履行相同的操作也就垂手可得了。运用 Excel 时,大多数操作都是经过鼠标点击完结,尽管用户体会不错,但对新的数据重复操作却十分费时而单调。而 R 只需载入新的数据集,然后再次运转脚本即可。

实际上,用代码操作也便于确诊并同享你的剖析成果。运用 Excel 时,大多数的剖析成果都依据内存(数据透视表在这里,公式编辑器在另一个表格上等)。而在 R 中,经过代码履行一切操作,一望而知。假如你在批改一个过错,你很清楚在哪里操作,而假如你需求同享剖析成果,只需复制粘贴代码即可。在线查找协助时,你能精确阐明所用数据,并提出详细的问题。事实上,大多数时分,你在线发问时,人们都是直接贴出精确的代码,来处理你的问题。

R 中的项目安排更简略。在 Excel 中,我要预备一系列表格,或许还要预备多个作业簿,然后恰当命名,并且各文件名不得重复。我的项目补白别离保存在各个文件中。我的 R 项目安排独自设有一个文件夹,我处理过的一切内容都放在其间。整理数据、探索性图表及模型。这样便于我了解和查找,也为与我一同作业的其他人供给方便。当然,Excel 也能做到有条不紊。我觉得 R 的简洁性更便于运用。

上述几点只能说是如虎添翼,而并不是必不可少。在没有这些功用之前,我也用了好几年 Excel,你应该也相同。现在,我想讲讲 R 和 Excel 真实的差异。我想说的是,除了以上那些花哨的小优势之外,R 更适合用于数据剖析。原因如下。

你能够把任何数据载入 R。数据的保存方位或保存方式并不重要。你能够载入 CSV 文件,也能够读取 JSON,或许履行 SQL 查询,抑或提取网站。你乃至还能够在 R 中经过 Hadoop 处理大数据。

R 是一个完好的东西集,运用的是数据包。在剖析数据时,R 比 Excel 更有用。你可运用 R 履行数据管理、分类和回归,也能够处理图片,并履行其他一切操作。假如机器学习是你的专业,那能想到的任何算法都是小菜一碟。现在,R 可用的数据包逾 5,000 个,因而不管你要处理什么类型的数据,R 都能应付自如。

终极对决:R 与 Excel 在数据分析傍边的优劣势比照(r和excel)  R语言 数据分析 第3张

R 的数据可视化作用十分杰出。说句实话,Excel 的图表十分超卓,简略易懂。但 R 的作用更好。我觉得这是 R 最有用的功用之一。凭借 ggplot2,你能够快速创立所需的各种图表,并依据图表形状自行调整。在你了解了怎么用 ggplot2 创立一个图表后,任何其他图表都不在话下。ggplot2 还能制造更多类型的图表。你能用 Excel 创立散点图矩阵吗?用 R 就能轻松创立这种矩阵,CDF plot 也是如此。Excel 棋差一招。

Git 版别操控。我一贯习气保存多个版别的剖析成果。Git 是至今停止我找到的***用的东西。我运用 RStudio 作为编辑器,其支撑项目。创立一个项目库房,然后你就能盯梢数据研讨的不同版别。你能够创立不同版别的 Excel 文件,可是这些保存的二进制文件无法显现相互之间的更改部分。而 R 十分简略。

我现已说了许多理由。总归,Excel 是一款不错的数据剖析东西。我信任它能不负众望完结一切使命。可是,假如你只要这一款东西,则会大大影响你的作业效率。相比之下,R 更好用,并且供给的东西集模块更完好。而缺陷在于不是十分易于上手,用户一开端相对要花许多时刻学习运用。假如坚持下去,就会有所收成,不只对数据更了解,还提高了自己的才能。

转载请说明出处
知优网 » 终极对决:R 与 Excel 在数据分析傍边的优劣势比照(r和excel)

发表评论

您需要后才能发表评论