在工做中,咱们获得的数据源通常是以Excel文件为多,偶有CSV文件或TXT文件等。资深表哥/表姐们都知道,Excel自带数据统计功能,但却处理不了大数据集。而CSV与TXT格式的文件,虽然容量大,但因为是纯文本文件,因此不具备数据处理的功能。函数
为了解决这一尴尬的问题,下面我就教一下你们怎么用统计专业的R语言来读取数据(数据处理以前很重要的一个步骤)工具
用R读取excel文件中的数据,须要先搭建一个Java的环境(配置好JDK),而后再用 install.packages("xlsx") 指令导入相关的包(常见的Excel文件格式是xlsx,而处理xlsx文件这个包是使用Java语言来写的)。可是对于不少小白,可能会出现被配置JDK折腾得劝退的现象。因此,在这里,我就向你们展现用R语言加载外部文件数据的另外3种更简单的方法,以下:学习
例如:我先在桌面(路径为:C:\Users\QDM\Desktop)建立一个Excel文件,并手动输入数据,构造一张9行*4列的数据表,表格内容截图以下:大数据
方法①:先按 F12功能键 将.xlsx另存为.csv格式的文件,而后用read.csv()函数来读取该CSV文件中的数据,代码以下:spa
> x <- read.csv("C:\\Users\\QDM\\Desktop\\销售业绩.csv",header = T) > x 品牌 产地 销售数量 销售金额 1 布加迪 法国 10 200,000,000 2 兰博基尼 意大利 20 160,000,000 3 法拉利 意大利 30 150,000,000 4 丰田 日本 40 6,000,000 5 本田 日本 50 10,000,000 6 五菱 中国 60 3,000,000 7 大众 德国 70 21,000,000 8 宝马 德国 80 80,000,000
运行结果截图:excel
方法②:把.xlsx另存为.txt格式,而后用read.table()函数来读取该txt文件中的数据,代码以下:code
> y <- read.table("C:\\Users\\QDM\\Desktop\\销售业绩.txt",header = T) > y 品牌 产地 销售数量 销售金额 1 布加迪 法国 10 200,000,000 2 兰博基尼 意大利 20 160,000,000 3 法拉利 意大利 30 150,000,000 4 丰田 日本 40 6,000,000 5 本田 日本 50 10,000,000 6 五菱 中国 60 3,000,000 7 大众 德国 70 21,000,000 8 宝马 德国 80 80,000,000
运行结果截图:blog
方法3:先打开Excel文件,按Ctrl+A快捷键全选里面的内容,接着按Ctrl+C复制(默认复制到剪切板上),如图:ip
而后在RStudio中输入如下代码:数据分析
> z <- read.table("clipboard",header = T,sep = "\t") > z 品牌 产地 销售数量 销售金额 1 布加迪 法国 10 200,000,000 2 兰博基尼 意大利 20 160,000,000 3 法拉利 意大利 30 150,000,000 4 丰田 日本 40 6,000,000 5 本田 日本 50 10,000,000 6 五菱 中国 60 3,000,000 7 大众 德国 70 21,000,000 8 宝马 德国 80 80,000,000
运行结果截图:
结语:做为一名曾经的“统计学”专业的毕业生,在数据分析岗位上,若是被别人知道只会用Excel,而不会用一门本专业相关的专业工具(如:R语言、SAS语言、SPSS等)处理数据,会有一种很尴尬的感受——可能会很容易被人以为不学无术。虽然在毕业后,经本人的后天努力自学,掌握了一门更好用的数据分析工具——Python,但为了避免愧对本身所学过得专业,为了避免愧对那每一年¥3500的学费,因此感受仍是挺有必要抽时间来学习一下R语言的!