R 数据清洗(一)

1、生成数据框



2、创建新变量


增加两个变量,sumx,meanx



3、变量的重编码

将age=99修改成缺失值NA


根据age修改成类别型变量


注意:注意先将不合理的age修改成缺失值NA

4、变量的重命名

需要引入包“reshape”


另外一种变量名的方式:


5、识别缺失值


6、在分析中排出缺失值




7、日期值格式化






将日期转换成字符型变量


8、类型转换