pandas

 

# 导入基础数据分析模块包html

import numpy as np
import pandas as pd
from pandas import Series, DataFrame
import matplotlib.pyplot as pltorm

# 忽略警告 htm

import warnings
warnings.filterwarnings('ignore')内存

 

# 显示全部列
pd.set_option('display.max_columns', None)
#显示全部行
pd.set_option('display.max_rows', None)字符串

 

# 字符串列转日期列数据分析

df["datetime_col"] = pd.to_datetime(df["datetime_col"], format='%Y/%m/%d')pandas

# 查看样本的数和特征列数
print(df.shape)
# 查看数据基本行列大小、类型、内存信息
df.info()io

 

# 生成数据报表并保存
import pandas_profiling

profile = pandas_profiling.ProfileReport(df)
profileform

# 保存数据报表import

profile.to_file(outputfile =  "output_file.html")

 

# 统计数值型 describe()df.describe().T

相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息