# 导入基础数据分析模块包html
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
import matplotlib.pyplot as pltorm
# 忽略警告 htm
import warnings
warnings.filterwarnings('ignore')内存
# 显示全部列
pd.set_option('display.max_columns', None)
#显示全部行
pd.set_option('display.max_rows', None)字符串
# 字符串列转日期列数据分析
df["datetime_col"] = pd.to_datetime(df["datetime_col"], format='%Y/%m/%d')pandas
# 查看样本的数和特征列数
print(df.shape)
# 查看数据基本行列大小、类型、内存信息
df.info()io
# 生成数据报表并保存
import pandas_profiling
profile = pandas_profiling.ProfileReport(df)
profileform
# 保存数据报表import
profile.to_file(outputfile = "output_file.html")
# 统计数值型 describe()df.describe().T