【Python】SQL to Pandas 系列（二）

时间 2019-11-22

标签 Python sql pandas 系列栏目 Python 繁體版

原文原文链接

原文地址python

介绍

此文为 SQL to Pandas 系列第二篇sql

可先阅读post

【Python】当数据离开了 SQL 该怎么活下去（一）测试

补充上篇 JOIN 内容

本篇将解构下面的 SQL 查询句式, 使用 Pandas 进行实现ui

SQL 查询句式spa

SELECT DISTINCT [字段] 
FROM [表] JOIN [bin] ON [链接条件] 
WHERE [过滤条件] 
GROUP BY [字段] 
HAVING [条件] 
ORDER BY [字段] DESC 
LIMIT [个数] OFFSET [个数]
复制代码

读取评论数据

df_comments = pd.read_sql(sql="select * from comments", con=conn)
复制代码

数据预览code

df_comments
复制代码

	id	student_id	content
0	1	1	测试评论1
1	2	5	测试评论5
2	3	2	测试评论2
3	4	3	测试评论3
4	5	1	测试评论11
5	6	9	测试评论9

JOIN

(INNER) JOINcdn

SQLci

SELECT
	* 
FROM
	student
	INNER JOIN comments ON student.id = comments.student_id;
复制代码

Pandasget

pd.merge(df, df_comments, left_on='id', right_on='student_id')
复制代码

LEFT (OUTER) JOIN

SQL

SELECT
	* 
FROM
	student
	LEFT JOIN comments ON student.id = comments.student_id;
复制代码

Pandas

pd.merge(df, df_comments, left_on='id', right_on='student_id', how='left')
复制代码

RIGHT (OUTER) JOIN

SQL

SELECT
	* 
FROM
	student
	RIGHT JOIN comments ON student.id = comments.student_id;
复制代码

Pandas

pd.merge(df, df_comments, left_on='id', right_on='student_id', how='right')
复制代码

UNION

SQL

SELECT * FROM student where city ='北京' 
UNION 
SELECT * FROM student where sex ='男';
复制代码

Pandas

pd.concat([df[df.city == '北京'], df[df.sex == '男']]).drop_duplicates().reset_index()
复制代码

UNION ALL

SQL

SELECT * FROM student where city ='北京' 
UNION ALL 
SELECT * FROM student where sex ='男';
复制代码

Pandas

pd.concat([df[df.city == '北京'], df[df.sex == '男']]).reset_index()
复制代码

本篇内容

本篇将解构下面的 SQL 查询句式, 使用 Pandas 进行实现

SQL 建立句式

CREATE TABLE [表名] (
    [列名] [类型],
    [列名] [类型],
   ....
);
复制代码

SQL 插入句式

INSERT INTO [表名] VALUES ([值], [值], ...);
INSERT INTO [表名] ([列名],[列名] ...) VALUES ([值], [值], ...);
复制代码

SQL 更新句式

UPDATE [表名]
SET [列名] = [值], [列名] = [值]
WHERE [过滤条件];
复制代码

SQL 删除句式

DELETE FROM [表名] WHERE [过滤条件];
复制代码

CREATE

SQL

CREATE TABLE student (
	id INT ( 11 ) NOT NULL AUTO_INCREMENT,
	name VARCHAR ( 10 ) COLLATE utf8mb4_general_ci DEFAULT NULL,
	age date DEFAULT NULL,
	sex VARCHAR ( 10 ) COLLATE utf8mb4_general_ci DEFAULT NULL,
	city VARCHAR ( 255 ) CHARACTER 
    SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL,
	money DOUBLE ( 255, 2 ) DEFAULT NULL,

);
复制代码

Pandas

pd.DataFrame(columns=['id', 'name', 'sex', 'city', 'money'])
复制代码

INSERT

SQL

INSERT INTO student (id, name, age, sex, city, money )
VALUES
	(1, '张三', '2017-12-20', '女', '天津', 20.00 );
复制代码

Pandas

# 第一种
df.loc[-1] = [1, '张三', '女', '天津', 20.00]
df.index = df.index + 1
df = df.sort_index()

# 第二种
temp_pd = pd.DataFrame({'id': [1], 'name': ['张三'], 'sex': ['女'], 'city': ['天津'], 'money': [20.00]})
df = pd.concat([df,temp_pd], ignore_index=True)
df.reset_index()

# 第三种
temp_pd = pd.DataFrame([[1,'张三1', '女', '天津', 20.00]], columns=df.columns)
df = pd.concat([df, temp_pd])
df.reset_index()
复制代码

UPDATE

SQL

UPDATE student SET money = 300 WHERE id = 1;
复制代码

Pandas

df.loc[df.id == 1, 'money'] = 300
复制代码

DELETE

SQL

-- 测试时会因外键报错，此处忽略，仅讨论句法
DELETE FROM student WHERE id = 1;
复制代码

Pandas

df = df.loc[df.id != 1]
复制代码

系列文章

【Python】当数据离开了 SQL 该怎么活下去（一）

【Python】当数据离开了 SQL 该怎么活下去（二）