以前作查询一直以为直接拼 SQL 比较方便,用了 SQLAlchemy 的 ORM 查询以后,发现也还能够,还提升了可读性。html
这篇文章主要说说 SQLAlchemy 经常使用的 ORM 查询方式,偏实践。看了以后,对付开发中的查询需求,我以为能够知足很多。mysql
为方便说明,假设有以下数据sql
图书表 books后端
+----+--------+--------------------------+-------+ | id | cat_id | name | price | +----+--------+--------------------------+-------+ | 1 | 1 | 生死疲劳 | 40.40 | | 2 | 1 | 皮囊 | 31.80 | | 3 | 2 | 半小时漫画中国史 | 33.60 | | 4 | 2 | 耶路撒冷三千年 | 55.60 | | 5 | 2 | 国家宝藏 | 52.80 | | 6 | 3 | 时间简史 | 31.10 | | 7 | 3 | 宇宙简史 | 22.10 | | 8 | 3 | 天然史 | 26.10 | | 9 | 3 | 人类简史 | 40.80 | | 10 | 3 | 万物简史 | 33.20 | +----+--------+--------------------------+-------+
分类表 categoriessession
+----+--------------+ | id | name | +----+--------------+ | 1 | 文学 | | 2 | 人文社科 | | 3 | 科技 | +----+--------------+
ORM 对象定义以下app
注意:本文 Python 代码在如下环境测试经过测试
# coding=utf-8 from sqlalchemy import create_engine from sqlalchemy.ext.declarative import declarative_base from sqlalchemy import Column, Integer, String, Numeric from sqlalchemy.orm import sessionmaker Base = declarative_base() engine = create_engine('mysql+pymysql://username:password' '@127.0.0.1:3306/db_name?charset=utf8') Session = sessionmaker(bind=engine) session = Session() def to_dict(self): return {c.name: getattr(self, c.name, None) for c in self.__table__.columns} Base.to_dict = to_dict class Book(Base): __tablename__ = 'books' id = Column(Integer, primary_key=True) cat_id = Column(Integer) name = Column('name', String(120)) price = Column('price', Numeric) class Category(Base): __tablename__ = 'categories' id = Column(Integer, primary_key=True) name = Column('name', String(30))
好了,下面进入正题。scala
当咱们获取图书的详情时,很容易用到。code
book_id = 1 book = session.query(Book).get(book_id) print(book and book.to_dict())
直接 get(primary_key) 就获得结果orm
{'id': 1, 'cat_id': 1, 'name': '生死疲劳', 'price': Decimal('40.40')}
固然,这样也能够
book_id = 1 book = session.query(Book) \ .filter(Book.id == book_id) \ .first() print(book and book.to_dict())
不过,仍是前一种方式简洁一些。
咱们最经常使用到的就是这种查询,好比我要获取 cat_id
为 1 且价格大于 35 的书
books = session.query(Book) \ .filter(Book.cat_id == 1, Book.price > 35) \ .all() print([v.to_dict() for v in books])
执行后,获得结果
[{'id': 1, 'cat_id': 1, 'name': '生死疲劳', 'price': Decimal('40.40')}]
filter() 里面的条件默认是使用 AND 进行链接,毕竟这最经常使用嘛。因此说,换成这样用也是没有问题的
from sqlalchemy import and_ books = session.query(Book) \ .filter(and_(Book.cat_id == 1, Book.price > 35)) \ .all() print([v.to_dict() for v in books])
不过,一般来讲,若是条件全是用 AND 链接的话,不必显式的去用 and_
。
若是条件都是等值比较的话,可使用 filter_by()
方法,传入的是关键字参数。
查询 cat_id
等于 1 且价格等于 31.8 的图书,能够这样
books = session.query(Book) \ .filter_by(cat_id=1, price=31.8) \ .all() print([v.to_dict() for v in books])
结果
[{'id': 2, 'cat_id': 1, 'name': '皮囊', 'price': Decimal('31.80')}]
这种方式相对于 filter() 来讲,书写要简洁一些,不过条件都限制在了等值比较。
不一样状况选择合适的就好。
除了上面使用的 get()、first()、all() 外,还有下面的一些方法比较经常使用。
# 找不到记录会抛以下错误 # sqlalchemy.orm.exc.NoResultFound: No row was found for one() book = session \ .query(Book).filter(Book.id > 10) \ .one() print(book and book.to_dict()) # 找到多条记录会抛以下错误 # sqlalchemy.orm.exc.MultipleResultsFound: Multiple rows were found for one() book = session \ .query(Book).filter(Book.id < 10) \ .one() print(book and book.to_dict()) # 正常,获得以下结果 # {'id': 10, 'cat_id': 3, 'name': '万物简史', # 'price': Decimal('33.20')} book = session \ .query(Book).filter(Book.id == 10) \ .one() print(book and book.to_dict())
count = session \ .query(Book) \ .filter(Book.cat_id == 3) \ .count() print(count)
结果
5
books = session \ .query(Book) \ .filter(Book.cat_id == 3) \ .limit(3) \ .all() print([v.to_dict() for v in books])
结果
[{'id': 6, 'cat_id': 3, 'name': '时间简史', 'price': Decimal('31.10')}, {'id': 7, 'cat_id': 3, 'name': '宇宙简史', 'price': Decimal('22.10')}, {'id': 8, 'cat_id': 3, 'name': '天然史', 'price': Decimal('26.10')}]
books = session \ .query(Book.cat_id) \ .distinct(Book.cat_id) \ .all() print([dict(zip(v.keys(), v)) for v in books])
结果
[{'cat_id': 1}, {'cat_id': 2}, {'cat_id': 3}]
order_by()
将记录按照某个字段进行排序# 图书按 ID 降序排列 # 若是要升序排列,去掉 .desc() 便可 books = session \ .query(Book.id, Book.name) \ .filter(Book.id > 8) \ .order_by(Book.id.desc()) \ .all() print([dict(zip(v.keys(), v)) for v in books])
结果
[{'id': 10, 'name': '万物简史'}, {'id': 9, 'name': '人类简史'}]
book_name = session \ .query(Book.name) \ .filter(Book.id == 10)\ .scalar() print(book_name)
结果
万物简史
# 查看 ID 大于 10 的图书是否存在 from sqlalchemy.sql import exists is_exist = session \ .query(exists().where(Book.id > 10)) \ .scalar() print(is_exist)
结果
False
经过 OR 链接条件的状况也多,好比我要获取 cat_id
等于 1 或者价格大于 35 的书
from sqlalchemy import or_ books = session.query(Book) \ .filter(or_(Book.cat_id == 1, Book.price > 35)) \ .all() print([v.to_dict() for v in books])
执行,获得结果
[{'id': 1, 'cat_id': 1, 'name': '生死疲劳', 'price': Decimal('40.40')}, {'id': 2, 'cat_id': 1, 'name': '皮囊', 'price': Decimal('31.80')}, {'id': 4, 'cat_id': 2, 'name': '耶路撒冷三千年', 'price': Decimal('55.60')}, {'id': 5, 'cat_id': 2, 'name': '国家宝藏', 'price': Decimal('52.80')}, {'id': 9, 'cat_id': 3, 'name': '人类简史', 'price': Decimal('40.80')}]
使用方式和 AND 查询相似,从 sqlalchemy 引入 or_
,而后将条件放入就 OK 了。
现实状况下,咱们很容易碰到 AND 和 OR 并存的查询。好比,我如今要查询价格大于 55 或者小于 25,同时 cat_id
不等于 1 的图书
from sqlalchemy import or_ books = session.query(Book) \ .filter(or_(Book.price > 55, Book.price < 25), Book.cat_id != 1) \ .all() print([v.to_dict() for v in books])
结果
[{'id': 4, 'cat_id': 2, 'name': '耶路撒冷三千年', 'price': Decimal('55.60')}, {'id': 7, 'cat_id': 3, 'name': '宇宙简史', 'price': Decimal('22.10')}]
又如,查询图书的数量,图书知足两个要求中的一个便可:一是 cat_id
大于 5;二是 cat_id
小于 2 且价格大于 40。能够这样
from sqlalchemy import or_, and_ count = session.query(Book) \ .filter(or_(Book.cat_id > 5, and_(Book.cat_id < 2, Book.price > 40))) \ .count() print(count)
结果
1
开发中,咱们常常会碰到根据传入的参数构造查询条件进行查询。好比
cat_id
,须要限制 cat_id
等于 0min_price
,须要限制 price 大于等于 min_price
max_price
,须要限制 price 小于等于 max_price
咱们就能够编写相似的代码
# 请求参数,这里只是占位,实际由用户提交的请求决定 params = {'cat_id': 1} conditions = [] if params.get('cat_id', 0): conditions.append(Book.cat_id == params['cat_id']) if params.get('price', 0): conditions.append(Book.price == params['price']) if params.get('min_price', 0): conditions.append(Book.price >= params['min_price']) if params.get('max_price', 0): conditions.append(Book.price <= params['max_price']) books = session.query(Book).filter(*conditions).all() print([v.to_dict() for v in books])
结果
[{'id': 1, 'cat_id': 1, 'name': '生死疲劳', 'price': Decimal('40.40')}, {'id': 2, 'cat_id': 1, 'name': '皮囊', 'price': Decimal('31.80')}]
OR 查询相似,将列表解包传给 or_()
便可。
若是需求更复杂,AND 和 OR 均可能出现,这个时候根据状况多建几个列表实现。这里只向你们说明大体的思路,就不举具体的例子了。
固然,若是都是等值查询的话,好比只有这两种状况
cat_id
,须要限制 cat_id
等于 0可使用字典的解包给 filter_by()
传参
# 请求参数,这里只是占位,实际由用户提交的请求决定 params = {'price': 31.1} condition_dict = {} if params.get('cat_id', 0): condition_dict['cat_id'] = params['cat_id'] if params.get('price', 0): condition_dict['price'] = params['price'] books = session.query(Book) \ .filter_by(**condition_dict) \ .all() print([v.to_dict() for v in books])
结果
[{'id': 6, 'cat_id': 3, 'name': '时间简史', 'price': Decimal('31.10')}]
除了上面看到的 ==、>、>=、<、<=、!= 以外,还有几个比较经常使用
# 查询 ID 在 一、三、5 中的记录 books = session.query(Book) \ .filter(Book.id.in_([1, 3, 5])) \ .all()
# 查询名称包含「时间简史」的图书 books = session.query(Book) \ .filter(Book.name.contains('时间简史')) \ .all()
FIN_IN_SET()
# 查询名称包含「时间简史」的图书 # 这里显然应该用 INSTR() 的用法 # FIND_IN_SET() 通常用于逗号分隔的 ID 串查找 # 这里使用 FIND_IN_SET(),旨在说明用法 from sqlalchemy import func books = session.query(Book) \ .filter(func.find_in_set('时间简史', Book.name)) \ .all()
# 查询名称以「简史」结尾的图书 books = session.query(Book) \ .filter(Book.name.like('%简史')) \ .all()
上面的 IN、INSTR、FIN_IN_SET
、LIKE 均可以使用 ~ 符号取反。好比
# 查询 ID 不在 1 到 9 之间的记录 books = session.query(Book) \ .filter(~Book.id.in_(range(1, 10))) \ .all()
查询名称包含「简史」的图书的 ID 和名称。以下
books = session.query(Book.id, Book.name) \ .filter(Book.name.contains('简史')) \ .all() print([dict(zip(v.keys(), v)) for v in books])
结果
[{'id': 6, 'name': '时间简史'}, {'id': 7, 'name': '宇宙简史'}, {'id': 9, 'name': '人类简史'}, {'id': 10, 'name': '万物简史'}]
获取分类为「科技」,且价格大于 40 的图书
# 若是 ORM 对象中定义有外键关系 # 那么 join() 中能够不指定关联关系 # 不然,必需要 books = session \ .query(Book.id, Book.name.label('book_name'), Category.name.label('cat_name')) \ .join(Category, Book.cat_id == Category.id) \ .filter(Category.name == '科技', Book.price > 40) \ .all() print([dict(zip(v.keys(), v)) for v in books])
结果
[{'id': 9, 'book_name': '人类简史', 'cat_name': '科技'}]
统计各个分类的图书的数量
from sqlalchemy import func books = session \ .query(Category.name.label('cat_name'), func.count(Book.id).label('book_num')) \ .join(Book, Category.id == Book.cat_id) \ .group_by(Category.id) \ .all() print([dict(zip(v.keys(), v)) for v in books])
结果
[{'cat_name': '文学', 'book_num': 2}, {'cat_name': '人文社科', 'book_num': 3}, {'cat_name': '科技', 'book_num': 5}]
为方便说明,咱们仅在这一小节中向 books 表中加入以下数据
+----+--------+-----------------+-------+ | id | cat_id | name | price | +----+--------+-----------------+-------+ | 11 | 5 | 人性的弱点 | 54.40 | +----+--------+-----------------+-------+
查看 ID 大于等于 9 的图书的分类信息
# outerjoin 默认是左链接 # 若是 ORM 对象中定义有外键关系 # 那么 outerjoin() 中能够不指定关联关系 # 不然,必需要 books = session \ .query(Book.id.label('book_id'), Book.name.label('book_name'), Category.id.label('cat_id'), Category.name.label('cat_name')) \ .outerjoin(Category, Book.cat_id == Category.id) \ .filter(Book.id >= 9) \ .all() print([dict(zip(v.keys(), v)) for v in books])
结果
[{'book_id': 9, 'book_name': '人类简史', 'cat_id': 3, 'cat_name': '科技'}, {'book_id': 10, 'book_name': '万物简史', 'cat_id': 3, 'cat_name': '科技'}, {'book_id': 11, 'book_name': '人性的弱点', 'cat_id': None, 'cat_name': None}]
注意最后一条记录。
当碰到复杂的查询,好比有 AND、有 OR、还有链接查询时,有时可能得不到预期的结果,这时咱们能够打出最终的 SQL 帮助咱们来查找错误。
以上一节的外链接为例说下怎么打印最终 SQL
q = session \ .query(Book.id.label('book_id'), Book.name.label('book_name'), Category.id.label('cat_id'), Category.name.label('cat_name')) \ .outerjoin(Category, Book.cat_id == Category.id) \ .filter(Book.id >= 9) raw_sql = q.statement \ .compile(compile_kwargs={"literal_binds": True}) print(raw_sql)
其中,q 为 sqlalchemy.orm.query.Query 类的对象。
结果
SELECT books.id AS book_id, books.name AS book_name, categories.id AS cat_id, categories.name AS cat_name FROM books LEFT OUTER JOIN categories ON books.cat_id = categories.id WHERE books.id >= 9
至此,SQLAlchemy ORM 经常使用的一些查询方法和技巧已介绍完毕,但愿能帮助到有须要的朋友。
原文连接:http://www.kevinbai.com/artic...
关注公众号「小小后端」获取最新文章推送!