Django 的 filter、exclude 等方法使得对数据库的查询很方便了。这在数据量较小的时候还不错,但若是数据量很大,或者查询条件比较复杂,那么查询效率就会很低。git
提升数据库查询效率能够经过原生 SQL 语句来实现,可是它的缺点就是须要开发者熟练掌握 SQL。假若查询条件是动态变化的,则编写 SQL 会更加困难。数据库
对于以便捷著称的 Django,怎么能忍受这样的事。因而就有了Aggregation聚合。django
聚合最好的例子就是官网给的案例了:翻译
# models.py from django.db import models class Author(models.Model): name = models.CharField(max_length=100) age = models.IntegerField() class Publisher(models.Model): name = models.CharField(max_length=300) class Book(models.Model): name = models.CharField(max_length=300) pages = models.IntegerField() price = models.DecimalField(max_digits=10, decimal_places=2) rating = models.FloatField() authors = models.ManyToManyField(Author) publisher = models.ForeignKey(Publisher, on_delete=models.CASCADE) pubdate = models.DateField() class Store(models.Model): name = models.CharField(max_length=300) books = models.ManyToManyField(Book)
接下来能够这样求全部书籍的平均价格:code
>>> from django.db.models import Avg, Max, Min >>> Book.objects.all().aggregate(Avg('price')) {'price__avg': Decimal('30.67')}
实际上能够省掉 all()
:排序
>>> Book.objects.aggregate(Avg('price')) {'price__avg': Decimal('30.67')}
还能够指定返回的键名:ci
>>> Book.objects.aggregate(price_avg=Avg('price')) {'price_avg': Decimal('30.67')}
若是要获取全部书籍中的最高价格:开发
>>> Book.objects.aggregate(Max('price')) {'price__max': Decimal('44')}
获取全部书籍中的最低价格:文档
>>> Book.objects.aggregate(Min('price')) {'price__min': Decimal('12')}
aggregate()
方法返回的再也不是 QuerySet
了,而是一个包含查询结果的字典。若是我要对 QerySet
中每一个元素都进行聚合计算、而且返回的仍然是 QuerySet
,那就要用到 annotate()
方法了。get
annotate
翻译过来就是注解,它的做用有点像给 QuerySet
中的每一个元素临时贴上一个临时的字段,字段的值是分组聚合运算的结果。
比方说要给查询集中的每本书籍都增长一个字段,字段内容是外链到书籍的做者的数量:
>>> from django.db.models import Count >>> q = Book.objects.annotate(Count('authors')) >>> q[0].authors__count 3
与 aggregate()
的语法相似,也能够给这个字段自定义个名字:
>>> q = Book.objects.annotate(a_count=Count('authors'))
跨外链查询字段也是能够的:
>>> s = Store.objects.annotate(min_price=Min('books__price'), max_price=Max('books__price')) >>> s[0].min_price Decimal('12') >>> s[0].max_price Decimal('44')
既然 annotate()
返回的是查询集,那么天然也能够和 filter()
、exclude()
等查询方法组合使用:
>>> b = Book.objects.filter(name__startswith="Django").annotate(num_authors=Count('authors')) >>> b[0].num_authors 4
联用的时候 filter
、annotate
的顺序会影响返回结果,因此逻辑要想清楚。
也能够排序:
>>> Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')
总而言之,aggregate
和 annotate
用于组合查询。当你须要对某些字段进行聚合操做时(好比Sum, Avg, Max),请使用 aggregate
。若是你想要对数据集先进行分组(Group By)而后再进行某些聚合操做或排序时,请使用 annotate
。
进行此类查询有时候容易让人迷惑,若是你对查询的结果有任何的疑问,最好的方法就是直接查看它所执行的 SQL 原始语句,像这样:
>>> b = Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors') >>> print(b.query) SELECT "aggregation_book"."id", "aggregation_book"."name", "aggregation_book"."pages", "aggregation_book"."price", "aggregation_book"."rating", "aggregation_book"."publisher_id", "aggregation_book"."pubdate", COUNT("aggregation_book_authors"."author_id") AS "num_authors" FROM "aggregation_book" LEFT OUTER JOIN "aggregation_book_authors" ON ("aggregation_book"."id" = "aggregation_book_authors"."book_id") GROUP BY "aggregation_book"."id", "aggregation_book"."name", "aggregation_book"."pages", "aggregation_book"."price", "aggregation_book"."rating", "aggregation_book"."publisher_id", "aggregation_book"."pubdate" ORDER BY "num_authors" ASC
相关文档: Aggregation复合使用聚合时的相互干扰问题:Count and Sum annotations interfere with each other