Django 中 Aggregation聚合的使用

时间 2021-02-17

标签 git 数据库 django 翻译 code 排序开发文档 get 栏目 Python 繁體版

原文原文链接

Django 的 filter、exclude 等方法使得对数据库的查询很方便了。这在数据量较小的时候还不错，但若是数据量很大，或者查询条件比较复杂，那么查询效率就会很低。git

提升数据库查询效率能够经过原生 SQL 语句来实现，可是它的缺点就是须要开发者熟练掌握 SQL。假若查询条件是动态变化的，则编写 SQL 会更加困难。数据库

对于以便捷著称的 Django，怎么能忍受这样的事。因而就有了Aggregation聚合。django

聚合最好的例子就是官网给的案例了：翻译

# models.py

from django.db import models

class Author(models.Model):
    name = models.CharField(max_length=100)
    age = models.IntegerField()

class Publisher(models.Model):
    name = models.CharField(max_length=300)

class Book(models.Model):
    name = models.CharField(max_length=300)
    pages = models.IntegerField()
    price = models.DecimalField(max_digits=10, decimal_places=2)
    rating = models.FloatField()
    authors = models.ManyToManyField(Author)
    publisher = models.ForeignKey(Publisher, on_delete=models.CASCADE)
    pubdate = models.DateField()

class Store(models.Model):
    name = models.CharField(max_length=300)
    books = models.ManyToManyField(Book)

接下来能够这样求全部书籍的平均价格：code

>>> from django.db.models import Avg, Max, Min

>>> Book.objects.all().aggregate(Avg('price'))
{'price__avg': Decimal('30.67')}

实际上能够省掉 all() ：排序

>>> Book.objects.aggregate(Avg('price'))
{'price__avg': Decimal('30.67')}

还能够指定返回的键名：ci

>>> Book.objects.aggregate(price_avg=Avg('price'))
{'price_avg': Decimal('30.67')}

若是要获取全部书籍中的最高价格：开发

>>> Book.objects.aggregate(Max('price'))
{'price__max': Decimal('44')}

获取全部书籍中的最低价格：文档

>>> Book.objects.aggregate(Min('price'))
{'price__min': Decimal('12')}

aggregate() 方法返回的再也不是 QuerySet 了，而是一个包含查询结果的字典。若是我要对 QerySet 中每一个元素都进行聚合计算、而且返回的仍然是 QuerySet ，那就要用到 annotate() 方法了。get

annotate 翻译过来就是注解，它的做用有点像给 QuerySet 中的每一个元素临时贴上一个临时的字段，字段的值是分组聚合运算的结果。

比方说要给查询集中的每本书籍都增长一个字段，字段内容是外链到书籍的做者的数量：

>>> from django.db.models import Count

>>> q = Book.objects.annotate(Count('authors'))
>>> q[0].authors__count
3

与 aggregate() 的语法相似，也能够给这个字段自定义个名字：

>>> q = Book.objects.annotate(a_count=Count('authors'))

跨外链查询字段也是能够的：

>>> s = Store.objects.annotate(min_price=Min('books__price'), max_price=Max('books__price'))

>>> s[0].min_price
Decimal('12')
>>> s[0].max_price
Decimal('44')

既然 annotate() 返回的是查询集，那么天然也能够和 filter()、exclude() 等查询方法组合使用：

>>> b = Book.objects.filter(name__startswith="Django").annotate(num_authors=Count('authors'))
>>> b[0].num_authors
4

联用的时候 filter 、annotate 的顺序会影响返回结果，因此逻辑要想清楚。

也能够排序：

>>> Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')

总而言之，aggregate 和 annotate 用于组合查询。当你须要对某些字段进行聚合操做时（好比Sum， Avg， Max），请使用 aggregate 。若是你想要对数据集先进行分组（Group By）而后再进行某些聚合操做或排序时，请使用 annotate 。

进行此类查询有时候容易让人迷惑，若是你对查询的结果有任何的疑问，最好的方法就是直接查看它所执行的 SQL 原始语句，像这样：

>>> b = Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')
>>> print(b.query)
SELECT "aggregation_book"."id", "aggregation_book"."name",
"aggregation_book"."pages", "aggregation_book"."price",
"aggregation_book"."rating", "aggregation_book"."publisher_id", 
"aggregation_book"."pubdate", COUNT("aggregation_book_authors"."author_id") 
AS "num_authors" FROM "aggregation_book" LEFT OUTER JOIN "aggregation_book_authors" 
ON ("aggregation_book"."id" = "aggregation_book_authors"."book_id") 
GROUP BY "aggregation_book"."id", "aggregation_book"."name",
"aggregation_book"."pages", "aggregation_book"."price",
"aggregation_book"."rating", "aggregation_book"."publisher_id", 
"aggregation_book"."pubdate"
ORDER BY "num_authors" ASC

相关文档： Aggregation
复合使用聚合时的相互干扰问题：Count and Sum annotations interfere with each other