如今有一张记录用户信息的UserInfo
数据表,表中记录了10个用户的姓名,呢称,年龄,工做等信息.html
models文件python
from django.db import models class Job(models.Model): title=models.CharField(max_length=32) class UserInfo(models.Model): username=models.CharField(max_length=32) nickname=models.CharField(max_length=32) job=models.ForeignKey(to="Job",to_field="id",null=True)
数据表中记录:linux
另外一张数据表记录用户工做的Job表,关联用户的工做字段.golang
要查出每一个用户的用户名,呢称和工做等信息数据库
def index(request): user_list=models.UserInfo.objects.all() print(user_list.query) # 打印查询时使用的语句 print(type(user_list)) # 打印查询结果的数据类型 for user in user_list: print("%s-->%s-->%s" %(user.username,user.nickname,user.job.title)) return render(request,'index.html')
打印信息:django
SELECT "app01_userinfo"."id", "app01_userinfo"."username", "app01_userinfo"."nickname", "app01_userinfo"."job_id" FROM "app01_userinfo" <class 'django.db.models.query.QuerySet'> user1-->user1-->python user2-->user2-->linux user3-->user3-->golang user4-->user4-->python user5-->user5-->linux user6-->user6-->golang user7-->user7-->python user8-->user8-->linux user9-->user9-->golang user10-->user10-->linux
在服务端进行这些操做,这些查询语句的性能是很低的,遍历取出这10个用户的姓名,呢称,工做等信息要在两张数据库中执行11次查询操做.后端
首先只从UserInfo表中查出全部的用户记录,须要执行一次查询操做.app
查询Job数据表,每循环一次用户信息的列表,都须要从Job表中查询一次用户的工做信息.函数
数据表中总共记录了10条用户记录,因此还须要循环10次才能从Job表中查询完成全部用户的工做信息.因此一共须要执行11次数据库查询操做.性能
那有没有什么好的方法可以提升数据库查询的效率呢???
def index(request): user_list=models.UserInfo.objects.values("username","nickname","job") print(user_list.query) # 打印查询时使用的语句 print(type(user_list)) # 打印查询结果的数据类型 print("user_list:",user_list) for user in user_list: print(user["username"], user["nickname"], user["job"]) return render(request,'index.html')
运行程序,在服务端后台打印信息:
SELECT "app01_userinfo"."username", "app01_userinfo"."nickname", "app01_userinfo"."job_id" FROM "app01_userinfo" <class 'django.db.models.query.QuerySet'> user_list: <QuerySet [{'username': 'user1', 'nickname': 'user1', 'job': 1}, {'username': 'user2', 'nickname': 'user2', 'job': 2}, {'username': 'user3', 'nickname': 'user3', 'job': 3}, {'username': 'user4', 'nickname': 'user4', 'job': 1}, {'username': 'user5', 'nickname': 'user5', 'job': 2}, {'username': 'user6', 'nickname': 'user6', 'job': 3}, {'username': 'user7', 'nickname': 'user7', 'job': 1}, {'username': 'user8', 'nickname': 'user8', 'job': 2}, {'username': 'user9', 'nickname': 'user9', 'job': 3}, {'username': 'user10', 'nickname': 'user10', 'job': 2}]> user1 user1 1 user2 user2 2 user3 user3 3 user4 user4 1 user5 user5 2 user6 user6 3 user7 user7 1 user8 user8 2 user9 user9 3 user10 user10 2
能够看到,查询的结果user_list依然是一个QuerySet
,但这个对象集合内部倒是一个字典.
并且此次的查询只执行了两次数据库查询操做.
经过这种方式,只须要两次查询就能获得想要的数据,优化了数据库的查询效率.
Django数据库优化操做之select_related主动联表查询
上面的例子里,取对象集合的时候,难道只能查询当前数据表,不能查询其余数据表吗??
固然不是,在这里还可使用select_related
这个方法.
在第一次查询的时候,在all()后面加上一个select_related
来作主动的联表查询.
在建立这两张数据表时,job在UserInfo
数据表中是作为一个ForeignKey
存在的,因此加上select_related
后不只只查询到了UserInfo数据库的记录,同时也查询了Job数据表中的记录.
def index(request): user_list=models.UserInfo.objects.all().select_related("job") print(user_list.query) # 打印查询时使用的语句 print(type(user_list)) # 打印查询结果的数据类型 print("user_list:",user_list) for user in user_list: print("%s-->%s-->%s" %(user.username,user.nickname,user.job.title)) return render(request,'index.html')
服务端打印结果
SELECT "app01_userinfo"."id", "app01_userinfo"."username", "app01_userinfo"."nickname", "app01_userinfo"."job_id", "app01_job"."id", "app01_job"."title" FROM "app01_userinfo" LEFT OUTER JOIN "app01_job" ON ("app01_userinfo"."job_id" = "app01_job"."id") <class 'django.db.models.query.QuerySet'> user_list: <QuerySet [<UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>]> user1-->user1-->python user2-->user2-->linux user3-->user3-->golang user4-->user4-->python user5-->user5-->linux user6-->user6-->golang user7-->user7-->python user8-->user8-->linux user9-->user9-->golang user10-->user10-->linux
查看打印出来的查询语句,其中有"FROM "app01_userinfo" LEFT OUTER JOIN "app01_job" ON ("app01_userinfo"."job_id" = "app01_job"."id")"
用来作联表查询,只须要一次就能够查询全部的数据了.
一样的,若是还想继续联表,例如在Job表中再加一个外键字段desc,只须要在查询语句中把desc加入进来就能够了
user_list=models.UserInfo.objects.all().select_related("job__desc")
这样一来就把三张表联系起来作联表查询了,可是必定要确保所加的字段为ForeignKey
.
若是使用相似models.UserInfo.objects.all()
语句进行查询时,不要作跨表查询,只查询当前表中有的数据,不然查询语句的性能会降低不少.
若是想查其余表中的数据,就加上select_related(ForeignKey字段名)
;
若是想取多个ForeignKey
字段的数据,则可使用select_related(ForeignKey字段1,ForeignKey字段2,...)
联表查询操做性能也会下降,select_related
就是用来作主动联表查询的.
Django数据库优化操做之perfetch_related非主动联表查询
perfetch_related
方法是既非主动联表查询,又不进行不少查询语句的一种折衷方案
修改视图函数index
def index(request): user_list=models.UserInfo.objects.all().prefetch_related("job") print(user_list.query) # 打印查询时使用的语句 print(type(user_list)) # 打印查询结果的数据类型 print("user_list:",user_list) for user in user_list: print("%s-->%s-->%s" %(user.username,user.nickname,user.job.title)) return render(request,'index.html')
后端打印结果
SELECT "app01_userinfo"."id", "app01_userinfo"."username", "app01_userinfo"."nickname", "app01_userinfo"."job_id" FROM "app01_userinfo" <class 'django.db.models.query.QuerySet'> user_list: <QuerySet [<UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>]> user1-->user1-->python user2-->user2-->linux user3-->user3-->golang user4-->user4-->python user5-->user5-->linux user6-->user6-->golang user7-->user7-->python user8-->user8-->linux user9-->user9-->golang user10-->user10-->linux
使用prefetch_related
方法未联表执行两次查询操做
先查询用户表中的全部数据,把用户表中全部的job_id所有查询出来,并执行去重操做;
结果查询出用户的3种工做,接下来执行"select"语句查询"Job"数据表中的"title"字段
这样一来就只执行了两次数据表的查询操做
在prefetch_related
方法中加入一个字段"job",执行了两次数据库查询操做;
若是再加一个字段,则会再多加一次数据为操做操做.
Django数据库优化操做之only方法
def index(request): user_list=models.UserInfo.objects.all().only("username") print(user_list.query) # 打印查询时使用的语句 print(type(user_list)) # 打印查询结果的数据类型 print("user_list:",user_list) for user in user_list: print("%s-->%s" %(user.username,user.nickname)) return render(request,'index.html')
服务端后台打印信息
SELECT "app01_userinfo"."id", "app01_userinfo"."username" FROM "app01_userinfo" <class 'django.db.models.query.QuerySet'> user_list: <QuerySet [<UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>]> user1-->user1 user2-->user2 user3-->user3 user4-->user4 user5-->user5 user6-->user6 user7-->user7 user8-->user8 user9-->user9 user10-->user10
执行查询操做的时候加上only
方法,其查询结果仍是一个对象集合,可是从打印出的查询语句能够看到,执行查询操做时只查询了用户的id字段和username字段,并无查询nickname字段.
可是在后面的循环中,又能够打印用户的nikename信息.为何呢,由于又执行了一次查询的请求操做.由此得知,查询操做使用了only方法,在only方法中加入哪一个查询字段,在后面就使用哪一个查询字段.
加only
参数是从查询结果中只取某个字段,而另一个defer
方法则是从查询结果中排除某个字段
Django数据库优化操做之defer方法
修改index视图函数
def index(request): user_list=models.UserInfo.objects.all().defer("username") print(user_list.query) # 打印查询时使用的语句 print(type(user_list)) # 打印查询结果的数据类型 print("user_list:",user_list) for user in user_list: print("%s" % user.nickname) return render(request,'index.html')
服务端打印信息
SELECT "app01_userinfo"."id", "app01_userinfo"."nickname", "app01_userinfo"."job_id" FROM "app01_userinfo" <class 'django.db.models.query.QuerySet'> user_list: <QuerySet [<UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>, <UserInfo: UserInfo object>]> user1 user2 user3 user4 user5 user6 user7 user8 user9 user10
经过打印的查询语句能够知道,使用defer
方法后,只从数据库中查询了用户的id字段和用户的nickname字段操做,并无查询username字段,由此也能够提升Django查询数据库的性能.