Django rest framework之序列化小结

时间 2019-11-19

标签 django rest framework 序列小结栏目 Python 繁體版

原文原文链接

　　最近在DRF的序列化上踩过了很多坑，特此结合官方文档记录下，方便往后查阅。html

【01】前言前端

　　 serializers是什么？官网是这样的”Serializers allow complex data such as querysets and model instances to be converted to native Python datatypes that can then be easily rendered into JSON, XML or other content types. “翻译出来就是，将复杂的数据结构，例如ORM中的QuerySet或者Model实例对象转换成Python内置的数据类型，从而进一步方便数据和json，xml等格式的数据进行交互。python

　　　根据实际的工做经验，我来总结下serializers的做用：　django

　　1.将queryset与model实例等进行序列化，转化成json格式，返回给用户(api接口)。
　　2.将post与patch/put的上来的数据进行验证。
　　3.对post与patch/put数据进行处理。(后面的内容，将用patch表示put/patch更新，博主认为patch更贴近更新的说法)
　简单来讲，针对get来讲，serializers的做用体如今第一条，但若是是其余请求，serializers可以发挥2,3条的做用！编程

用一张图来讲明下它的做用：json

serializers.fieild：咱们知道在django中，form也有许多field，那serializers其实也是drf中发挥着这样的功能。咱们先简单了解经常使用的几个field。后端

1. 经常使用的field

　　CharField、BooleanField、IntegerField、DateTimeField这几个用得比较多，咱们把外键的field放到后面去说！api

参考以下的例子：服务器

# 举例子 mobile = serializers.CharField(max_length=11, min_length=11) age = serializers.IntegerField(min_value=1, max_value=100) # format能够设置时间的格式，下面例子会输出如:2018-3-20 12:10 pay_time = serializers.DateTimeField(read_only=True,format='%Y-%m-%d %H:%M') is_hot = serializers.BooleanField()  # 例如设置商品是否热销

2. Core arguments参数
read_only：True表示不容许用户本身上传，只能用于api的输出。若是某个字段设置了read_only=True，那么就不须要进行数据验证，只会在返回时，将这个字段序列化后返回
　　举个简单的例子：在用户进行购物的时候，用户post订单时，确定会产生一个订单号，而这个订单号应该由后台逻辑完成，而不该该由用户post过来，若是不设置read_only=True，那么验证的时候就会报错。再例如，咱们在网上购物时，支付时一般会产生支付状态，交易号，订单号，支付时间等字段，这些字段都应该设置为read_only=True，即这些字段都应该由后台产生而后返回给客户端；举例以下：数据结构

    pay_status = serializers.CharField(read_only=True) trade_no = serializers.CharField(read_only=True) order_sn = serializers.CharField(read_only=True) pay_time = serializers.DateTimeField(read_only=True) """  在用户提交订单的时候，咱们在这里给用户新增一个字段，就是支付宝支付的URL 要设置为read_only=True，这样的话，就不能让用户端提交了，而是服务器端生成 返回给用户的 """     alipay_url = serializers.SerializerMethodField(read_only=True)

write_only:与read_only对应;就是用户post过来的数据，后台服务器处理后不会再通过序列化后返回给客户端；最多见的就是咱们在使用手机注册的验证码和填写的密码。

required: 顾名思义，就是这个字段是否必填，例如要求：用户名，密码等是必须填写的；不填写就直接报错
allow_null/allow_blank：是否容许为NULL/空。
error_messages：出错时，信息提示。
例如咱们在定义用户注册序列化类时：

 code = serializers.CharField(required=True, write_only=True, label="验证码", max_length=6, min_length=6, error_messages={ "blank": "请输入验证码", "required": "请输入验证码", #当用户不输入时提示的错误信息 "max_length": "验证码格式错误", "min_length": "验证码格式错误" }, help_text="验证码") """  验证用户名是否存在，allow_blank 不能为空；表示不容许用户名为空 """     username = serializers.CharField(required=True, allow_blank=False, label="用户名", validators=[UniqueValidator(queryset=User.objects.all(), message="用户已经存在")]) # 同理咱们也应该将password设置write_only参数，不让它返回回去，这样容易被截获 password = serializers.CharField( style={'input_type': 'password'}, help_text="密码", label="密码", write_only=True)

label: 字段显示设置，如 label=’验证码’

help_text: 在指定字段增长一些提示文字，这两个字段做用于api页面比较有用
style: 说明字段的类型，这样看可能比较抽象，看下面例子：

# 在api页面，输入密码就会以*显示 password = serializers.CharField( style={'input_type': 'password'}) # 会显示选项框 color_channel = serializers.ChoiceField( choices=['red', 'green', 'blue'], style={'base_template': 'radio.html'})

3. HiddenField

HiddenField的值不依靠输入，而须要设置默认的值，不须要用户本身post数据过来，也不会显式返回给用户，最经常使用的就是user!!
　　咱们在登陆状况下，进行一些操做，假设一个用户去收藏了某一门课，那么后台应该自动识别这个用户，而后用户只须要将课程的id post过来，那么这样的功能，咱们配合CurrentUserDefault()实现。

# 这样就能够直接获取到当前用户 user = serializers.HiddenField( default=serializers.CurrentUserDefault())

再例如，咱们在收藏某件商品的时候，后台要获取到当前的用户；至关于前台只须要传递过来一个商品的ID便可；那么在后台我根据当前的登入用户和当前的商品ID便可判断用户是否收藏过该商品；这就是一个联合惟一主键的判断；这一样须要使用HiddenField。

save instance
　　这个标题是官方文档的一个小标题，我以为用的很好，一眼看出，这是为post和patch所设置的，没错，这一部分功能是专门为这两种请求所设计的，若是只是简单的get请求，那么在设置了前面的field可能就可以知足这个需求。
　　咱们在view以及mixins的博客中说起到，post请求对应create方法，而patch请求对应update方法，这里提到的create方法与update方法，是指mixins中特定类中的方法。咱们看一下源代码，源代码具体分析能够参考个人另一篇博客：

# 只截取一部分 class CreateModelMixin(object): def create(self, request, *args, **kwargs): serializer = self.get_serializer(data=request.data) serializer.is_valid(raise_exception=True) self.perform_create(serializer) headers = self.get_success_headers(serializer.data) return Response(serializer.data, status=status.HTTP_201_CREATED, headers=headers) def perform_create(self, serializer): serializer.save() class UpdateModelMixin(object): def update(self, request, *args, **kwargs): partial = kwargs.pop('partial', False) instance = self.get_object() serializer = self.get_serializer(instance, data=request.data, partial=partial) serializer.is_valid(raise_exception=True) self.perform_update(serializer) if getattr(instance, '_prefetched_objects_cache', None): # If 'prefetch_related' has been applied to a queryset, we need to # forcibly invalidate the prefetch cache on the instance. instance._prefetched_objects_cache = {} return Response(serializer.data) def perform_update(self, serializer): serializer.save()

能够看出，不管是create与update都写了一行：serializer.save( )，那么，这一行，到底作了什么事情，分析一下源码。

在serializer.py文件中：

    def save(self, **kwargs): assert not hasattr(self, 'save_object'), ( 'Serializer `%s.%s` has old-style version 2 `.save_object()` '
            'that is no longer compatible with REST framework 3. '
            'Use the new-style `.create()` and `.update()` methods instead.' % (self.__class__.__module__, self.__class__.__name__) ) assert hasattr(self, '_errors'), ( 'You must call `.is_valid()` before calling `.save()`.' ) assert not self.errors, ( 'You cannot call `.save()` on a serializer with invalid data.' ) # Guard against incorrect use of `serializer.save(commit=False)` assert 'commit' not in kwargs, ( "'commit' is not a valid keyword argument to the 'save()' method. "
            "If you need to access data before committing to the database then "
            "inspect 'serializer.validated_data' instead. "
            "You can also pass additional keyword arguments to 'save()' if you "
            "need to set extra attributes on the saved model instance. "
            "For example: 'serializer.save(owner=request.user)'.'" ) assert not hasattr(self, '_data'), ( "You cannot call `.save()` after accessing `serializer.data`."
            "If you need to access data before committing to the database then "
            "inspect 'serializer.validated_data' instead. " ) validated_data = dict( list(self.validated_data.items()) + list(kwargs.items()) ) if self.instance is not None: self.instance = self.update(self.instance, validated_data) assert self.instance is not None, ( '`update()` did not return an object instance.' ) else: self.instance = self.create(validated_data) assert self.instance is not None, ( '`create()` did not return an object instance.' ) return self.instance

显然，serializer.save的操做，它去调用了serializer的create或update方法，不是mixins中的！！！咱们看一下流程图（以post为例）：

讲了那么多，咱们到底须要干什么！重载这两个方法！！

　　若是你的viewset含有post，那么你须要重载create方法，若是含有patch，那么就须要重载update方法。

# 假设如今是个博客，有一个建立文章，与修改文章的功能, model为Article。 class ArticleSerializer(serializers.Serializer): user = serializers.HiddenField( default=serializers.CurrentUserDefault()) name = serializers.CharField(max_length=20) content = serializers.CharField() def create(self, validated_data): # 除了用户，其余数据能够从validated_data这个字典中获取 # 注意，users在这里是放在上下文中的request，而不是直接的request user = self.context['request'].user name = validated_data['name '] content = validated_data['content '] return Article.objects.create(**validated_data) def update(self, instance, validated_data): # 更新的特别之处在于你已经获取到了这个对象instance instance.name = validated_data.get('name') instance.content = validated_data.get('content') instance.save() return instance

可能会有人好奇，系统是怎么知道，咱们须要调用serializer的create方法，仍是update方法，咱们从save( )方法能够看出，判断的依据是：

if self.instance is not None:pass

那么咱们的mixins的create与update也已经在为开发者设置好了：

# CreateModelMixin serializer = self.get_serializer(data=request.data) # UpdateModelMixin serializer = self.get_serializer(instance, data=request.data, partial=partial)

也就是说，在update经过get_object( )的方法获取到了instance，而后传递给serializer，serializer再根据是否有传递instance来判断来调用哪一个方法！

Validation自定义验证逻辑
单独的validate (这个就相似于Django中Form中的局部钩子函数)
　　咱们在上面提到field，它能起到必定的验证做用，但很明显，它存在很大的局限性，举个简单的例子，咱们要判断咱们手机号码，若是使用CharField(max_length=11, min_length=11），它只能确保咱们输入的是11个字符，那么咱们须要自定义！就拿笔者在实际生产环境下的例子来讲，光针对用户输入的手机号码，咱们在后端就须要进行验证，例如该手机号码是否注册，手机号码是否合法(例如知足手机号码的zhengze表达式，以及要验证该手机号码向后台发送请求验证短信的频率等等)

class SmsSerializer(serializers.Serializer): """  为什不用ModelSerializer来完成手机号码的验证呢？ 由于VerifyCode中还有一个字段是手机验证码字段，直接使用ModelSerializer来验证会报错 由于ModelSerializer会自动生成VerifyCode模型中的全部字段；可是 咱们传递过来的就是一个手机号，判断它是不是合法的 所以使用Serializer来自定义合法性校验规则，至关于就是钩子函数 单独对手机号码进行验证 """     mobile = serializers.CharField(max_length=11) 　　# 使用validate_字段名(self, 字段名)：要么返回字段，要么抛出异常 def validate_mobile(self, mobile): """  验证手机号码，记住这里的validate_字段名必定要是数据模型中的字段 :param attrs: :return: """  # 手机号码是否注册，查询UserProfile表便可 if User.objects.filter(mobile=mobile).exists(): raise serializers.ValidationError("用户已经存在") # 验证手机号码是否合法，这部分应该是在前端作的，固然后台也须要进行验证 if not re.match(REGEX_MOBILE, mobile): raise serializers.ValidationError("手机号码格式不正确") # 验证发送频率，若是不作，用户能够一直向后台发送，请求验证码； # 会形成很大的压力，限制一分钟只能发送一次 7-8 09:00 one_minute_ago = datetime.now() - timedelta(hours=0, minutes=1, seconds=0) """  若是添加时间在一分钟之内，它确定是大于你一分钟以前的时间的 若是这条记录存在 """         if VerifyCode.objects.filter(add_time__gt=one_minute_ago, mobile=mobile): raise serializers.ValidationError("抱歉，一分钟只能发送一次") # 若是验证经过，我就将这个mobile返回去，这里必定要有一个返回 return mobile

联合validate 这个就相似于全局钩子函数

　　上面验证方式，只能验证一个字段，若是是两个字段联合在一块儿进行验证，那么咱们就能够重载validate( )方法。

　　 start = serializers.DateTimeField() finish = serializers.DateTimeField() def validate(self, attrs): # 传进来什么参数，就返回什么参数，通常状况下用attrs if data['start'] > data['finish']: raise serializers.ValidationError("finish must occur after start") return attrs

这个方法很是的有用，咱们还能够再这里对一些read_only的字段进行操做，咱们在read_only说起到一个例子，订单号的生成，咱们能够在这步生成一个订单号，而后添加到attrs这个字典中。看以下的代码：

class OrderSerializer(serializers.ModelSerializer): user = serializers.HiddenField( default=serializers.CurrentUserDefault() ) pay_status = serializers.CharField(read_only=True) trade_no = serializers.CharField(read_only=True) order_sn = serializers.CharField(read_only=True) pay_time = serializers.DateTimeField(read_only=True) """  在用户提交订单的时候，咱们在这里给用户新增一个字段，就是支付宝支付的URL 要设置为read_only=True，这样的话，就不能让用户端提交了，而是服务器端生成 返回给用户的 """     alipay_url = serializers.SerializerMethodField(read_only=True) def get_alipay_url(self, obj): # obj就是OrderSerializer对象 alipay = AliPay( appid="2016091200490227", # 沙箱环境中能够找到 app_notify_url="http://47.92.87.172:8000/alipay/return/", app_private_key_path=private_key_path, # 我的私钥 alipay_public_key_path=ali_pub_key_path, # 支付宝的公钥，验证支付宝回传消息使用，不是你本身的公钥, debug=True, # 默认False,上线的时候修改成False便可 return_url="http://47.92.87.172:8000/alipay/return/" ) url = alipay.direct_pay( # 一个订单里面可能有多个商品，所以subject # 不适合使用商品名称 subject=obj.order_sn, out_trade_no=obj.order_sn, total_amount=obj.order_mount, ) re_url = "https://openapi.alipaydev.com/gateway.do?{data}".format(data=url) return re_url def generate_order_sn(self): """  后台系统生成订单号 这个是系统后台生成的： 当前时间+userId+随机数 """         random_ins = Random() order_sn = "{time_str}{user_id}{random_num}".format(time_str=time.strftime("%Y%m%d%H%M%S"), user_id=self.context["request"].user.id, random_num=random_ins.randint(1000, 9999)) return order_sn def validate(self, attrs): # 全局钩子函数 attrs["order_sn"] = self.generate_order_sn() return attrs class Meta: model = OrderInfo fields = "__all__"

这个方法运用在modelserializer中，能够剔除掉write_only的字段，这个字段只验证，但不存在于指定的model当中，即不能save( )，能够在这delete掉；例如短信验证码验证完毕后就能够删除了：

 def validate(self, attrs): """  判断完毕后删除验证码，由于没有什么用了 """         attrs["mobile"] = attrs["username"] del attrs["code"] return attrs

Validators

validators能够直接做用于某个字段，这个时候，它与单独的validate做用差很少；固然，drf提供的validators还有很好的功能：UniqueValidator，UniqueTogetherValidator等；UniqueValidator: 指定某一个对象是惟一的，如，用户名只能存在惟一：

    username = serializers.CharField(required=True, allow_blank=False, label="用户名", max_length=16, min_length=6, validators=[UniqueValidator(queryset=User.objects.all(), message="用户已经存在")], error_messages={ "blank": "用户名不容许为空", "required": "请输入用户名", "max_length": "用户名长度最长为16位", "min_length": "用户名长度至少为6位" })

UniqueTogetherValidator: 联合惟一，例如咱们须要判断用户是否收藏了某个商品，前端只须要传递过来一个商品ID便可。这个时候就不是像上面那样单独做用于某个字段，而是须要进行联合惟一的判断，即用户ID和商品ID；此时咱们须要在Meta中设置。

class UserFavSerializer(serializers.ModelSerializer): # 获取到当前用户 user = serializers.HiddenField( default=serializers.CurrentUserDefault() ) class Meta: model = UserFav """  咱们须要获取的是当前登入的user 之后要取消收藏，只须要获取这里的id便可 UniqueTogetherValidator做用在多个字段之上 由于是联合惟一主键 """         validators = [ UniqueTogetherValidator( queryset=UserFav.objects.all(), fields=('user', 'goods'), message="已经收藏" ) ] fields = ("user", "goods", "id")

ModelSerializer

　　讲了不少Serializer的，在这个时候，我仍是强烈建议使用ModelSerializer，由于在大多数状况下，咱们都是基于model字段去开发。

好处：

　　ModelSerializer已经重载了create与update方法，它可以知足将post或patch上来的数据进行进行直接地建立与更新，除非有额外需求，那么就能够重载create与update方法。
　　ModelSerializer在Meta中设置fields字段，系统会自动进行映射，省去每一个字段再写一个field。

class UserDetailSerializer(serializers.ModelSerializer): """  用户详情序列化 """ 
    class Meta: model = User fields = ("name", "gender", "birthday", "email", "mobile") # fields = '__all__': 表示全部字段 # exclude = ('add_time',): 除去指定的某些字段 # 这三种方式，存在一个便可

ModelSerializer须要解决的2个问题：

　　1，某个字段不属于指定model，它是write_only，须要用户传进来，但咱们不能对它进行save( )，由于ModelSerializer是基于Model，这个字段在Model中没有对应，这个时候，咱们须要重载validate！
如在用户注册时，咱们须要填写验证码，这个验证码只须要验证，不须要保存到用户这个Model中：

 def validate(self, attrs): del attrs["code"] return attrs

　　2，某个字段不属于指定model，它是read_only，只须要将它序列化传递给用户，可是在这个model中，没有这个字段！咱们须要用到SerializerMethodField。
　　假设须要返回用户加入这个网站多久了，不可能维持这样加入的天数这样一个数据，通常会记录用户加入的时间点，而后当用户获取这个数据，咱们再计算返回给它。

class UserSerializer(serializers.ModelSerializer): days_since_joined = serializers.SerializerMethodField() # 方法写法：get_ + 字段 def get_days_since_joined(self, obj): # obj指这个model的对象 return (now() - obj.date_joined).days class Meta: model = User

固然，这个的SerializerMethodField用法还相对简单一点，后面还会有比较复杂的状况。

关于外键的serializers

　　讲了那么多，终于要研究一下外键啦~
　　其实，外键的field也比较简单，若是咱们直接使用serializers.Serializer，那么直接用PrimaryKeyRelatedField就解决了。
　　假设如今有一门课python入门教学(course)，它的类别是python(catogory)。

# 指定queryset category = serializers.PrimaryKeyRelatedField(queryset=CourseCategory.objects.all(), required=True)

ModelSerializer就更简单了，直接经过映射就行了
不过这样只是用户得到的只是一个外键类别的id，并不能获取到详细的信息，若是想要获取到具体信息，那须要嵌套serializer：

category = CourseCategorySerializer()

注意：上面两种方式，外键都是正向取得，下面介绍怎么反向去取，如，咱们须要获取python这个类别下，有什么课程。
　　首先，在课程course的model中，须要在外键中设置related_name：

class Course(model.Model): category = models.ForeignKey(CourseCategory, related_name='courses')

# 反向取课程，经过related_name # 一对多，一个类别下有多个课程，必定要设定many=True courses = CourseSerializer(many=True)

写到这里，咱们的外键就基本讲完了！还有一个小问题：咱们在上面提到ModelSerializer须要解决的第二个问题中，其实还有一种状况，就是某个字段属于指定model，但不能获取到相关数据。
　　假设如今是一个多级分类的课程，例如，编程语言–>python–>python入门学习课程，编程语言与python属于类别，另一个属于课程，编程语言类别是python类别的一个外键，并且属于同一个model，实现方法：

parent_category = models.ForeignKey('self', null=True, blank=True, verbose_name='父类目别', related_name='sub_cat')

如今获取编程语言下的课程，显然没法直接获取到python入门学习这个课程，由于它们两没有外键关系。SerializerMethodField( )也能够解决这个问题，只要在自定义的方法中实现相关的逻辑便可！

courses = SerializerMethodField() def get_courses(self, obj): all_courses = Course.objects.filter(category__parent_category_id=obj.id) courses_serializer = CourseSerializer(all_course, many=True, context={'request': self.context['request']}) return courses_serializer.data

上面的例子看起来有点奇怪，由于咱们在SerializerMethodField()嵌套了serializer，就须要本身进行序列化，而后再从data就能够取出json数据。
　　能够看到传递的参数是分别是：queryset，many=True多个对象，context上下文。这个context十分关键，若是不将request传递给它，在序列化的时候，图片与文件这些Field不会再前面加上域名，也就是说，只会有/media/img…这样的路径！

　　以上就是关于DRF的Serializer的小结，若是有错漏，烦请指正，后面我将把本身工做中遇到的坑分享出来，但愿对你们有帮助！