如何经过字符串导入 Python 模块

咱们平时导入第三方模块的时候,通常使用的是import关键字,例如:python

import scrapy
from scrapy.spider import Spider
复制代码

可是若是各位同窗看过 Scrapy 的settings.py文件,就会发现里面会经过字符串的方式来指定pipeline 和 middleware,例如:git

DOWNLOADER_MIDDLEWARES = {
     'Test.middlewares.ExceptionRetryMiddleware': 545,
     'Test.middlewares.BOProxyMiddlewareV2': 543,
 }
 
  SPIDER_MIDDLEWARES = {
    'Test.middlewares.LoggingRequestMiddleware': 543,
 }
复制代码

咱们知道,这里的Test.middlewares.ExceptionRetryMiddleware实际上对应了根目录下面的Test文件夹里面的middlewares.py文件中的ExceptionRetryMiddleware类。那么 Scrapy 是如何根据这个字符串,导入这个类的呢?github

在 Scrapy 源代码中,咱们能够找到相关的代码scrapy

def load_object(path):
    """Load an object given its absolute object path, and return it. object can be a class, function, variable or an instance. path ie: 'scrapy.downloadermiddlewares.redirect.RedirectMiddleware' """

    try:
        dot = path.rindex('.')
    except ValueError:
        raise ValueError("Error loading object '%s': not a full path" % path)

    module, name = path[:dot], path[dot+1:]
    mod = import_module(module)

    try:
        obj = getattr(mod, name)
    except AttributeError:
        raise NameError("Module '%s' doesn't define any object named '%s'" % (module, name))

    return obj
复制代码

根据这段代码,咱们知道,它使用了importlib模块的import_module函数:ide

  1. 首先根据字符串路径最右侧的.把字符串路径分红两个部分,例如:Test.middlewares.LoggingRequestMiddleware分红Test.middlewaresLoggingRequestMiddleware
  2. 使用import_module导入左边的部分
  3. 从左边部分经过getattr得到具体的类

如今咱们来测试一下。咱们建立的测试文件结构以下图所示:函数

其中,pipelines.py文件的内容以下图所示:测试

main.py文件的内容以下图所示:spa

运行main.py,能够看到pipelines.py中的Pipeline类被成功执行了,以下图所示:code

相关文章
相关标签/搜索