这篇文章对优秀的开源项目Rich
的源码进行解析,OMG,盘他。为何建议阅读源码,有两个缘由,第一,单纯学语言很难在实践中灵活应用,经过阅读源码能够看到每一个知识点的运用场景,印象会更深,之后写代码的时候就能应用起来;第二,经过阅读优秀的开源代码,能够学习比人的代码规范、设计思路;第三,参与到开源社区,得到更广阔的的发展前景;第四,面试加分项。因此,有时间的话仍是建议你们多读读优秀开源项目的源码。git
下面进入今天的主题,这个开源项目的名字叫Rich
,地址:https://github.com/willmcgugan/rich (能够点击文末阅读原文
查看)。 这个项目是个英国老铁开发的,比较友好的是有中文文档。它的做用是能够在控制台输出富文本和精美的可视化格式(如:表格、进度条和markdown)。截图感觉一下github
效果看起来很酷炫,我忍不住看了一些代码,发现做者用的是Python
3.8版本实现的,好多新特性我也不了解,因此在看源码过程当中还补了一下语法基础。下面以一个例子来简单看看Rich
的源码,源码的讲解我尽可能言简意赅,重点讲解源码中涉及的一些关键的知识点。web
先捡个软柿子捏,以下:面试
from rich import print
print('Hello, [bold yellow]World[/bold yellow]!') 复制代码
输出效果:windows
能够看到对单词World
显示为粗体、红颜色。markdown
先经过一张图来看看大体流程app
简单来讲就是将文本的格式转化成标准输出可以识别的格式,而后输出便可。下面来说解源码,当咱们调用print
函数时,最终程序会跳转到console.py
文件的print
函数中,执行如下代码编辑器
调用self._collect_renderables
函数处理输入的字符串,将须要格式化的部分标出来,返回的renderables
变量是一个Text
列表,由于输入只有1个字符串,因此列表的大小为1,变量结果以下函数
Span(7, 12, 'bold red')
即是框出来须要格式化的内容。源码分析
上述代码还有一个with self
,它的做用咱们一下子再说。接着print
函数往下看
这里会遍历刚刚提到的renderables
变量,先调用render
函数渲染输入的文本,而后调用extend
函数将render
返回的结果添加到self._buffer
列表里。这里有几个知识点简单说一下
self._buffer
是函数调用,因为它加了
@property
注解,因此调用是能够不用加小括号,它返回的是
self._thread_locals.buffer
变量,该变量是
List[Segment]
类型的
self._thread_locals.buffer
变量用到
dataclasses
模块的
field
函数初始化,初始化代码为
buffer: List[Segment] = field(default_factory=list)
,
dataclasses
是
Python
3.7 版本的新引入的模块,
field
函数可提供更加灵活的初始化方式,而且该模块中的
@dataclass
注解能够为类自动添加
__init__
等方法,比较方便
extend = self._buffer.extend
这种写法将
list
的
extent
函数存到了临时变量里,后续直接经过
extend
调用该函数,比
对象名.extend
的方式更简洁。
下面咱们来看render(renderable, render_options)
函数的渲染逻辑,该函数里会调用下面的代码
render_iterable = renderable.__rich_console__(self, options)
复制代码
在函数声明里renderable
对象是RenderableType
类型的,但实际上Text
类型的,而且这两种类型没有继承关系,这里没太想明白做者为何这样搞。因此,这里的__rich_console__
函数咱们要到text.py
文件中去找。__rich_console__
函数最终会调用Text
对象的render
函数,核心代码以下:
def render(self, console: "Console", end: str = "") -> Iterable["Segment"]:
style_map = {index: get_style(span.style) for index, span in enumerated_spans} _Segment = Segment for (offset, leaving, style_id), (next_offset, _, _) in zip(spans, spans[1:]): yield _Segment(text[offset:next_offset], get_current_style()) 复制代码
调用get_style
函数,将格式转为Style
对象,如:'bold red'转成Style
对象,而后按照不一样的显示格式进行‘分片’,每一个‘片断’构造一个Segment
对象存储文本及其对应的格式。
get_style
函数会调用Style.parse(name)
生成Style
对象,核心代码以下
@lru_cache(maxsize=1024)
def parse(cls, style_definition: str) -> "Style": words = iter(style_definition.split()) for original_word in words: word = original_word.lower() if word == "on": # ...省略 elif word in style_attributes: attributes[style_attributes[word]] = True else: color = word style = Style(color=color, bgcolor=bgcolor, link=link, **attributes) return style 复制代码
参数style_definition
取值为bold red
,分割后生成['bold', 'red']列表,当word
变量等于'bold'时,会执行attributes[style_attributes[word]] = True
语句,执行后attributes
等于{'bold': true}
,它是一个字典。当word
变量等于red
时,执行color=word
语句。最终调用导数第二行构造Style
对象,Style
对象最核心的两个数据形式_attributes
和_color
, 前者是int
类型,在咱们例子中取值是1,表明'bold',即:粗体。后者表明颜色,即:'red',它是Color
类型的,该类中有个属性number
也是咱们后续要用到的。
下面来看下__rich_console__
函数返回了哪些Segment
对象
能够看到有4个,每个都有文本及其Style
对象。
回到render(renderable, render_options)
函数,刚刚介绍了__rich_console__
部分,下面还有返回的代码, 一块儿来看看
iter_render = iter(render_iterable)
for render_output in iter_render: if isinstance(render_output, Segment): yield render_output 复制代码
render_iterable
变量是__rich_console__
的返回值,即:4个Segment
对象。遍历后经过yield
方式返回。该关键字用来返回一个迭代器,也能够理解为一个列表。而且yield
返回有个特色,函数返回值只有真正被使用的时候才会执行调用函数。
这样,render(renderable, render_options)
函数就讲解完了,返回上一层extend(render(renderable, render_options))
,经过extend
函数将4个Segment
对象保存到buffer
中,结果以下
而后print
方法就执行完了。看起来已经结束了,然而控制台打印的代码貌似没有看到。答案就在刚刚的with self
中,with
关键字使得执行完代码体后,会自动调用self
的__exit__
函数。__exit__
函数中调用_render_buffer
函数进行最终的输出,核心代码以下
output: List[str] = []
append = output.append for line in Segment.split_and_crop_lines(buffer, self.width, pad=False): for text, style, is_control in line: if style and not is_control: append( style.render( text, color_system=color_system, legacy_windows=legacy_windows, ) ) rendered = "".join(output) return rendered 复制代码
split_and_crop_lines
函数是为了适应控制台的宽度,暂时忽略它。line
变量仍然是刚刚提到的4个Segment
对象,经过for text, style, is_control in line
直接将每一个Segment
对象的属性解出来并赋给text, style, is_control
变量,最终每一个style
对象都会调用render
方法完成最后的渲染。
render
方法核心代码以下
attrs = self._make_ansi_codes(color_system)
rendered = f"\x1b[{attrs}m{text}\x1b[0m" if attrs else text 复制代码
_make_ansi_codes
函数就不展开了, 其实就是利用上面提到的_attributes
和number
属性生成标准输出的可以识别的格式,返回值attrs
的结果为1;31
,1取自_attributes
表明粗体,31中的1取自number
表明颜色,其余颜色取值是不一样的,好比黄色是33,紫色是35。最后经过f-string
格式(新特性)生成rendered
变量,取值为[1;31mWorld[0m
它就是标准输出流可以识别的格式。
回到_render_buffer
函数中,调用rendered = "".join(output)
将4个渲染后的片断拼在一块儿,返回。返回后执行的代码以下:
text = self._render_buffer()
if text: self.file.write(text) 复制代码
self.file
变量的赋值语句为self.file = file or sys.stdout
,因为咱们没有定义file
变量,因此self.file
取值为sys.stdout
。最终的输出为sys.stdout.write(text)
,至此整个流程就讲解完了。若是你理解了上述逻辑,应该能够经过下面代码输出一样的效果
sys.stdout.write('Hello, \033[1;31mWorld\033[0m!')
复制代码
因此Rich
作的就是把文字格式准成标准输出流能识别的格式。
Rich
里用到的代码确实挺新的,能学到不少东西,比直接看书来的快,有兴趣的朋友能够自行阅读。欢迎关注公众号**渡码**不断分享优秀开源项目源码分析