关卡地址:http://www.pythonchallenge.com/pc/def/equality.html
关卡是寻找两边都被三个大字母包围的小字母。
代码能够参考上一小节的。
代码以下:html
# -*- coding: UTF-8 -*- import urllib.request import re import string url = urllib.request.urlopen('http://www.pythonchallenge.com/pc/def/equality.html') page = url.read().decode('utf8') # 在Python中urlopen返回的response是byte类,须要转成string类 pattern = re.compile(r'<!--[^>]*?-->') # 注释是在<!-- 和-->,这里使用?是想最短匹配,不过好像不加也没有影响 m = re.findall(pattern, page) #print(m) pattern = re.compile(r'(?<=[a-z][A-Z]{3})([a-z])(?=[A-Z]{3}[a-z])') print(''.join(re.findall(pattern, ''.join(m))))
这段代码主要是考察re正则表达式的使用,其中(?<=...)是前缀匹配,可是不捕获,(?=...)是后缀匹配,也是不捕获。
最后一段输出代码,有不少括号,不可取,这主要是因为re.findall返回的序列[],要用''.join()来转换成string输出,或许有更好的方式来实现。python