20194123向海飞实验四

时间 2020-06-15

标签向海实验繁體版

原文原文链接

学号 20194123《Python程序设计》实验四报告

课程：《Python程序设计》
班级： 1941
姓名：向海飞
学号：20194123
实验教师：王志强
实验日期：2020年6月13日
必修/选修：公选课html

1.实验内容

Python综合应用：爬虫、数据处理、可视化、机器学习、神经网络、游戏、网络安全等。
选择：爬虫python

2. 实验过程及结果

须要用到 bs4 、正则表达式、requests 的知识
找到网址http://zuihaodaxue.cn/ARWU2015.html
正则表达式

如图知数据块是 tbody，分析得html 中一行对应一个tr，世界排名、国家排名、总分能够直接经过 tr[‘td’] 得到，而学校须要经过 tr[‘td’].a.string 得到，国家／地区须要经过 tr[‘td’].a[‘title’] 得到
过程以下：
导入相关库：安全

import requests
from bs4 import BeautifulSoup
import bs4网络

获取网页数据app

ef getHTMLText(url):
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""机器学习

解析网络数据函数

ef fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr, bs4.element.Tag):
tds = tr('td')
ulist.append([ tds[0].string, tds[1].a.string, tds[2].a['title'], tds[3].string, tds[4].string ])学习

显示数据ui

def printUnivList(ulist, num):
tplt = "{0:^10}\t{1:44}\t{2:^16}\t{3:16}\t{4:^16}"
print(tplt.format("世界排名", "学校名称", "国家／地区", "国家排名", "总分"), chr(12288))
for i in range(num):
u = ulist[i]
print(tplt.format(u[0], u[1], u[2], u[3], u[4]), chr(12288))

def main():
uinfo = []
url = 'http://zuihaodaxue.cn/ARWU2015.html'
html = getHTMLText(url)
fillUnivList(uinfo, html)
printUnivList(uinfo, 80) # 20 univs

if name == 'main':
main()

结果以下图：

3. 实验过程当中遇到的问题和解决过程

问题1：requests安装失败
问题1解决方案：由于用户名包含中文，因此安装失败，在安装目录 ,找到mimetypes.py文件，添加代码，完成后保存，在cmd中执行pip install requests，以下图所示，关于ascii的问题解决

其余（感悟、思考等）

学习python已经有一学期了，我在本学期中学会了python的语言基础，流程控制语句，其中for和while循环是最让我花时间得，，后来得序列，函数都还好，但到了面向对象程序设计后就有些跟不上了。说实话对我来讲有些困难，我本来觉得我就算一时间不会的话也能够多花时间练习，但后来逐渐发现本身一天的课和做业下来就没多长时间了，因此我学习python主要是在周三上课的时候，有时周末也会找云班课学习一下。虽然有不少知识点都没有很搞懂，但总的来讲，这学期收获仍是不少的，由于之前选的文科，总以为本身也应该尝试新的领域，因此学习python也算是得偿所愿吧。

1. 面向对象实验四
2. 小四轴实验：四旋翼无人机飞行原理
3. 201771010124 王海珍《面向对象设计 java》第十四周实验总结
4. Java实验四深刻面向对象
5. 实验四 java面向对象（下）
6. 实验四附加实验
7. Java海融四天实训
8. 20165301陈潭飞实验一
9. 实验四
10. 实验四SSH
更多相关文章...
• XML 验证 - XML 教程
• DTD 验证 - DTD 教程
• RxJava操作符（四）Combining
• ☆基于Java Instrument的Agent实现