主要是为了作接口测试,试着本身写爬虫,因此学习一下HTML一些基础的东西,方便用来解析网页。学习内容主要来自菜鸟教程的HTML教程,W3school的HTMLhtml
超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用于建立网页的标准标记语言web
HTML是运行在浏览器上的,由浏览器来解析浏览器
对于中文网页须要使用<meta charset="UTF-8">声明编码,不然会出现乱码。有些浏览器(如 360 浏览器)会设置 GBK 为默认编码,则你须要设置为 <meta charset="gbk">。网络
HTML文档的后缀名能够用.htm和.html,两种没啥区别均可以用学习
HTML文档也叫作web页面测试
HTML标签是由尖括号包围的关键字,好比<HTML>编码
HTML标签一般是成对出现的,好比<b></b>spa
标签中第一个叫作开始标签,第二个叫作结束标签,养成写了开始标签,直接写结束标签,再写内容的习惯,否则容易遗漏htm
HTML元素和HTML标签一般是一个意思,可是严格来讲,一个HTML元素包含开始标签和结束标签,好比:<p>这是一个段落</p>教程
web浏览器是用于读取HTML文件,并将其做为网页显示。
浏览器并非直接显示HTML标签,使用标签能够决定如何展现HTML页面的内容给用户
下面是一个可视化的HTML页面结构:
![]() |
只有 <body> 区域 (白色部分) 才会在浏览器中显示。 |
---|
从初期的网络诞生,已经出现了不少HTML版本
使用<!DOCTYPE>声明HTML的版本,浏览器才能正确显示网页内容,doctype声明是不区分大小写的
通用声明
HTML5
<!DOCTYPE HTML>