欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

程序员文章站 2022-06-18 23:46:53
标题标签h1~h6 顾名思义,这些就是把字体设置为大字体的,就如博客园的这个编辑器里的格式: 不信的话我们自己设置看看:好的,从本篇文章开始,我们需要动手了 ......

标题标签h1~h6

顾名思义,这些就是把字体设置为大字体的,就如博客园的这个编辑器里的格式:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

不信的话我们自己设置看看:好的,从本篇文章开始,我们需要动手了

 

<!doctype html>
<html lang="en">
<head>
    <meta charset="utf-8">
    <title>test</title>
</head>
<body>
    <h1>标题</h1>
    <h2>标题</h2>
    <h3>标题</h3>
    <h4>标题</h4>
    <h5>标题</h5>
    <h6>标题</h6>
</body>
</html>

  

打开网页看看:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

文本样式标签:

 

<b></b>:加粗
<i></i>:斜体
<u></u>:下划线
<s></s>:删除线
<sup></sup>:上标 
<sub></sub>:下标
<em>或<strong>:特别强调某几个字

 

代码:

<!doctype html>
<html lang="en">
<head>
<meta charset="utf-8">
<title>test</title>
</head>
<body>
<b>b标签</b>
<i>i标签</i>
<u>u标签</u>
<s>s标签</s>
test<sub>sub标签</sub>
test<sup>sup标签</sup>
test<em>em标签</em><strong>strong标签</strong>test
</body>
</html>

  

测试:

 

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

 

段落标签p 

 

<!doctype html>
<html lang="en">
<head>
<meta charset="utf-8">
<title>test</title>
</head>
<body>
<p>asdjfasjdfjaweijfowjefojwaojfioawjefoijwefweafawefwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwfafew</p>
<p>adfdsaf</p>
<p>
12312414
</p>
</body>
</html>

  

测试:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

 

有朋友可能发现,p标签就是一个p标签就是一个段落,自动换行,并且如果没满一行也会自动换行,为什么会这样呢?像前面的就不会这样

这就是块级标签(又叫行级标签)的特点,不管内容有没有占一行,它都会默认把一行占满,而像前面的em,i,之类的这种内容多少就占多少,而且不会默认沾满一行的就是内联标签

这个后期还有用到,不过太在意

 

超链接标签a

 

超链接就是可以点击并跳转的标签

 

<!doctype html>
<html lang="en">
<head>
    <meta charset="utf-8">
    <title>test</title>
</head>
<body>
    <a>去百度</a>
</body>
</html>

  测试:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

发现没有任何特殊的啊,就是文字。目前,这里必须加上a标签的属性href才行:

<!doctype html>
<html lang="en">
<head>
    <meta charset="utf-8">
    <title>test</title>
</head>
<body>
    <a href="www.baidu.com">去百度</a>
</body>
</html>

  

测试:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

 终于变色了,点击看下呢:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

 然后发现居然报错404了,这个404是状态码,服务端返回来的状态码,关于状态码,详见鄙人的另一篇博文:洗礼灵魂,修炼python(55)--爬虫篇—知识补充—rfc 2616 http状态码

 

而且您可以看到网页地址栏上面的地址变了,这明显不对对吧?那么是哪里出了问题呢?

 

注意了,这是很多初学者容易犯的错,给a标签加href属性时,一定要带上协议,常见的协议有:ftp,http,https,file

所以这里必须要带上http,或者https:

 

<!doctype html>
<html lang="en">
<head>
    <meta charset="utf-8">
    <title>test</title>
</head>
<body>
    <a href="http://www.baidu.com">去百度</a>
</body>
</html>

  

测试:

发现确实可以调整到百度网站了,这个不太好展示效果,只能各位自己测试了。我这里截了个图:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

 

 当我把光标放上去还未点击时,浏览器左下角会预加载即将访问的链接,这个现象我希望各位以后可以多多注意下

 

当然a标签还有其他的属性:

target

  _blank 在新的网站打开链接的资源地址

  _self 在当前网站打开链接的资源地址 title: 表示鼠标悬停时显示的标题

 

比如 <a href="http://www.baidu.com" target="_blank">去百度</a>

 

 这个就自己试了

 

其他链接方式:(以后会用到)

  • 目标文档为下载资源 例如:href属性值,指定的文件名称,就是下载操作(rar、zip等)
  • 电子邮件链接 前提:计算机中必须安装邮件客户端,并且配置好了邮件相关信息。 例如:<a href="mailto:xxx@edu.cn">联系我们</a>
  • 返回页面顶部的空链接或具体id值的标签 例如:<a href="#">内容</a><a href="#id值">内容</a>
  • javascript:是表示在触发<a>默认动作时,执行一段javascript代码。 例如:<a href="javascript:alert()">内容</a>
  • javascript:;:表示什么都不执行,这样点击<a>时就没有任何反应 例如:<a href="javascrip:;">内容</a>

 

列表标签 ul,ol,li

网站页面上一些列表相关的内容比如说物品列表、人名列表等等都可以使用列表标签来展示。通常后面跟<li>标签一起用,每条li表示列表的内容

 

ul表示无序列表,ol表示有序列表。这个如果您用过办公软件,相信会见过这个。然后博客园这个编辑器也有这个东西:

最开始是这样的:

 

test1

test2

test3

  

添加有序列表:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

结果:

  1. test1
  2. test2
  3. test3

 

修改成无序列表:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

 

结果:

 

  • test1
  • test2
  • test3

 

大概什么样子大家应该懂了吧?

 

好的,开始自己写一个看看:

  <!-- 无序列表 type可以定义无序列表的样式-->
    <ul type="circle">
        <li>我的账户</li>
        <li>我的订单</li>
        <li>我的优惠券</li>
        <li>我的收藏</li>
        <li>退出</li>
    </ul>
    <!-- 有序列表 type可以定义有序列表的样式 -->
    <ol type="a">
        <li>我的账户</li>
        <li>我的订单</li>
        <li>我的优惠券</li>
        <li>我的收藏</li>
        <li>退出</li>
    </ol>

  

里面那个type和circle即ul和ol各自的属性,circle表示是一个圆圈,类似句号的标志,type即表示以什么排序方式,给一个“a”表示用字母开始排序

 测试结果:

洗礼灵魂,修炼python(55)--爬虫篇—知识补充—RFC 2616 http状态码

其他相关:

ol标签的属性:

type:列表标识的类型

  • 1:数字
  • a:小写字母
  • a:大写字母
  • i:小写罗马字符
  • i:大写罗马字符

列表标识的起始编号

  • 默认为1

ul标签的属性: type:列表标识的类型

  • disc:实心圆(默认值)
  • circle:空心圆
  • square:实心矩形
  • none:不显示标识

换行标签 <br>

 

<br>标签用来将内容换行,其在html网页上的效果相当于我们平时使用word编辑文档时使用回车换行。

 

分割线 <hr>

 

<hr>标签用来在html页面中创建水平分隔线,通常用来分隔内容

 

特殊符号

浏览器在显示的时候会移除源代码中多余的空格和空行。 所有连续的空格或空行都会被算作一个空格。需要注意的是,html代码中的所有连续的空行(换行)也被显示为一个空格

 

常用的特殊字符:

内容 代码
空格 &nbsp;
> &gt;
< &lt;
& &amp;
¥ &yen;
版权 &copy;
注册 &reg;

 

好的,常用标签暂且到此