欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

真伪静态区别方法分析

程序员文章站 2022-05-13 07:57:20
1.关于伪静态的用处   有些用户觉得,伪静态和真静态实际被收录量会相差非常大,其实不然,从你个人角度,你去判断一下一个帖子到底是真静态还是伪静态?   估计非常难看...

1.关于伪静态的用处

  有些用户觉得,伪静态和真静态实际被收录量会相差非常大,其实不然,从你个人角度,你去判断一下一个帖子到底是真静态还是伪静态?

  估计非常难看得出,因为所谓静态的意思,就是地址中不带问号,不带问号的就是静态,管他是真的还是伪的?搜索引擎看得出吗?

  所以说,其实不论是真的还是伪的,其实对于搜索引擎来说都是相同的,搜索引擎没有说,你这个是伪的,我不收录你.

  揪根掘底的来说,为什么搜索引擎会不收录带问号的网址?因为搜索引擎怕由于问号而进入死循环(以前动网就有这样一个漏洞,蜘蛛进去出不来了),所以非常多时候带问号的地址是不会进去的,伪静态对于搜索引擎来说,其实就是静态,因为地址中没有带问号,所以没有真静态比伪静态收录得多的说法.

 

2.为什么选择伪静态

  有非常多用户说:

  真静态不好吗?

  为什么不用真静态?

  访问起来不是更快吗?

  负载不是更好吗?

  等等等等...

  在这里,其实只用一个问题来回答:为什么选择mysql.

  非常多用户大概不明白为什么那么多大型论坛都选择了mysql数据库作为储存机制,大概大部分都是想:"因为dz用了mysql,所以就是mysql".

  其实不然,试想dz为什么会在那么多论坛程式并存的日子生存下来并笑傲江湖,非常大原因是因为dz用了mysql.试想如果大c当年改的程式是个文本论坛,那还会有dz的今天吗?

  或从另一个角度问,为什么那么多大型网站都选择了mysql而不是文本作为储存机制?

  所谓文本论坛,实际就跟真静态的说法差不多了,将数据储存在空间上面,大量读写硬盘,等等...

  为什么这种写法会被淘汰呢?

  我相信答案不会是老师所说的:

  "discuz.net 目前有 2129867 篇帖子,存储成html的话大约是 20799 m,也就是 20g左右。这当中还不计算由于磁盘存储机制造成的空间浪费(100个1k 的文件占用的空间可能会是200k)。"

  这种说法从我个人观点来看,这个理由不能给予用户不使用真静态充分的理由.

  然而,另一个理由却是值得我们注意思考的,也是为什么绝大多数站都不选择生成静态:

  "删除、更新这些html内容会导致大量的磁盘io操作及大量的磁盘碎片."

  正如上面这个说法,在实际当中确实会导致大量的磁盘i/o操作(input,output),大量进行i/o操作带来的后果可想而知,会产生大量的磁盘碎片甚至会导致硬盘出现坏道.

  所以对于生成静态而言,还不如去用文本论坛,能更好的解决你们的需求.

  (副w就是做文本论坛出生的,当时的名字为ofstar http://www.sh012.com ,后因发展困难转为mysql,而pw生成静态页面也就是pw以前文本方式稍加改进用于吸引用户眼球的噘头)

  当然,如果大家记忆力好的话,应该能记得pw4的时候pw论坛不能访问非常长一段时间,后来恢复到一段时间前的数据,官方的说法是被人攻击而导致硬盘损坏,其实这种说法是比较不可信的,相对于是被攻击导致硬盘损坏还是大量i/o操作而产生的后果,我个人更倾向于后者.

  当然,如果大家比较关注5d6d的话,应该知道前几天有一天时间5d6d无法访问,根据非官方消息是因为硬盘坏了,而损坏的原因我想当然是因为大量用户大量进行i/o操作了,试想,我们一个论坛,进行磁盘i/o操作的仅为管理员进行更新缓存时进行的,而5d6d每一个会员就是个管理员,试想下对磁盘是多大的考验?所以我并不奇怪5d6d的硬盘坏了.

  当然,也许在读这篇文章的非常多朋友都有使用过bt,也听说过bt对硬盘非常伤,不能开多,而所谓伤害,和这里指的都是同相同东西,大量i/o导致磁盘出现碎片甚至出现磁盘坏道.

  这里都是说些非常实际的例子来说明问题了.

 

3.关于伪静态的坏处

  当然犹如一篇文章的作者所说的

  "如果流量稍大一些使用伪静态就出现cpu使用超负荷,我的同时在线300多人就挂了,而不使用伪静态的时候同时在线超500人都不挂,我的iss数是1000"

  确实是这样的,由于伪静态是用正则判断而不是真实地址,分辨到底显示哪个页面的责任也由直接指定转由cpu来判断了,所以cpu占有量的上升,确实是伪静态最大的弊病.

 

4.我们该怎么做

  我们来总结一下.

  1.使用真静态和假静态对seo来说没有什么差别

  2.使用真静态可能将导致硬盘损坏并将影响论坛性能

  3.使用伪静态将占用一定量的cpu占有率,大量使用将导致cpu超负荷

  4.最重要的一点,我们要静态是为了seo

  所以.

  1.使用真静态的方法能直接排除了,因为无论怎么生成,对硬盘来说都是非常伤的.

  2.既然真伪静态的效果相同,我们就能选择伪静态了.

  3.不过伪静态大量使用会照成cpu超负荷.

  4.所以我们只要不大量使用就能了.

  5.既然静态只是给seo看的,我们只需要伪静态给seo就行了,不必给用户使用.

  6.所以我们只要在专门提供给seo爬的archiver中使用伪静态就能了.

 

5.判断某网站是真静态还是伪静态

ie浏览器

  打开你想判断的网站后,再在网址框中输入javascript:alert(document.lastmodified)。此方法可以判断一个网页的最后更新时间。如果这个时间与现在的时间相同,说明是伪静态的,反之为真静态的。

火狐firefox浏览器

  先用火狐打开一个网页,等网页完全打开后进入firefox的控制台,"工具"-“错误控制台”-快捷键:shift+ctrl+j,然后在控制台里面输入入:alert(document.lastmodified),查看最后修改时间并记录。
  接下来关闭控制台,重新刷新网页,再用相同的方法在控制台里输入查询代码,再查看文件的最后修改时间,连续几次如果发现时间不同则可以判断它是伪静态的了