这篇文章主要介绍伪静态,以及伪静态与动态和静态间的利弊,感兴趣的话可以往下看。
伪静态是什么?伪静态又名URL重写,是动态的网址看起来像静态的网址。换句话说就是,动态网页通过重写URL方法实现去掉动态网页的参数,但在实际的网页目录中并没有必要实现存在重写的页面。
静态网址即纯静态HTML文档,能使用filetype:htm 查询到的网页。
动态网址即内容存于数据库中,根据要求显示内容,URL中以 ? # & 显示不同的参数,如:news.php?lang=cn&class=1&id=2。
以上就是三者的简单介绍,那么接下来看看这三者间的利弊。
动态网址
首先,动态网址目前对于Google来说,“不能被抓取”的说法是错误的,Google能够很好的处理动态网址并顺利抓取;其次“参数不能超过3个”的说法也不正确,Google能够抓取参数超过3个的动态网址,不过,为了避免URL太长应尽量减少参数。
其次,动态网址有其一定的优势,以上面所说的 news.php?lang=cn&class=1&id=2 为例,网址中的参数准确的告诉Google,此URL内容语言为cn、隶属于分类1、内容ID为2,更便于Google对内容的识别处理。
最后,动态网址应尽量精简,特别是会话标识(sid)和查询(query)参数,容易造成大量相同页面。
静态网址
首先,静态网址具有的绝对优势是其明晰,/product/nokia/n95.html和/about.html可以很容易被理解,从而在搜索结果中可能点击量相对较高。
其次,静态网址未必就是最好的网址形式,上述动态网址中说到,动态网址能够告诉Google一些可以识别的参数,而静态网址如果文档布置不够恰当(如:过于扁平化,将HTML文档全放在根目录下)及其他因素,反而不如静态网址为Google提供的参考信息丰富。
首先,伪静态网址不能让动态网址“静态化”,伪静态仅仅是对动态网址的一个重写,Google不会认为伪静态就是HTML文档。
其次,伪静态可取,但应把重心放在去除冗余参数、规范URL、尽可能的避免重复页上。
最后,伪静态有很大潜在危险,最好在对网站系统、网站结构、内容分布、参数意义熟悉的情况下使用。
在写伪静态规则时,应保留有价值的参数,不要将有价值的参数全部精简掉,如前面例子中的 news.php?lang=cn&class=1&id=2 最好重写为 news-cn-class1-id2.html,而不是过份精简重写为 news-2.html。
再就是伪静态中一定不能包含会话标识(sid)和查询(query)参数,/product.asp?sid=98971298178906&id=1234 这样的动态网址,其中的sid本来Google能够识别并屏蔽,但如果重写为 /product/98971298178906/1234,Google不但无法识别,还在整站中造成无限重复页面。
我们应该选择伪静态还是真静态
所以,使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的,因为既然真伪静态的效果一样,我们就可以选择伪静态。只要我们不大量使用伪静态,就可以避免造成CPU超负荷。而且既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用,所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了。
以上就是关于伪静态的介绍,以及动态,静态,伪静态的利弊。最后关于如何实现伪静态,可以使用PHP来实现。上述内容仅供参考。