18710002700

网站优化
当前位置:首页 >> 动态 >>  网站优化

URL标准化

2015-06-18 锋云科技
URL标准化(确定首选域)
为什么要确定首选域 ? 什么是确定首选域 ?
为什么要URL标准化 ? 什么是URL标准化 ?
一般情况下,带www和不带www的是指向同一个网站,搜索引擎也是这么认为的
如:
edge-cloud.cn
www.fengyunkj.net
一个网站至少有2个url指向同一个首页
比如:
http://www.fengyunkj.net/
http://edge-cloud.cn
http://www.fengyunkj.net/index.php
点击这几个链接,都可以访问北京网站建设公司锋云科技的首页
在用户看来好像是一样的,但是在搜索引擎看来却不一样,在搜索引擎收录和展示稳定下来后,它会选择其中一个作为首选域来展示。搜索引擎去判断去确定的过程就叫首选域的确定;所以首选域就是搜索引擎认为你网站的主域名是哪一个,是带www的,还是不带www的。它会确定网站的首页,哪一个url是主要的域名,将来在排名的时候就用主要的域名来做排名,让搜索引擎自己判断选择是需要时间的,而且它们的选择可能不尽人意。
如果不告诉搜索引擎网站首页主要的url是哪一个的话,搜索引擎就会花很大功夫自己去判断,搜索引擎在纠结的过程中会导致权重的流失。为了让网站的权重更高一些,自己要懂得首选域的概念以及首选域的确定方式,自己把它确定好,搜索引擎再来判断的时候,这个过程就不会有任何权重的流失,这就起到了集中权重的作用,网站首页应该获得的权重就不会流失,同样的,网站的某一个内页也存在多个不同的url能同时访问到(如动态的url和静态url),这些url在搜索引擎看来是不同的,所以要选择确定其中的一个url用来集中权重,用来排名,而放弃其它的url ,这样的过程叫URL标准化
URL标准化的目的是,把所有权重(外链内链)都集中到一个URL上,而不是让它分散到多个URL上;对网站各个页面的URL进行标准化,保证每个页面都留一个URL与之对应


URL标准化操作 
请记住:每个关键词应该对应的是一个URL而不是多个。(但可以多个关键词对应同一个URL)

1、301跳转
对于首页,一般选择带www的域名作为唯一URL(首页的URL,搜索引擎称为首选域)
域名解析的时候,应该是带www和不带www的都解析到网站首页,在条件许可的情况下,采用301的方式把不带www的,转向到带www的域名;
如果不熟悉301的办法,则将所有URL都带上www,用这样的绝对地址也可以

2、标准的URL格式
首选域和标准的url ,前面的http都要带
建议给首页做站内站外链接的时候url最后都带个反斜杠
目录结构的url一定要带上反斜杠,列表页采用目录结构的url
内容页(如xxxxxxx.html)不带反斜杠

问题出来了
搜索引擎认为带反斜杠和不带反斜杠的两个不同的url  
在搜索引擎看来,带反斜杠和不带反斜杠,默认是一样的。但为了效果最佳,请注意每次加链接时,都加上反斜杠。

3、首页url后面不要再有index.html 、index.php等
否则,搜索引擎会把权重传递给带index.html的页面,而实际希望排名的是不带index.html的页面,交换友链的时候一般不带index.html ,这种情况就导致了权重的很多分散
假如网站每个栏目页面的URL格式是这样的,如:http://www.fengyunkj.net/seo/index.html这是程序自动的,我是否有必要把每个index.html去掉?
咱们URL标准化的宗旨在于,对权重进行集中,而不让其分散。所以,如果是带index.html的URL,你各个地方都用这个URL即可。可以不用去掉。
当一个网页有数个URL可以同时访问时,确定唯一的URL是一个重要的技巧。这一点,绝大部分新手是不清楚的。所以你能看到很多网站上首页的链接,指向的是带index.html的。

除了首页,其他的一起考虑下
一级目录时,一般直接用目录形式,而不带index.php等
http://www.fengyunkj.net/bbs/
http://www.fengyunkj.net/bbs/index.php
一样的页面,一样的关键词。我们选择了http://www.fengyunkj.net/bbs 作为唯一的URL。

或许有人认为:
采用目录结构的URL,如www.fengyunkj.net/seo 比 www.fengyunkj.net/seo/index.html 结构的URL要好点。
现在,我们认为这样的差别很小,即:采用以上两个方式对排名影响很少,看你哪一个比较方便。

4、静态url
希望排名的是静态化之后的url ,怎么做才能够让搜索引擎知道我们以静态url为主
①网站上所有的链接,动态的改成静态的(或伪静态)
如果做了sitemap ,这里面的链接也要改一下
②网站静态链接陆续收录了很多之后,静态收录一半之后,用lobos.txt把动态链接批量屏蔽掉,这样就开始真正地告诉搜索引擎,让它只收录网站上的静态链接,不要再收录动态的链接,接下来发内链外链也用静态链接
动态链接和静态链接之间不要再301 ,实际存在的链接是动态链接,静态链接是伪静态,它已经跳转到动态链接上了,再301的话,就成了来回跳


5、采用绝对地址
网站首页和各个页面采用绝对地址
在网站首页点击右键查看源代码,或者打开网站的后台源代码:
查找指向网站首页的链接,一般情况下是如下两种情况:
<a  href="/">首页</a>
<a  href="http://www.fengyunkj.net/">网站建设</a> 
前者是相对地址,后者是绝对地址。
当我们要把首页链接的相对地址修改为绝对地址时,所作的操作即是,把<a  href="/">修改为<a  href="http://www.seowhy.com/">
同理,其他的链接修改:
把<a  href="/bbs/">修改为<a  href="http://www.fengyunkj.net/bbs/">;
把<a  href="/edu/">修改为<a  href="http://edu.edge-cloud.cn/">;
把<a  href="/wangzhanjianshe-7-2.html">修改为<a  href="http://www.fengyunkj.net/wangzhanjianshe-7-2.html">
很多时候,源代码里看不到类似这样的href="/1_13.html" 的代码,而是一个用来调出这个代码的函数。你可以:
1、直接在那个函数前面加 http://www.fengyunkj.net/
2、或者,删除函数,而直接把绝对地址写上。(这样的后果是,内容变化时,需要手工修改)

举例说明:
例如原来是:
<a href="{formaturl type="article" siteurl=$siteurl name="contact"}">联系我们</a>;
你可以通过2个方式试试:
①<a href="{formaturl type="article" siteurl=http://www.17qiti.com/$siteurl name="contact"}">联系我们</a>;
②<a href="{formaturl type="article" siteurl=http://www.17qiti.com/xxx.html   name="contact"}">联系我们</a>; 
其中,xxx.html 是联系我们页面的URL地址。

很多时候,没有办法所有链接都采用绝对地址,但只要主要的导航和栏目,页眉页脚那边采用绝对地址即可。其他可以灵活处理

相关疑问
1、采用绝对地址有什么好处呢?和SEO有什么关系? 
解答:
①如果网站都采用相对地址,那么当不同的域名同时解析一个网站时,访问这多个域名,将内容一样。这让搜索引擎分辨不出到底哪一个是主站。
②如果没有采用绝对地址,可能导致竞争对手恶意镜像你的网站,或搜索引擎误收录虚拟主机提供的二三级域名而不收录主域名。(这种事情时有发生)
③首页采用绝对地址,还可以解决首选域的问题。而无需进行复杂的301操作。
如果你的网站都采用带www的绝对地址,这样可以把网站所有权重集中到带www的主域名上。有助于主域名权重的提升。

2、是否一定要这样做?
新的网站,尽可能这样做。避免未来可能发生的各种问题。
如果有些困难,只要首页部分链接采用绝对地址即可,不一定要所有的都采用绝对地址。
比如:采用论坛程序的网站,只要右下角的页脚采用绝对地址即可。碰到一些比较麻烦的修改,不用所有的都修改,只要修改能修改的部分即可。

3、如何简单通俗理解相对地址和绝对地址。
比如:我问你,你现在在哪一个城市?你如果在深圳,回答应该是:深圳。
如果一个俄罗斯人问你,你现在在哪里?你应该回答,中国深圳。
前面那个是相对地址,因为我和你都在中国,就省略了。
后面那个是绝对地址,说中国深圳,所有的地球人都知道你在哪里。

4、是否有更简易的办法来解决这个问题?
我们发现了一个好用的标签,可以非常好解决首页采用绝对地址的问题。
叫做基准标签
试验测试一个有用的meta标签
标签名:<base href="http://www.你的域名.com/"/>   请注意带上 http://
功能:基准标签。
实验结果:本标签可以使用。


采用修改代码的方式,需要不少工作,同时一些同学修改时也会碰到困难。现在引入该标签,如果测试成功,将非常简单解决这个问题。
使用该标签后,只要在网页上,添加这个标签,就可以默认全部链接都采用了绝对地址。
添加的位置。在页面源代码里的meta标签位置,添加一行代码:
<base href="http://www.你的域名.com/"/>


要试验和测试的工作:
首先,在自己网站采用这个标签,然后使用没用的,没收录的域名,解析到那个的网站。最后,向百度和Google提交这个没用的域名。
比如:你拿一个没用的,没收录的域名,解析到http://www.fengyunkj.net/的ip上,我这边通过下,让你的域名可以访问seowhy的首页。
假设seowhy用了基准标签,你的域名应该不被收录或只收录首页。
那说明,这个基准标签,可以起到保护你网站防止被镜像 
之后的10-20天,观察这几个没用的域名,是否被收录。
得到的结果是:只收录首页,或都没收录。

以上结果成立,说明搜索引擎也识别该标签,这个标签可以推广使用,节省时间,同时带来很多方便。

这个标签还有一个有用的功能。比如,希望网站每个页面都在新窗口打开,可以添加这么个标签即可。如:
<base href="http://www.你的yuming.com/" target="_blank"  />


5、不管什么时候都用心目中的那个url
你希望哪一个URL能有排名,那么在做站内和站外锚文本时,就只用这个URL,而不用其它的。不然权重不能集中到你希望有排名的那个URL上。如果一会儿用这个,一会儿用那个。你虽然给你的网站首页做了100个锚文本,但是,有的时候用带www的来做外链,有的时候用不带www的来做外链,有的时候又用带index的首页来做外链,虽然看起来好像做了100个外链,但起作用的可能不到30%

刚开始的几个月,site:不带www的域名,可能存在带www和不带www混合的结果。当稳定下来后,就只剩下首选域了。
如果搜索引擎自动选择了带www域名作为首选域,那么在site和排名时,网站的URL就会是都带www的。
一个小常识:
往往发现,site不带www的域名,展示结果比site带www的域名,结果会多一些。
这是自然的,因为前者包含了后者,而后者不包含前者。
如果发现相反的情况,那是搜索引擎的错误。

Google在2010年3月增加了一个新的标签,有助于我们更好确定首选域。但请注意这个标签目前仅Google认可。
这个标签是:rel="canonical" 
我们在网站首页的head标签内,添加这么一行:
<link rel="canonical" href="http://www.example.com/"/>
这样就确定了 http://www.example.com/ 为网站的首选域,在以后Google的搜索结果里就不会有不带www的http://example.com/了。
如果你刚用上这个标签,则需要半个月至一个月才能更新过来。 
相关新闻
18710002700
返回顶部