近日,百度在站长平台发布了“【官方说法】关于网站URL设计的友好提示”,其中提到了友好的url的设计准则。而谷歌工作人员John也在推特上的问答上表达了谷歌对于url设计的看法。
关于网站的URL设计,在新锐数字传媒以前的文章中提到过:url不光利于搜索引擎理解页面层级,还可以给具有一定互联网知识的人群作为一个网站导航牌,让用户通过url了解当前所在位置。百度在最新发布的文章中,对友好的url设计的准则是以下6点:
1、在搭建网站结构、制作URL时,URL设计的越简单越平常,越好
2、不建议URL中含有中文字符,中文字符容易出现识别问题
3、URL长度要求从www开始到结束,总长度不应超过1024个字节
4、避免无效参数,如ll等
5、谨慎使用#参数,有可能会被爬虫截断,导致井号后面的url字符不生效,导致网页抓取失败
6、避免出现太多无效目录,目录不宜过深,否则会影响链接层级计算,如www.abc.com/a/news/difang/123,URL结构太深不利于抓取。
新锐数字传媒在此补充一点:对于电商等类似网站,在产品列表页的URL优化上十分不易,非常容易出现多个实时生成的参数的情况,这一类页面,一定要指定规范页面,做好Canonical标签的优化使用。
谷歌的员工John Mueller也发表了谷歌对于URL的一些看法,他在推特上表示:URL的结构并不是那么重要,但是所有的URL更改都需要花费时间并且过程可能很煎熬糟糕。要从长远的角度出发来选择URL是否要进行更改以及保留。
实际上,URL的结构设计确实有一定的重要性,然而页面是否能够容易且快捷的被谷歌发现才是更重要的。
John在另一条推文中回答了另一个关于URL的问题,他表示:当同一个URL在不同的sitemap中收录时,谷歌将可能多次收录该URL。他建议URL应当只存在于一个sitemap当中。
该推文的起因是,有人在推特上通过截图询问John该问题,在截图中,该站长通过sitemap提交了34条URL,但谷歌反馈的收录数量却达到了40条,比sitemap中的数量还多。截图如下:
这意味着同一页面被搜索引擎收录多次的原因可能多了一条:在不同的sitemap中提交了多次。