1. 首页
  2. SEO优化教程
  3. SEO优化理论
  4. 软件优化网站:什么是百度收录动态性URL?

软件优化网站:什么是百度收录动态性URL?

少年老成的云晨守望同学(题外话:少年老成是好事哈。我20多岁时人家说我像40岁,我40多岁时好多人说我像30多,男人20到50岁可以做到基本一个样子)贴了个帖子:透过京东商城看国内一线B2C网站SEO通病。建议先看那个帖子再回来看本帖,不然不容易明白下面在说什么。 简单说,帖子指出一个严重而且现实的SEO问题:很多网站,尤其是B2C,产品条件过滤系统(如选择产品的品牌、价格、尺寸、性能、参数等)会产生大量无效URL,之所以称为无效只是从

  老成持重的云晨守望先锋同学们(题外话:老成持重是好事儿哈。我20几岁时别人说我像四十岁,我40几岁时好多人说我像30多,男生20到五十岁能够保证基础一个模样)贴了个贴子:通过京东看中国一线B2C网站SEO常见问题。提议先看那个贴子再回家看本帖,要不然不易搞清楚下边在说些什么。

  简易说,贴子强调一个比较严重并且实际的SEO难题:许多 网址,尤其是B2C,商品标准过滤装置(如挑选商品的知名品牌、价钱、规格、特性、主要参数等)会造成很多失效URL,往往称之为失效仅仅从SEO角度观察的,这种URL并不可以造成SEO功效,反而有负面信息功效,因此这种URL不百度收录为好,缘故包含:

  1.很多过虑标准网页页面內容反复或极其相近(很多拷贝內容将使网址总体品质降低)

  2.很多过虑标准网页页面沒有相匹配商品,网页页面无內容(如挑选“一百元下列42寸LED电视机”这类的)

  3.绝大多数过虑标准网页页面沒有排行工作能力(排行工作能力比归类网页页面低得多)却奢侈浪费一定权重值

  4.这种过虑标准网页页面也不是商品网页页面百度收录的必需安全通道(商品网页页面应当有其他内部链接协助爬取和百度收录)

  5.爬取很多过虑标准网页页面巨大奢侈浪费搜索引擎蜘蛛爬取時间,导致有效网页页面收录机会降低(过虑标准网页页面组成起來是大量的)

  那麼如何尽可能使这种URL不被爬取和数据库索引、百度收录呢?前几日的一篇贴子如何隐藏內容也将会变成SEO难题探讨的是相近难题,这类过虑网页页面便是想掩藏的內容类型之一。但是可是,我现阶段搞不懂极致的解决方案。云晨守望先锋明确提出2个方式 ,我认为都没法极致处理。

  一是将不愿百度收录的URL维持为动态性URL,乃至有意越动态性越好,以阻拦被爬取和百度收录。可是,百度搜索引擎如今都能爬取、百度收录动态性URL,并且技术性上愈来愈并不是难题。尽管主要参数多到一定水平的确不利百度收录,但4、五个主要参数一般还能够百度收录。我们无法确定必须是多少主要参数才可以阻拦百度收录,因此不可以作为一个靠谱的方式 。并且这种URL接受内部链接,又没什么排行工作能力,还会奢侈浪费一定权重值。

  第二个方式 ,robots严禁百度收录。一样,URL接受了内部链接也就接受了权重值,robots文件严禁爬取这种URL,因此接受的权重值不可以传送出来(百度搜索引擎不爬取就不清楚有哪些导出链接),网页页面变成权重值只进不出的超级黑洞。

  连向这种URL的连接相互配合nofollow也有缺憾,和robots严禁相近,nofollow在Google的实际效果是这种URL沒有接受权重值,权重值却都没有被分派到其他连接上,因此权重值一样奢侈浪费了。百度搜索据悉适用nofollow,但权重值怎么处理不明。

  将这种URL连接放到Flash、JS里都没有用,百度搜索引擎早已能够爬取Flash、JS里的连接,并且估算之后愈来愈善于爬。许多 SEO忽视了的一点是,JS中的连接不但能被爬,也可以传送权重值,和一切正常联接一样。

  还可以将过虑标准连接制成AJAX方式,客户点一下后不容易浏览一个新的URL,還是在原先URL上,URL后边加了#,不容易被当做不一样URL。和JS难题一样,百度搜索引擎已经积极主动试着爬取、爬取AJAX里的內容,这一方式 都不商业保险。

  还一个方式 是在网页页面head一部分加noindex+follow标识,意即本网页页面不必数据库索引,但追踪网页页面上的连接。那样能够处理拷贝內容难题,也解决了权重值超级黑洞难题(权重值是能够伴随着导出链接传入其他网页页面的),不可以处理的是奢侈浪费搜索引擎蜘蛛爬取时间问题,这种网页页面還是要被搜索引擎蜘蛛爬取爬取的(随后才可以见到网页页面html里的noindex+follow标识),对一些网址而言,过虑网页页面总数极大,爬取了这种网页页面,搜索引擎蜘蛛就没充足時间爬有效网页页面了。

  再一个能够考虑到的方式 是掩藏网页页面(cloaking),也就是用程序流程检验来访者,是百度搜索引擎搜索引擎蜘蛛得话回到的网页页面摘掉这种过虑标准连接,是客户得话才回到一切正常的有过虑标准的网页页面。这是一个较为理想化的解决方案,唯一的难题是,将会被作为舞弊。百度搜索引擎常跟SEO讲的分辨是不是舞弊的最大标准是:要是没有百度搜索引擎,你是否会那么做?换句话说,某类方式 是不是仅仅以便百度搜索引擎而选用?显而易见,用cloaking掩藏不愿被爬取的URL是为百度搜索引擎做的,并不是为客户做的。尽管这类状况下的cloaking目地是幸福的,沒有故意的,但风险性是存有的,大胆的可使用。

  还一个方式 是应用canonical标识,较大难题是百度搜索是不是适用不明,并且canonical标识是对百度搜索引擎的提议,并不是命令,换句话说这一标识百度搜索引擎将会不遵循,相当于不起作用。此外,canonical标识的原意是特定规范性网站地址,过虑标准网页页面是不是可用一些有疑问,终究,这种网页页面上的內容常常是不一样的。

  现阶段比较好的方式 之一是iframe+robots严禁。将过虑一部分编码放入iframe,相当于启用其他文档內容,对百度搜索引擎而言,这些內容不属于当今网页页面,也即掩藏了內容。但不属于当今网页页面并不等于不会有,百度搜索引擎是能够发觉iframe中的內容和连接的,還是将会爬取这种URL,因此加robots严禁爬取。iframe中的內容还会有一些权重值外流,但由于iframe里的连接并不是从当今网页页面分离权重值,而仅仅从启用的哪个文档分离,因此权重值外流是较为少的。除开排版设计、电脑浏览器兼容模式这类的头痛难题,iframe方式 的一个潜在性难题是被觉得舞弊的风险性。如今百度搜索引擎一般不觉得iframe是舞弊,许多 广告宣传便是放到iframe中,但掩藏一堆连接和掩藏广告宣传一些彼此之间的差别。返回百度搜索引擎分辨舞弊的总正常情况下,难说这不是专业为百度搜索引擎做的。还记得MattCutts说过,Google之后将会更改解决iframe的方法,她们還是期待在同一个网页页面上见到用户能见到的全部內容。

  总而言之,对这一实际、比较严重的难题,我现阶段沒有自身感觉极致的回答。自然,不可以极致处理并不是就不可以活了,不一样网址SEO重中之重不一样,实际难题深入分析,选用所述方式 中的一种或几类应当能够处理关键难题。

  而最为较大的难题还并不是所述这种,只是有时你要让这种过虑网页页面被爬取和百度收录,这才算是杯具的刚开始。之后再探讨。

 

转载请注明: 爱推站 » 软件优化网站:什么是百度收录动态性URL?

相关文章

评论列表(0)

发表评论