更多例子:
有许多网站使用不同的 URL 加载相同的内容。
一个这样的例子是电子商务网站,其中相同的产品加载有不同的 URL。
我们将以亚马逊网站上列出的三星智能手机(Samsung Galaxy M31)为例。
产品主链接为:
链接1:(主链接)https://www.amazon.in/Samsung-Galaxy-Ocean-128GB-Storage/dp/B07HGGYWL6
当我们在亚马逊中搜索“Samsung Galaxy M31”并单击该链接时,它会在同一产品的 URL 中添加另外信息(关键字)。
亚马逊使用此信息来跟踪用户如何找到该产品以进行分析。
链接 2:https://www.amazon.in/Samsung-Galaxy-Ocean-128GB-Storage/dp/B07HGGYWL6/ref=sr_1_2?dchild=1&keywords=Samsung+Galaxy+M31+%28Ocean+Blue%2C+6GB+内存 %2C+128GB+存储%29&qid=1595014774&s=电子&sr=1-2
有时我们会通过一些 YouTube 开箱视频描述中的一些附属链接找到相同的产品页面。
在这里,我们可以在 URL 中看到与附属标签信息相关的另外参数或者查询字符串:
链接 3:https://www.amazon.in/gp/product/B07HGGYWL6/ref=as_li_qf_asin_il_tl?ie=UTF8& tag =appleaaffili-21&creative=24630&linkCode =as2&creativeASIN=B07HGGYWL6&linkId=4f33f1fbceb5a19bdb3c9df57716ac8d
看看所有这些不同的 URL 如何将我们带到同一个产品。
因此,设置单个规范 URL 很重要。
否则,这些 URL 可能会为搜索引擎提供重复的内容展示。
我们可以看到亚马逊为所有这些页面设置了规范 URL。
如果我们看到它们的源代码(右键单击页面 > 查看源代码),我们会发现所有这些页面都使用相同的规范 URL,如下所示:
<link rel="canonical" href="https://www.amazon.in/Samsung-Galaxy-Ocean-128GB-Storage/dp/B07HGGYWL6" />
规范 URL 在搜索引擎中是如何工作的?
如 Google 帮助文档中所述,搜索引擎机器人会定期查找网站页面以进行索引。
当有多个内容相似的页面时,它会尝试选择最有用的 URL 并认为它是规范的。
决定可能基于各种因素,最重要的是哪个页面与其他页面的链接最多,或者哪个页面的流量最多。
你不应该总是依赖搜索引擎,所以总是自己设置规范 URL 并帮助搜索引擎。
规范页面总是经常爬行,而其他重复页面很少爬行。
因此,大多数情况下我们会在搜索引擎结果页面 (SERP) 中看到规范 URL。
如何在 HTML 中添加规范标签:
具有多个 URL 的页面的最常见示例是主页。
大多数情况下,主页可以通过多个 URL 访问,如下所示:
http://www.onitroad.com
https://www.onitroad.com
http://onitroad.com
https://onitroad.com
http://onitroad.com/index.php # 如果是 PHP 网站
http: //onitroad.com/index.html #如果是html网站
搜索引擎可以将这些 URL 中的每一个视为具有相同内容的不同页面,这对 SEO 不利。
为什么?
在这里,第一个问题是一个 URL 可以与其他 URL 竞争 SEO 排名,因为两者都针对相同的内容。
第二个问题是它可以被视为这些 URL 上的重复内容,这会影响 SEO 排名。
解决方案是将最重要的 URL 设置为 canonical 。
假设我们有“https://onitroad.com/” URL(带 https 和不带 www )作为主 URL。
我们希望对搜索引擎进行排名,因此我们可以在上述所有页面中将以下内容设置为规范 URL。
我们需要在网页上的 head 标签中使用 <link>
标签。
<link rel="canonical" href="https://onitroad.com/" />
要点
- 检查重复内容的 CMS 设置:许多 CMS 会自动为页面生成 URL。有时,相同的内容在多个 URL 上可用。例如,如果我们使用“SEO”进行搜索,它可能会列出“SEO”类别中列出的类似主题。确保如果多个页面显示相似的内容,我们应该为它们设置规范 URL。
- 避免混合/链规范:当规范化或者重定向所有相似的内容页面到单个页面时,我们应该避免混合信号。例如,如果我们有三个相似的页面 A、B 和 C。让我们假设 C 是我们要索引的主 URL。然后,不要规范化链,例如 Page A ==> B,然后 B ==> C。直接使用 A ==> C,和 B ==> C。
- 不要相互规范/重定向:不要规范化页面 A ==> 页面 B 然后页面 B ==> 页面 A。确保我们只有一个规范 URL,并且不应指向另一个。
- 为跨域重复设置规范:如果内容在两个不同的网站上相同,我们可以为两者设置相同的规范 URL,以便搜索引擎为主网站提供排名,而不是相互竞争。
- 如果需要,设置 301 重定向:如果我们不想显示任何页面内容,而想显示另一个类似的页面,则可以实现重定向。通常,重定向用于将 HTTP 页面重定向到 HTTPS。当我们有一个更好的或者新的类似内容的页面时,它也很有用。如果我们希望两个页面都可以访问,那么我们不应重定向,而应仅实施规范以防止重复内容。
规范 URL 是指来自我们网站上一组重复页面的主要或者主 URL。
简单来说,如果网站有 4 个显示相同内容的 URL,那么这就是我们希望在搜索引擎上排名的主页。
如果我们没有设置单个规范 URL,搜索引擎将索引所有重复的页面,这可能会损害这些页面的 SEO 排名。
建议通过在所有类似页面中提及主 URL 来设置规范 URL。
我们将在下一个示例中对此有更多的了解。