Meta Robots 评论
抓取暂存站点后,查找元机器人属性设置为“noindex”或“nofollow”的页面。如果是,请检查每一个以确保它是有意的,如果不是,请删除“noindex”或“nofollow”指令。
XML 网站地图概述
创建两种不同类型的站点地图:,另一种包含旧站点的 电话号码数据 所有可索引页面。前者将有助于告知 Google 新网站的可索引 URL。后者将帮助 Google 了解重定向以及某些已索引的 URL 已移动到新位置的事实,以便它可以发现它们并快速更新搜索结果。
您应该检查每个 XML 站点地图,以确保:
它可以顺利地进行验证
其编码为 UTF-8。
其行数不超过 50,000。
解压缩后其大小不超过50MB。
如果行数超过 50K 或文件大小超过 50MB,则应将 IDX 注册现已自动标记 站点地图分成更小的行。如果 Google 频繁请求站点地图,这可以防止服务器过载。
此外您必须抓取每个
XML 站点地图,以确保其仅包含可索引的 URL.站点地图中排除، مثال کے طور پر:
robots.txt 文件阻止的页面
ایکس ایم ایل کے لیے 构建干净站点地图有助于监控新网站上线后的真实索引水平。如果不这样做,将很隰付镢镢发监
专业提示:在 Excel 中下载并打开每个 XML 站点地图,以获取任何附加属性(例如lang或图像属性)的详细概述.
HTML 网站地图审
根据要迁移的网站的大小和类型,在某些情况下,拥有 HTML站点地图可能会有所帮助。 包含未链接到网站主导航的 URL 的 HTML站点地图可以显著提高页面发现率和索引率。但是,请避免生成包含太多 URL站点地图。 如果您确实需要包含数千个 URL،请考虑构建分段 HTML 站点地图.
嵌套站点地图的数量以及每个站点地图中 安圭拉讯息 应包含的最大 URL数量取决于网站的权威性。网站越权威,其嵌套站点地图和 URL 的数量就越多.
例如,NYTimes.com HTML 站点地图包含三个级别,每个级别包含 1,000 زیادہ 个 URL. 这些嵌套的 HTML站点地图可帮助搜索引擎爬虫发现自 1851 ”
《纽约时报》 HTML 站点地图(第 1 级)
《纽约时报》 HTML 站点地图(第 2 级)
结构化数据审核
需要尽早发现结构化数据标记中的错误،以便在新网站上线之前有时间修复它们。理想情况下,您应该使用Google 的结构化数据测试工具测试每个页面模板(而不是每个页面) .
请务必检桌面版和移动版页面上的标记,尤其是当移动网站没有响应时.