搜索引擎抓取错误、页面状态
西安网站建设分析搜索引擎抓取常见错误状态,各大搜索引擎抓取工具在尝试访问您的网址时是否收到错误?
搜索爬虫在抓取网站上的网址的过程中,抓取工具可能会遇到错误。可以通过服务器日志数据分析到,也可以通过搜索工具抓取报告看的到。通常日志会显示抓取错误的URL、错误类型(比如:404错误、50X错误之类),显示服务器错误或未找到页面的原因。服务器日志文件虽然也可以向您显示此信息,以及其他信息(如抓取频率)等,但由于访问和解析服务器日志文件是一种更高级的策略,对于初学者稍微有点难度。
在看爬网错误报告日志之前,先了解服务器错误和“未找到”错误:
4xx状态:当搜索引擎抓取工具由于客户端错误而无法访问您的内容时(通常页面由于被删除、或者无法访问会返回404错误)
4xx错误是客户端错误,这意味着请求的URL包含错误的语法或无法实现。最常见的4xx错误之一是“404 - 未找到”错误。这些可能是由于URL错误,已删除页面或损坏的重定向而引起的,仅举几个例子。当搜索引擎点击404时,他们无法访问该URL。当用户点击404时,他们会离开。
5xx状态:当搜索引擎抓取工具因服务器错误而无法访问内容时
5xx错误是服务器错误,这意味着网页所在的服务器无法满足搜索者或搜索引擎访问该页面的请求。比如做外贸或者GOOGLE优化的站长会在在Google Search Console的“抓取错误”报告中,看到一个专门针对这些错误的标签。这些通常是因为对URL的请求超时,因此Googlebot放弃了请求。其他搜索引擎也类似。
301/302状态:
有一种方法可以告诉搜索者和搜索引擎您的页面已移动 - 301(永久)重定向。这个在SEO优化工作中,经常会用到。比如一个页面排名很不错,有一定的访问量,但是出于某种原因页面无法访问或者必须删除时,可以使用301重定向到一个正常的页面上,让用户和搜索引擎都可以正常的访问。这也是网站优化的工作之一。
301状态代码本身意味着该页面已永久移动到新位置,因此请避免将URL重定向到不相关的网页( 旧网址内容实际上不存在的网址)。如果某个页面对某个查询进行了排名,而您将其301列为具有不同内容的网址,则可能会降低排名位置,因为使其与该特定查询的相关性降低了。
同时还可以选择302重定向页面,但这应该保留用于临时移动以及传递链接权益不是一个大问题的情况。西安网站建设:https://www.yiniu.cn/