百度搜索结果页URL参数分析

在百度搜索关键词时,百度提供的搜索结果页面(SERP)的地址栏会返回很长的一段URL,为了更好的理解百度的工作原理,非常有必要理解这段URL的参数分别是什么含义。

s?:搜索:百度的搜索结果页使用了重定向,因此我们看到的不是search.php?这样的url格式

wd:当前搜索的关键词。即输入关键词的urlencode字符串,编码格式为gbk或者utf-8,默认编码格式为utf-8。

bs:上一次搜索的关键词。内容格式与当前搜索的关键词一致。用于记录用户的搜索行为,记录该值被用于相关关键词统计、同义词分析等操作。

rsv_bp:判断是第几次搜索。值为0或者1,当用户第一次搜索时,该参数值为0;当用户在第一次搜索的结果页进行第二次搜索或者更多次数搜索时,该参数值为1。用于记录用户的搜索行为,记录该值被用于校验搜索结果质量以及相关搜索词相关数据分析。

tn:搜索来源。该值为网站标记。例如从hao123的百度输入框搜索内容,将出现tn=sitehao123。记录该值被用百度统计搜索来源,该来源数据可能被作为决策数据。

inputT:键入时间。从打开百度页面开始到点击搜索按钮的时长。该参数被用于记录用户搜索行为。

oq:相关搜索的主词。例如搜索seo是什么,在底部的相关关键词当中有淘宝seo是什么意思,当点击后oq的值就是seo是什么。该参数主要用于相关词统计以及用户搜索行为记录。

rsp=第n+1次相关搜索。统计相关搜索的次数,例如是第4次相关搜索,那么rsp的值为3。该参数主要用于相关词统计以及用户搜索行为记录。

f:搜索行为判断。8为用户自主搜索,3为下拉框推荐,1为相关搜索。该参数主要用于用户搜索行为记录以及关键词统计。

pn:页码。值为公差为10的等差数列。用于页码判断,同时也用于校验搜索结果质量。

cl:搜索类型。值为3时是网页搜索,其他的值所对应的类型暂时还没有统计到。该值会影响搜索结果排序。

lm:指定时间内百度收录情况查询。值为1时是最近24小时;值为7时是最近7天;值为30时是最近1个月;值为360时是最近1年。

rn:搜索结果显示条数(Record Number)。取值范围在10~100条之间,缺省值为10。

ie:查询输入文字的编码。此项设置会影响搜索参数wd的编码类型。

si:在限定的域名中搜索。主要用于检索某个站点的百度索引数据,例如想要只得到百度的搜索结果,那么参数的值为baidu.com。使这个参数有效必须结合ct参数一起使用。

rsv_sug 搜索框提示的搜索历史记录,参数值0、1、2分别代表搜索框提示0、1、2条搜索历史记录

 
 

以搜索“唯我网站运营”为例,URL如下,并附截图:

http://www.baidu.com/s?tn=sitehao123&ie=utf-8&bs=网站运营&f=8&rsv_bp=1&wd=唯我网站运营&rsv_sug3=4&rsv_sug1=3&rsv_sug4=167&inputT=930

解释如下:

tn=sitehao123  通过hao123搜索框进入结果页面

ie=utf-8 编码为utf-8

bs=网站运营 上一次搜索的关键词为“网站运营“

f=8 自主进入搜索框进行搜索

rsv_bp=1 用户经过多次搜索

wd=唯我网站运营 当前搜索关键词为”唯我网站运营“

 inputT=930 从打开百度页面开始到点击搜索按钮的用时930毫秒

发表评论