刷百度相关参数详解

  因不少人须要百度相关搜索,不少人用这个技术卖钱,本身本着技术的爱好,把这个分享给你们!    刷相关搜索的实现方法:第一:好比圆柱模板,咱们能够先搜索圆柱模板厂家,而后接着再去搜索圆柱模板价格,那么天天以几倍的方式增长,当达到必定搜索量的时候,那么圆柱模板的相关词搜索就会出现圆柱模板价格了。  打开百度首页//www.baidu.com/输入圆柱模板出来的地址为:   html

[Asm]  纯文本查看 复制代码
?
1
https://www.baidu.com/s ? ie=UTF-8&wd=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF

   这串代码中:   算法

[Asm]  纯文本查看 复制代码
?
1
E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF

是表明圆柱模板的代码   再出来的页面中输入你要的品牌,好比鹏程圆柱模板,输入完毕后,点百度一下。     数组

[Asm]  纯文本查看 复制代码
?
1
https://www.baidu.com/s ? bs=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&f=8&rsv_bp=1&wd=%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&inputT=54390[/font][/color]


   这串代码中:
   
cookie

[Asm]  纯文本查看 复制代码
?
1
%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF


    是不变的,表明:圆柱模板  关键词   f=8这个数值是会变更的。范围为:  0-9.数值越高,表明着这个相关搜索的词越容易作上去。   
app

[Asm]  纯文本查看 复制代码
?
1
%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%

   表明的是:鹏程圆柱模板 这个相关词的代码   搜索引擎

[Asm]  纯文本查看 复制代码
?
1
inputT=54390

    表明这个是表明搜索结果出来的运算时间   

  相关搜索算法实现原理:用户后继词原理:
把用户在5分钟以内在搜索引擎中搜索词定义为一次搜索行为,那么就造成了搜索日志,搜索日志以下:
cookie:用户cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
接着按用户进行分类,时间间隔5分钟进行数据清理,[x1,x2.....]一个数组表示一次搜索行为,每一个数组的第一位就是当次搜索行为的第一个搜索词。
cookie:用户cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
对于单个用户来讲搜索后继词的肯定性是不够的,好比搜索科比,可是一看到旁边有人我就马上改变搜索培训,那么这两个词是没有相关性质的。那么就加入统计规则去掉一些杂质,好比某个词B只有出如今5个用户的相同的搜索词A的后继词中才算一个A的后继词,还有其余的一些规则,这么下来,日志就变成了。
   key:A succeed:A1,A2,A3.....
  用户协同过滤原理:
   key:A succeed:A1,A2,A3.....     用户协同过滤原理:    从搜索词算法实现:    若是一个关键词搜索词结果,跟另一个,甚至几个关键词搜索出来的结果不少交集,那么这些关键词极可能也是语义相关的词。   从搜索日志来看例子:   key:搜索词 time:搜索时间 cookie:用户cookieid result:a,b,c,d,e(前5个搜索结果)此次,咱们只用key和result两项,稍微处理下来之后就变成了
key:搜索词A result:a,b,c,d,e(前5个搜索结果)
key:搜索词B result:a,f,c,g,m(前5个搜索结果)
若是咱们把每一行数据的result想象成一篇文档,result里面的每一个结果集想象成一个词语,那么这其实就是求两个文档之间的类似性了,从头至尾过一遍就能够找到每一行数据和它最类似的数据了,而每一行能够用当行的搜索词表示,这么一算下来数据就变成这样子了,后面的括号里面是两个词的类似度key:搜索词Asucceed:搜索词B(0.8)搜索词C(0.6).....
key:搜索词Bsucceed:搜索词A(0.8)搜索词E(0.7).....
有了上面这个数据,拍一个阈值(好比0.7)卡一下,就获得最后的相关搜索的结果了。
这个计算类似性的方法的计算量比较大,并且阈值没有卡好的话容易出现不相关的结果,在实际工程应用中使用得很少,下面这个方法使用得更多点,至关于这个的增强版。
从用户搜索结果集考虑
若是某个搜索结果(好比一个网页或者一个商品)出如今了不一样的搜索词的结果集中,那么这些个搜索词极可能是相关的,若是这个搜索结果在不一样的搜索词下都被点击了,那么这些个词的相关性就更高了。
   点击的加成是很强大的,并且在数据量巨大的状况下,咱们能够只考虑点击的状况,仍是拉出搜索日志,不过此次是搜索点击日志了,拉出来处理一下就变成下面这个样子,每行就是某个搜索词下点击的商品key:搜索词Aclick:结果A结果B结果C
这个样子和上面第二种方法最后出来的样子基本同样,不过此次是点击数据,相关性可比直接的搜索结果要好不少了,由于搜索结果取决于你的搜索算法,而这种点击数据是来自用户的,人的可靠性可高了很多,因此说这个是上一个的增强版。
   咱们能够按照上一个的方法按文本类似性的方法进行处理,可是计算量也比较大,若是再仔细看看这个数据的样子,若是咱们把相关搜索系统想象成豆瓣,搜索词当作豆瓣的用户,搜索结果集当作是豆瓣的电影,那么相关搜索就变成了一个豆瓣的猜你感兴趣的人,也变成了一个协同过滤的推荐系统了(协同过滤算法能够参考文章最后的连接),上一节的协同过滤算法的数据是词和后继词,这里是词和点击结果,虽然数据集不一样,可是能够用同样的算法,因此,搜索和推荐技术实际上是密不可分的,既然这样,彻底能够用协同过滤算法进行推荐了。
   协同过滤的算法,简单版本总体不会超过200行,很容易实现的。
    经过这样的方式,容易推出意思相近的词,一样也容易推出看似彻底不相关但仔细想一想仍是靠谱的词,就像下面这样,他们虽然不见得近义词,可是极可能会点击到同一个结果上。
spa

转载自:日志

https://www.52pojie.cn/thread-1038009-1-1.html?from=timeline&isappinstalled=0code

相关文章
相关标签/搜索