刷百度相关参数详解

时间 2019-11-07

标签百度相关参数详解繁體版

原文原文链接

因不少人须要百度相关搜索，不少人用这个技术卖钱，本身本着技术的爱好，把这个分享给你们！刷相关搜索的实现方法：第一：好比圆柱模板，咱们能够先搜索圆柱模板厂家，而后接着再去搜索圆柱模板价格，那么天天以几倍的方式增长，当达到必定搜索量的时候，那么圆柱模板的相关词搜索就会出现圆柱模板价格了。打开百度首页//www.baidu.com/输入圆柱模板出来的地址为： html

[Asm] 纯文本查看复制代码

1	`https://www.baidu.com/s` `?` `ie=UTF-8&wd=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF`

这串代码中：算法

[Asm] 纯文本查看复制代码

1	`E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF`

是表明圆柱模板的代码再出来的页面中输入你要的品牌，好比鹏程圆柱模板，输入完毕后，点百度一下。数组

[Asm] 纯文本查看复制代码

1	`https://www.baidu.com/s` `?` `bs=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&f=8&rsv_bp=1&wd=%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&inputT=54390[/font][/color]`

这串代码中：
cookie

[Asm] 纯文本查看复制代码

1	`%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF`

是不变的，表明：圆柱模板关键词 f=8这个数值是会变更的。范围为： 0-9.数值越高，表明着这个相关搜索的词越容易作上去。 app

[Asm] 纯文本查看复制代码

1	`%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%`

表明的是：鹏程圆柱模板这个相关词的代码搜索引擎

[Asm] 纯文本查看复制代码

1	`inputT=54390`

表明这个是表明搜索结果出来的运算时间

  相关搜索算法实现原理：用户后继词原理：
把用户在5分钟以内在搜索引擎中搜索词定义为一次搜索行为，那么就造成了搜索日志，搜索日志以下：
cookie:用户cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
接着按用户进行分类，时间间隔5分钟进行数据清理，[x1,x2.....]一个数组表示一次搜索行为，每一个数组的第一位就是当次搜索行为的第一个搜索词。
cookie:用户cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
对于单个用户来讲搜索后继词的肯定性是不够的，好比搜索科比，可是一看到旁边有人我就马上改变搜索培训，那么这两个词是没有相关性质的。那么就加入统计规则去掉一些杂质，好比某个词B只有出如今5个用户的相同的搜索词A的后继词中才算一个A的后继词，还有其余的一些规则，这么下来，日志就变成了。
key：A succeed：A1,A2,A3.....
  用户协同过滤原理：
key：A succeed：A1,A2,A3.....    用户协同过滤原理：从搜索词算法实现：若是一个关键词搜索词结果，跟另一个，甚至几个关键词搜索出来的结果不少交集，那么这些关键词极可能也是语义相关的词。从搜索日志来看例子： key:搜索词 time:搜索时间 cookie:用户cookieid result:a,b,c,d,e(前5个搜索结果)此次，咱们只用key和result两项，稍微处理下来之后就变成了
key:搜索词A result:a,b,c,d,e(前5个搜索结果)
key:搜索词B result:a,f,c,g,m(前5个搜索结果)
若是咱们把每一行数据的result想象成一篇文档，result里面的每一个结果集想象成一个词语，那么这其实就是求两个文档之间的类似性了，从头至尾过一遍就能够找到每一行数据和它最类似的数据了，而每一行能够用当行的搜索词表示，这么一算下来数据就变成这样子了，后面的括号里面是两个词的类似度key：搜索词Asucceed：搜索词B(0.8)搜索词C(0.6).....
key：搜索词Bsucceed：搜索词A(0.8)搜索词E(0.7).....
有了上面这个数据，拍一个阈值(好比0.7)卡一下，就获得最后的相关搜索的结果了。
这个计算类似性的方法的计算量比较大，并且阈值没有卡好的话容易出现不相关的结果，在实际工程应用中使用得很少，下面这个方法使用得更多点，至关于这个的增强版。
从用户搜索结果集考虑
若是某个搜索结果(好比一个网页或者一个商品)出如今了不一样的搜索词的结果集中，那么这些个搜索词极可能是相关的，若是这个搜索结果在不一样的搜索词下都被点击了，那么这些个词的相关性就更高了。
点击的加成是很强大的，并且在数据量巨大的状况下，咱们能够只考虑点击的状况，仍是拉出搜索日志，不过此次是搜索点击日志了，拉出来处理一下就变成下面这个样子，每行就是某个搜索词下点击的商品key：搜索词Aclick:结果A结果B结果C
这个样子和上面第二种方法最后出来的样子基本同样，不过此次是点击数据，相关性可比直接的搜索结果要好不少了，由于搜索结果取决于你的搜索算法，而这种点击数据是来自用户的，人的可靠性可高了很多，因此说这个是上一个的增强版。
咱们能够按照上一个的方法按文本类似性的方法进行处理，可是计算量也比较大，若是再仔细看看这个数据的样子，若是咱们把相关搜索系统想象成豆瓣，搜索词当作豆瓣的用户，搜索结果集当作是豆瓣的电影，那么相关搜索就变成了一个豆瓣的猜你感兴趣的人，也变成了一个协同过滤的推荐系统了(协同过滤算法能够参考文章最后的连接)，上一节的协同过滤算法的数据是词和后继词，这里是词和点击结果，虽然数据集不一样，可是能够用同样的算法，因此，搜索和推荐技术实际上是密不可分的，既然这样，彻底能够用协同过滤算法进行推荐了。
协同过滤的算法，简单版本总体不会超过200行，很容易实现的。
经过这样的方式，容易推出意思相近的词，一样也容易推出看似彻底不相关但仔细想一想仍是靠谱的词，就像下面这样，他们虽然不见得近义词，可是极可能会点击到同一个结果上。spa

转载自：日志

https://www.52pojie.cn/thread-1038009-1-1.html?from=timeline&isappinstalled=0code