如何用网页脚本追踪用户

本文介绍如何编写 JavaScript 脚本,将用户数据发回服务器。javascript

我作了一个代码仓库,包含了下面全部的例子,能够运行查看效果。java

1、同步 AJAX

数据发回服务器的常见作法是,将收集好的用户数据,放在unload事件里面,用 AJAX 请求发回服务器。git

可是,异步 AJAX 在unload事件里面不必定能成功,由于网页已经处于卸载中,浏览器可能发送,也可能不发送。因此,要改为同步 AJAX 请求。github

window.addEventListener('unload', function (event) {
  let xhr = new XMLHttpRequest();
  xhr.open('post', '/log', false);
  xhr.setRequestHeader('Content-Type', 'application/x-www-form-urlencoded');
  xhr.send('foo=bar');
});

上面代码中,xhr.open()方法的第三个参数是false,表示同步请求。web

这种方法最大的问题在于,浏览器逐步将不容许在主线程上面,使用同步 AJAX。因此,上面代码实际上不能用。浏览器

2、异步 AJAX

异步 AJAX 实际上是能用的。前提是unload事件里面,必须有一些很耗时的同步操做。这样就能留出足够的时间,保证异步 AJAX 可以发送成功。服务器

function log() {
  let xhr = new XMLHttpRequest();
  xhr.open('post', '/log', true);
  xhr.setRequestHeader('Content-Type', 'application/x-www-form-urlencoded');
  xhr.send('foo=bar');
}

window.addEventListener('unload', function(event) {
  log();

  // a time-consuming operation
  for (let i = 1; i < 10000; i++) {
    for (let m = 1; m < 10000; m++) { continue; }
  }
});

上面代码中,强制执行了一次双重循环,拖长了unload事件的执行时间,致使异步 AJAX 可以发送成功。app

3、追踪用户点击

setTimeout也能拖延页面卸载,保证异步请求发送成功。下面是一个例子,追踪用户点击。异步

// HTML 代码以下
// <a id="target" href="https://baidu.com">click</a>
const clickTime = 350;
const theLink = document.getElementById('target');

function log() {
  let xhr = new XMLHttpRequest();
  xhr.open('post', '/log', true);
  xhr.setRequestHeader('Content-Type', 'application/x-www-form-urlencoded');
  xhr.send('foo=bar');
}

theLink.addEventListener('click', function (event) {
  event.preventDefault();
  log();

  setTimeout(function () {
    window.location.href = theLink.getAttribute('href');
  }, clickTime);
});

上面代码使用setTimeout,拖延了350毫秒,才让页面跳转,所以使得异步 AJAX 有时间发出。post

4、反弹追踪

追踪用户点击,还可使用反弹追踪(bounce tracking)。

所谓"反弹追踪",就是网页跳转时,先跳到一个或多个中间网址,以便收集信息,而后再跳转到原来的目标网址。

// HTML 代码以下
// <a id="target" href="https://baidu.com">click</a>
const theLink = document.getElementById('target');

theLink.addEventListener('click', function (event) {
  event.preventDefault();
  window.location.href = '/jump?url=' + 
    encodeURIComponent(theLink.getAttribute('href'));
});

上面代码中,用户点击的时候,会强制跳到一个中间网址,将信息携带过去,处理完毕之后,再跳到原始的目标网址。

谷歌和百度如今都是这样作,点击搜索结果时,会反弹屡次,才跳到目标网址。

5、Beacon API

上面这些作法,都会延缓网页卸载,严重影响用户体验。

为了解决网页卸载时,异步请求没法成功的问题,浏览器特别实现了一个 Beacon API,容许异步请求脱离当前主线程,放到浏览器进程里面发出,这样能够保证必定能发出。

window.addEventListener('unload', function (event) {
  navigator.sendBeacon('/log', 'foo=bar');
});

上面代码中,navigator.sendBeacon()方法能够保证,异步请求必定会发出。第一个参数是请求的网址,第二个参数是发送的数据。

注意,Beacon API 发出的是 POST 请求。

6、ping 属性

HTML 的<a>标签有一个ping属性,只要用户点击,就会向该属性指定的网址,发出一个 POST 请求。

<a href="https://baidu.com" ping="/log?foo=bar">
  click
</a>

上面代码中,用户点击跳转时,会向/log这个网址发一个 POST 请求。

ping属性没法指定数据体,彷佛只能经过 URL 的查询字符串携带信息。

7、参考连接

(完)

相关文章
相关标签/搜索