网站流量分析的数据来源
这篇是读书笔记。
常见的数据获取方式:网站日志文件,web beacons打点,js页面标记。
网站日志与js标记:
网站日志形式常见的是apache日志格式,记录服务器的每次请求。所以网站的日志记录的是网站分析的最原始数据

包括:
1)访问终端IP地址,移动设备也有IP地址
2)访问时间点,有了时间点就可以判断用户页面浏览的先后顺序。
3) 访问地址路径

4)访问来源


下面再来了解一下JS获取数据的方式,通过在网站也main实施JS代码来获取数据是目前较为流行的方法,很多工具都在用这个方法,无论是omniture,webtrends,还是免费的google analytics,CNZZ和百度统计





上面有几个有用的参数:
Utmcc:cookie里存储的数据流量来源,访问次数等
用户识别:

IP地址:弊端是伪IP,代理,IP,局域网共享同一公网IP出口会干扰获取的IP地址的唯一性和准确性
IP+User agent:对于用户而言,当使用相同的终端浏览网站时,user agent的信息是相对固定的操作系统和浏览器

Cookie:是网站以小段文本的形式存放在用户本地终端信息,以便网站之后的读取,cookie有有效期限,google analytics是2年。

Userid:如果网站需要注册,那注册后有个id,这个id是唯一且标识用户身份,网站会把它写入到cookie以便下次访问判断用户身份

网站一个用户每次完整访问的过程,通过每次访问记录整理后先后顺序呈现:






网站分析中的各指标:
1)IP:


google将IP地址汇总并只显示到市/县,可以很好保护隐私
2)浏览量和唯一身份浏览量:
浏览量:网站页面被加载的总次数=每个访问者*每个访问者的总访问次数
唯一身份浏览量:汇总由同一用户在同一会话旗舰生成的浏览量
3)网站停留时间,页面停留时间:
4)跳出率与退出率:

跳出针对的是访问者来到网站后访问的第一个页面,即访问者的登录页面



5)某段时间的访问时长和访问深度:






