详解PV、UV、VV、IP及其关系与计算
通过kafka进行日志收集一、什么是PV?PV即Page View,网站浏览量,指页面浏览的次数,用以衡量网站用户访问的网页数量。用户每次打开一个页面便记录1次PV,多次打开同一页面则浏览量累计。一般来说,PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量,如同一个来访者通过不断的刷新页面,也可以制造出非常高的PV。具体的说,PV值就是所有访问者在24小时(...
- 通过kafka进行日志收集
一、什么是PV?
PV即Page View,网站浏览量,指页面浏览的次数,用以衡量网站用户访问的网页数量。
用户每次打开一个页面便记录1次PV,多次打开同一页面则浏览量累计。一般来说,PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量,如同一个来访者通过不断的刷新页面,也可以制造出非常高的PV。
具体的说,PV值就是所有访问者在24小时(0点到24点)内看了某个网站多少个页面或某个网页多少次。PV是指页面刷新的次数,每一次页面刷新,就算做一次PV流量。
度量方法就是从浏览器发出一个对网络服务器的请求(Request),网络服务器接到这个请求后,会将该请求对应的一个网页(Page)发送给浏览器,从而产生了一个PV。那么在这里只要是这个请求发送给了浏览器,无论这个页面是否完全打开(下载完成),那么都是应当计为1个PV。
二、什么是UV?
UV即Unique Visitor,独立访客数,指一天内访问某站点的人数,以cookie为依据。
1天内同一访客的多次访问只记录为一个访客。通过IP和cookie是判断UV值的两种方式。
用Cookie分析UV值
当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发出一个Cookie,通常放在这个客户端电脑的C盘当中。在这个Cookie中会分配一个独一无二的编号,这其中会记录一些访问服务器的信息,如访问时间,访问了哪些页面等等。当你下次再访问这个服务器的时候,服务器就可以直接从你的电脑中找到上一次放进去的Cookie文件,并且对其进行一些更新,但那个独一无二的编号是不会变的。
三、什么是VV?
VV即Visit View,访客访问的次数,用以记录所有访客一天内访问量多少次网站。
当访客完成所有的浏览并最终关掉该网站的所有页面时,便完成了一次访问,同一访客一天内可能有多次访问行为,访问次数累计。
四、什么是IP?
IP即独立IP数,指一天内使用不同IP地址的用户访问网站数量,同一IP无论访问了几个页面,独立的IP数均为1.
但是假如说两台机器访问而使用的是同一个IP,那么只能算是一个IP的访问。
IP和UV之间的数据不会有太大的差异,通常UV量和比IP量高出一点,每个UV相对于每个IP更准确地对应一个实际的浏览者。
①UV大于IP
这种情况就是在网吧、学校、公司等,公用相同IP的场所中不同的用户,或者多种不同浏览器访问您网站,那么UV数会大于IP数。
②UV小于IP
在家庭中大多数电脑使用ADSL拨号上网,所以同一个用户在家里不同时间访问您网站时,IP可能会不同,因为它会根据时间变动IP,即动态的IP地址,但是实际访客数唯一,便会出现UV数小于IP数。
五、实例说明
小明在家用ADSL拨号上网,早上8点访问了www.a.com下的2个页面,下午2点又访问了www.a.com3个页面。那么,对于www.a.com来讲,今天的PV、UV、VV、IP各项指标该如何计算呢?
PV-5
5 PV指浏览量,因此PV指等于上午浏览的2个页面和下午浏览的3个页面之和;
UV-1
1 UV指独立访客数,因此一天内同一访客的多次访问只计为1个UV;
VV-2
2 VV指访客的访问次数,上午和下午分别有一次访问行为,因此VV为2
IP-2
1 IP为独立IP数,由于ADSL拨号上网每次都IP不同,因此独立IP数位2;
统计实现策略
拦截器+redis
pv:页面方法放到redis作为key,value为当天访问次数,递增,当天凌晨入库昨天pv
uv:根据cookie作为key,放入redis,再并库,判断是否同一个cookie使用redis判断
MQ异步处理
更多推荐
所有评论(0)