做过网站统计的都经常会涉及pv、IP、UV、PR这几个简写,但是真正全部知道其所有意思的人却并不是很多。下面就此详细介绍一下(网络搜集整理):
什么是PV:
PV是page view的简写。PV是指页面刷新的次数,每一次页面刷新,就算做一次pv流量。
PV高一定代表来访者多吗?
解答:不一定如此,一般来说,PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量,例如,同一个来访者通过不断的刷新页面,也可以制造出非常高的PV。
PV(pageview),即页面浏览量,或点击量;通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。
高手对PV的解释是,一个访问者在24小时(0点到24点)内到底看了你网站几个页面。这里需要强调:同一个人浏览你网站同一个页面,不重复计算PV量,点100次也算1次。说白了,PV就是一个访问者打开了你的几个页面。
PV之于网站,就像收视率之于电视,从某种程度上已成为投资者衡量商业网站表现的最重要尺度。
PV的计算:当一个访问者访问的时候,记录他所访问的页面和对应的IP,然后确定这个IP今天访问了这个页面没有。如果你的网站到了23点,单纯IP有60万条的话,每个访问者平均访问了3个页面,那么pv表的记录就要有180万条。
有一个可以随时查看PV流量以及你的网站世界排名的工具alexa工具条,安装吧!网编们一定要安装这个。
网站的PV值,即网站的人均浏览次数;
Page Views:这个数据反映到访的网民对特定网站的使用率,Page Views就是每个用户浏览的页面数量,简称PV。某网站的PV值是每天所有访问该网站的Alexa工具条用户在该网站上浏览的总页面数的平均值,而同一人对相同页面的重复浏览在每天只计作一次。
更详细地解释:
Alexa的世界网站排名如何计算的?
Alexa每三个月公布一次新的网站综合排名。此排名的依据是用户链接数(Users Reach)和页面浏览数(Page Views)三个月累积的几何平均值。
User Reach:Alexa提供了一个叫做Reachpermillionusers(每百万用户访问人次,简称Reach)的数据来表示访问人数,这个数据指的是每一百万个Alexa工具条用户中每天访问某一网站的平均人数。
Page Views:这个数据反映到访的网民对特定网站的使用率,Page Views就是每个用户浏览的页面数量,简称PV。某网站的PV值是每天所有访问该网站的Alexa工具条用户在该网站上浏览的总页面数的平均值,而同一人对相同页面的重复浏览在每天只计作一次。
TrafficRank(网站流量排名,简称Rank):根据Users Reach和Page Views就可以计算网站流量排名,是基于该网站3个月访问量记录的平均值,而不是当天的流量。Rank就是Reach和PV的几何平均数,也就是两者乘积的平方根,通过这两个量的三个月累积值的几何平均得出当前名次。
总结:一个网站的Reach和PV值越高,其Rank也就越高,也就是网站排名越高。
例如google.com,其4.0的PV值在一般的网站来说并不算高,但是,由于Google搜索引擎的用户非常多,其Reach值远高于一般的网站,就使得google.com的Rank达到4,也就是说,google.com当天的全球排名是第四位。
现在国内的站点都号称自己能统计pv,不过听我讲完pv到底是什么,估计所有的站长都要笑了。
pv的意思,就是一个访问者在24小时(0点到24点)内到底看了你网站几个页面。
不过在国内,由于站长普遍素质不高,理解的是五花八门。有的是认为就是刷一次算一次,有的认为是cookies记录一次,有的认为是cookies记录每个页面一次。国内计数器采用第一种理解的比较多,第二种就相当少了,第三种虽然也是错误理解,但毕竟和正确结果有些相紧,但是总比完全错误强。不过及时是第三种的记录方法,由于他的cookies记录需要相当的技术水平来编写,还没有采用这种方法的。
真正的pv是怎么计算的呢,就是当一个访问来访问的时候,记录他所访问的页面和对应的ip,然后确定这个ip今天访问了这个页面没有,由于涉及的元素有两个就比单纯记录ip要多一列。具体的比对方法比较复杂,我这里就不更深入说了,仅从数据库的量上来描述一下吧,如果到了23点,单纯ip有60万条的话,每个访问者平均访问了3个页面,那么pv表的记录就要有180万条,每来一个访问者除了比对那60万ip外,还要继续比对这180万的pv表,大家就可以想象这种运算量了。
所以说,国内现在不仅记录24小时独立ip的统计寥寥可数(一些付费统计还是记录24小时独立的),记录pv的更是根本没有,我在服务器负载低的时候曾经常识过统计pv,但是很快就被运算量难住了,再cpu和相关设备性能提升十倍以前,我都不准备提供此项服务.
什么是UV:
UV(uniquevisitor),指访问某个站点或点击某条新闻的不同IP地址的人数。
在同一天内,UV只记录第一次进入网站的具有独立IP的访问者,在同一天内再次访问该网站则不计数。独立IP访问者提供了一定时间内不同观众数量的统计指标,而没有反应出网站的全面活动。
UV是unique visitor的简写,是指独立用户。
什么是独立用户?它和IP的概念有什么区别?
解 答:ip在这里是指,公用的广域网传输协议族(Tcp/Ip)为每一台处在因特网上的计算机(可以是个人电脑、服务器以及其他兼容广域网传输协议族规定的 接入设备)都定义了四个段落(例如:192.168.0.255形式,有时会加入第五段落端口号作为描述信息,端口号是介于1-65535之间的数字)共 32位长度二进制代码的标识,叫IP协议地址,简称ip地址,俗称ip,它是一个一台连接着广域网的计算机区别于其他机器的标识,一般情况下,它在同一级 别的网络(例如某个局域网、社区网、教学楼网或者INTERNET)范围内是唯一的。
独立用户是指不同的、通过互联网访问、浏览这个网页的自然人。
比 如,在一台电脑上,哥哥打开了微软的官方主页,注册了一个会员。弟弟一会儿也看了看,注册了另一个会员。由于兄弟两个使用的是相同的计算机,那么他们的 ip是一样的,微软的官方计数器记录到一个ip登陆的信息。但是,具有统计功能的统计系统,可以根据其他条件判断出实际使用的用户数量,返回给网站建设者 真实、可信和准确的信息。比如通过注册的用户,甚至可以区分出网吧、机房等共享一个ip地址的不同计算机。
使用独立用户作为统计量有什么好处?它比ip更加准确吗?
解答:ip是一个反映网络虚拟地址对象的概念,独立用户是一个反映实际使用者的概念,每个独立用户相对于每个ip,更加准确地对应一个实际的浏览者。使用独立用户作为统计量,可以更加准确的了解单位时间内实际上有多少个反问者来到了相应的页面.
什么是IP:
IP是国际互联网协议(Internet Protocol)的简称,是通过网络间信息地址定位具体计算机的方式之一。
统计独立IP的主要作用是什么?
独立IP表示,拥有特定唯一IP地址的计算机访问您的网站的次数,因为这种统计方式比较容易实现,具有较高的真实性,所以成为大多数机构衡量网站流量的重要指标。
什么是PR:
PR值,即PageRank,网页的级别技术。取自Google的创始人Larry
Page,它是Google排名运算法则(排名公式)的一部分,用来标识网页的等级/重要性。级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。
例如:一个PR值为1的网站表明这个网站不太具有流行度,而PR值为7到10则表明这个网站非常受欢迎(或者说极其重要)。
我们可以这样说:一个网站的外部链接数越多其PR值就越高;外部链接站点的级别越高(假如Macromedia的网站链到你的网站上),网站的PR值就越高。例如:如果ABC.COM网站上有一个XYZ.COM网站的链接,那为ABC.COM网站必须提供一些较好的网站内容,从而Google会把来自XYZ.COM的链接作为它对ABC.COM网站投的一票。
你可以下载和安装Google工具条来检查你的网站级别(PR值)。
平原总结:对于网编来说,你的浏览器上有没有alexa工具条,有没有google工具条,是判断一个网编是否懂推广的一个重要标准。如果你没有,那么从今天开始,赶快装上吧!
以Sina网新闻频道为例:
一条新闻发布以后,其PV数据便可以加以跟踪,通常是每5分钟统计一次。不同品牌的网站的不同频道,对其所发布的新闻的PV表现有一个大致的评判尺度。新闻发布后,一般PV值总有一个上升的过程。可以从不同时段的PV表现,来计算PV的单位时间变化幅度,有经验的网络编辑,经过几个5分钟的数据积累,便能大致预料到这条新闻的PV峰值水平。如果这个水平不能令人满意,则编辑就要采取一些手段,如“优化”标题,或者增加其他吸引眼球的元素,如图片。一般来说,通过这样的“处理”,一条新闻的pv表现能有所改善,达到新的高峰。
也就是说,网络新闻的编辑手段影响着pv值。
还有哪些因素对PV有影响呢?至少还有这些因素:
新闻发布的时间
不同的时间段,上网的人数不同,访问该站点的人数也不同,因此,有时PV值的涨落,其主要贡献,在于不同时段上网人数的自然波动。同样一条新闻,在不同的时段发布,PV表现就会有差别。
不同时段上网的人,其人口特征(性别、年龄、教育程度、阅读旨趣等)不同,所以,同样是1万个上网的人,甚至同样是对某个网站的1万次访问,不同时段,这1万次访问在不同频道/内容上的分布是有差别的。所以有时,pv的变化,和这个因素导致的变化有关。
访问的周期
对于一些常浏览的网站,我们可能一天之中会访问几次,这中间有一定的时间间隔。这个间隔,很多时候和人们的现实工作节奏有关系。比如,不少人一上班会抽空浏览一下新闻,第二次再来看看又有什么新闻的时候,往往是上午中间休息时,甚至是午饭后的休息时间。因此,即使其他因素不变,由于人们回访网站的周期性,也会对新闻或网站的pv带来影响。当然,由于不同的人回访的周期长短不一、时段不一,这个影响因素未必会导致明显的波动,而可能分散在不同时段的PV表现中,但可以肯定的是,任何一个PV数据,也有这种回访周期的因素所起的作用。
突发事件因素。
比如一些突发事件,会导致人们对某一网站的访问增加,但这些访问的初衷,本只是突发事件相关新闻。然而由于人们的新闻消费,往往具有不可预期性,所以常见的现象是,人们在看完想看的新闻后,还会顺带看看其他的。这一因素,也可能对某条新闻(与突发事件无关)的pv有所贡献。
最后,当然是一些偶然因素(其实搭便车因素也属于此)。包括哪些呢?比如天气因素,比如非典期间,等待。还有什么?可以想一想:-)
由此看来,一个简单的pv数据,其实是多种因素综合贡献的结果,所以有时的pv涨落,实在不是完全可以通过编辑手段来加以引导和影响的。知道这一点很重要。因为这告诉我们,盲目的不加具体分析的以pv来衡量成败好坏,是不合理的。
在社会科学研究中,这种区分不同因素对某一个现象的贡献,就是所谓的详析模式。很多我们看似不变的东西,其实内部构成比例上发生了很大的变化。而有些看似变化的东西,其相对关系其实没有什么变化,只是一种单纯的数量上的涨落。
这使我想到那本《统计陷阱》,一本由一个记者所写的通俗读物。这本书的英文名称直译,叫“如何用统计数据说谎”。