除了Alexa,我们还能相信谁的数据?

yoken 阅读:1513 2008-03-01 22:12:00 评论:0

最近Alexa网站排名在国内互联网界引起了不小的震荡,除了互相竞争的揭露以外,对 Alexa排名机制的详细解剖和反思成为另一个热点。毫无质疑,中国互联网发展到今天,人们对于排名、浏览量等数据已经非常关注,而且一定程度上也成为互联网业内互相评判的依据,成为网站获取广告和投资的重要卖点。然而,当人们开始质疑被视为权威的Alexa 数据时,当国内各种排名发布、数据统计日益增多时,我们该相信谁的数据呢?

部分国内网站因私利造假 Alexa数据开始受到质疑

作为一个国际互联网站的数据监测和统计站点,Alexa自从进入中国互联网人视野以来,就被视为公正、权威的象征。中国的网站纷纷加入Alexa网站监测行列,以此来衡量自己网站的位置,业界更是将其视为评测中国网站的权威,各家网站纷纷采用Alexa的数据来说明自己的实力。一些网站还以此数据为基础进行中国网站的排名和监测,并努力试图将其推举为中国的行业标准,比如:互联网实验室的CIIS指数,就是以ALexa 数据为基础的一种算法,实时免费地向公众发布国内网站的监测和排名信息。

然而,近期由于知名网站Alexa数据的剧烈变化,人们方才开始质疑这个被视为权威的"世界著名的第三方测评机构"。其实,早在Alexa进入中国最初,就有文章对其排名机制进行了解析,从这种机制本身而言,就无法排除"作弊"。前几年,某韩国网站Alexa世界排名的骤升,就曾引起过一些人的怀疑。可以说,有些网站挖空心思对Alexa数据"作弊"在中国也一直存在,只是此次由于发生在知名网站,所以才引起如此大范围的关注而已。

自从Alexa受到国人关注,国内研究Alexa排名机制的人就一直存在,而且关于如何提升排名等的小技巧也在网上广为流传。国内互联网界越是将Alexa 视为权威,如何在Alexa中获得一个好的位置也就备受各网站的重视,关于如何提升Alexa排名的技巧专研也就越专业,因此,此次事件只是众多事件的一个偶然,只是由于网站本身的知名度使得可能存在的Alexa"作弊"放大。

此事的意义在于由此引发的国人关于网站统计数据的反思和广泛的讨论。人们从对数据的简单关注和盲目崇拜,走向质疑数据、寻找数据的依据、考察数据的来源。

  除了Alexa,我们还能依赖谁?

中国互联网发展到今天,细分市场、准确的市场定位已经成为网站赢利甚至生存的必须。即使综合门户网站也不得不在众多的服务中寻找自己最有利的赢利点。因此,通过详细、可靠的网站数据分析和统计,找到网站的真实用户,挖掘网站可能的目标用户,已经成为各网站非常关注的事。很多网站为此专门设置了数据挖掘部门,或者由相关部门承担数据挖掘工作,对自己网站的访问情况和用户行为进行跟踪分析,以此不断地调整网站的内容和定位。然而,对于网站赢利来说,更为关键的是,通过找准实际的用户,才能更加有效的进行广告的有效投放和吸引。

通过数据挖掘,各家网站内部对自己的数据可能有所了解,然而,整个行业的情况是什么样却难以掌握。不了解整个行业,不仅大的定位和部署难以有的放矢,而且也极大的限制了新服务和产品的开发。因此,国内也出现了一些专业的互联网数据监测、评估站点和机构,以独立的、第三方的角度进行数据采集与分析,并通过大量数据的累积进行行业的数据发布和预测。

当前,国内比较流行的网站监测和评估网站从基本机制上主要可以分为两类:一类是类似于Alexa的,基于客户端的统计。一类是基于被统计对象的网页统计。前者一般是通过工具条、主动加入等方式,从网民的客户端访问记录来进行数据的搜集和统计。这种统计机制与Alexa存在着同样的缺点,比如:作弊漏洞、用户信息极其模糊等系统问题。当前国内大部分的公开统计数据多是通过此种方式获得的,比如:互联网实验室、艾瑞等网站发布的信息。后者则是通过在被统计的网站页面嵌入相应的代码,来获取网站被访问的各种细致信息以及网站真实的访问者信息。由于这种方式可以详细定位于网站的任何部位,因此所获信息细致可靠。大部分网站自己设计的数据挖掘部门大部分都是采用这种方式,另外也有专门从事这种详细数据搜集和分析的专业公司,比如:北京缔元信互联网数据技术有限公司的万瑞数据。


【图1】万瑞数据的产品服务之一:提供网站独立访问者和浏览量日趋势图

然而,正如前面提到的那样,各家公司自设的数据挖掘部门的数据,各自有各自的标准,各自有各自的统计方法,各自有各自的用途和目的,而且被企业视为机密,因此数据虽然详实可靠,却不利于对行业情况的了解和评估,不能为业内所共享和开发,也不利于整个行业的监测,尤其对于广告商是不透明的。缔元信公司的万瑞互联网数据平台提供的专业数据的采集,在保证单个对象数据保密的基础上,通过第三方数据的长期积累,有可能逐渐勾勒出行业的整体面貌,使业界受益。毕竟,第三方监测机构,在国内发展时间短,各家的指标和标准难以统一,数据来源和统计方法各不相同,因此很难形成业界公认的标准和权威,而且对于一些机构也难以排除商业运作(比如竞价排名)的可能。这也是国内网站很大程度依赖Alexa数据的原因之一。

我们需要什么样的数据?

用数据说话,用数据证明实力,用数据吸引广告,已经成为互联网业界的共识。对于网站,数据是网站了解自身发展状况,摸清实在用户情况的必需,是进行战略部署、内容调整、定位开发等的基础;对于业界,数据有利于了解整个行业的状况、预测行业走向,了解自己在行业中的位置,寻找自己的竞争优势;对于广告商,透明真实的数据是准确选择广告投放的依据,是凸显广告效果的前提;对于国家,真实掌握网站行业发展的情况、动向至关重要。因此,真实、公正、标准的评测数据,已成为网站公平竞争的基础和行业健康发展的必备环境。

每家网站都设立一个数据挖掘部门,除了前面所说的不能获得行业数据和透明数据外,而且就整体而言,是成本和资源的巨大浪费,随着互联网行业的发展,数据挖掘从网站分离出来,由专业的数据公司来承担,是一种必然趋势。那么,对于一个专业的互联网数据挖掘公司,至少应具备哪些条件,才能提供真正有用的数据呢?

一是真实性。无论提供的是哪方面的数据,这些数据必需首先是真实可靠的,才有可分析、利用的价值。当前,依靠客户端统计的专业监测网站的数据采集大多通过工具条或者插件对到访的用户进行计数。这种方式可能受到工具条下载、安装,以及用户端设置的影响。用户设置的安全级别、刷屏次数等等都可能产生较大的数据误差,也难以避免"作弊"。另一方面,通过"推"的方式在用户不知情的情况下进行数据采集,也存在道德上的争议。但是,由于这种方式推广比较容易,数据和样本可以短时间内迅速累积,因此在国内比较流行。新出现的万瑞数据是比较少的采用页面嵌入代码的方式,从被监测的网站内部进行数据的搜集。这种方式获取的数据较前者更为真实可靠,而且可以有效避免"作弊",但是推广难度较大,普通大众对此知之甚少。

二是精准度。排名、页面浏览量、点击率等大而泛的数据,对于深度分析挖掘并没有多大的意义,这些只是糊弄普通网民的噱头,对于网站和广告商精准、详尽、有深度的数据才是真正有用的数据。比如:网站某个频道的实时访问情况,甚至网站每一条信息的具体浏览情况等等。只有数据细致到可以针对每一个希望了解和监测的部分,才能更有效地进行策略的调整和定位。另外对于用户数据,无论是人口学特征的统计还是使用行为的追踪,一是需要统计确切的用户,也就是说,确确实实访问了页面的用户;二是用户详细行为的追踪,比如用户从哪里来,做了什么,停留了多久,在哪里停留的,去到了哪里等等,这样才能够进行用户的细致分类,然后针对不同类型的用户制定不同的策略。

三是公正。对于网站和广告商而言,数据的真实和精准可能是最重要的。然而,对于整个行业的发展来说,公正则至为要紧。因为公正的数据发布和评估是保证公平竞争和网站健康发展的基础,也是影响政府政策的重要因素。因此,形成一个公正的监测、评估体系,对于整个行业的发展非常必要,归根到底,每个企业都会在好的环境下平等自由地发展,都会从中受益,而迟早都要受到劣质环境的危害。然而,要保证公正,除了数据公司要有社会责任感、坚持公正的理念以外,更需要政府出台相关的制度进行规范和保证,政府要通过相关措施,促进健康、公平的竞争环境的形成。

  谁为我们提供这些数据?

无论从哪个方面考虑,我国都迫切需要基于中国本土的中文网站的监测和评估专业数据。一是,我国网站数量已经达到相当规模,今年7月,CNNIC发布的最新统计显示,我国网站数量达到131万个。二是,国际的监测机构主要以英文为主,由于汉语的特殊性,华文网站的真实情况并不能很好反映。三是,无论是行业还是政府相关管理机构,不可能依靠国外的监测机构获取中国网站的数据。因此,国内迫切需要网站监测和评估的专业数据挖掘机构,这样的机构要能够提供真实、精准的网站统计数据,并且希望能发布公正的行业监测数据,充当行业的监察官。

国内现有的有意往此方向发展的公司或机构,当前普遍存在两个主要的问题:一是,在数据采集和搜集策略上不够完善,数据的真实性有待提高;二是,追逐经济利益远远高于行业使命感和社会责任感,难以保证数据公正。甚至存在为了取悦客户,而进行数据作假的情况。可喜的是,这些数据公司也开始意识到这些问题,不断地完善数据采集策略,并通过各种方式努力推动线上和线下调查的结合。比如:艾瑞推出的各种分系列的数据。另外也出现了像缔元信这样用新的方式进行数据数据采集的专业公司。他们不仅在数据采集环节通过嵌入代码来保证数据的可靠,而且致力于更详细数据的采集,比如:可以具体到某条信息的监测,可以覆盖包括基本信息、内容信息、用户信息、客户端信息等众多方面,可以根据各种需求进行特定监测和分析。对于用户的监测,除了数量、地区基本信息外,更注重于用户忠诚度的评测和用户行为的追踪。


【图2】万瑞数据的产品服务之一:提供网民深度访问趋势图

Alexa 的权威被打破是好事,业界广泛的关于数据质量和标准的讨论更具意义,在质疑和讨论中,我国的数据挖掘、数据监测体系开始受到关注,数据质量、统一标注、行业评估开始探索,这些对于我国互联网行业的发展都具有积极的意义。我们期待着业内和专业数据公司共同努力,尽早建立中国的互联网专业数据监测和评估系统,形成适合中国互联网站发展的监测和评估标准,让我们自己用真实、精准、公正的数据为中国的网站说话。 (中国社会科学院新闻与传播研究所 杨斌艳)

转载保留链接!网址:https://80920140.com/post/380.html

标签:羊年
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源; 2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任; 3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容