我们在进行数据剖析的时辰,年夜部门时刻都在使用趋向剖析、斗劲剖析、细分剖析这三类体例,但其实还有一个体例我们也会经常使用——交叉剖析,尤其是在排查数据异常的问题时,交叉剖析就能揭示其强年夜的威力。此外要跟凯旅说声抱愧的是博客的更新频率可能没有那么频仍了,可是尽量每个月至少能发布一篇,但愿文章的质量有所保证,仍是接待巨匠留言谈判,能够倡议一些有趣的话题,一路拓展在网站数据剖析方面的思绪。
什么是交叉剖析?
交叉剖析是指对数据在分歧维度进行交叉揭示,进行多角度连系剖析的体例,填补了自力维度进行剖析没法发现的一些问题。
交叉剖析以多维模子和数据立方为基本,也可以认为是一种非凡的细分体例,但跟细分的概念有点差异,如不美观有乐趣可以先阅读下之前的文章——数据立方体与OLAP。细分的体例更多的是基于统一维度的纵深睁开,也就是OLAP中的钻取(Drill-down),好频年夜月汇总的数据细分来看天天的数据,就是在时刻维度上的细分,或者年夜省份的数据细分查看省份中各城市的数据,是基于地域维的下钻。交叉剖析不再局限于一个维度,就像数据立方体与OLAP文章中的立方体,是基于分歧维度的交叉,时刻维、地域维和产物维交叉在一路剖析每个小立方的数据默示,可以经由过程OLAP的切片(Slice)和切块(Dice)操作查看例如上海市在3月份的电子产物的发卖情形,这会辅佐我们发现良多在单个维度中无法发现的问题。所以,交叉剖析是基于分歧维度横向地组合交叉,而不是细分在统一维度的纵向睁开。
交叉剖析的揭示形式
交叉剖析涉及多维度的组合,虽然图表和蓖ㄐ偶可以进行揭示,但因为图表所能表达的数据有限,且斗劲不轻易把多个维度的交叉关系揭示出来,在交叉剖析中不太常用,凡是以表格为主。我们泛泛在看的表格凡是被叫做二维表,一般第一列放置一个维度,如日期,表头枚举复荡蚋标(其实所有指标也可以被认为是一种非凡的维度——指标维),这样行列的两个维就组成了最常见的二维表。二维表可以进行扩展,进而揭示加倍丰硕的维度:

如上图就是典型的基于表格的多维度交叉剖析的结构,在行列平分条理放置多个维度,如不美观我们只显示一个指标,那么这里的指标维就没有显示的需要了。其实Excel的数据透视表(Pivot Table)就是交叉剖析的利器,我在数据的报表和陈述这篇文章中提到过数据透视表,这里仍是基于那篇文章截图的原始数据,如不美观我们将各维度按照膳缦沔的结构形式进行揭示的话,会是怎么样的效不美观:

看起来还不错,显示的信息很是丰硕,左边包含了以天为单元时刻维和产物维,可以使用睁开按钮进行汇总和睁开,就像是细分的操作;膳缦沔的表头部门分两层枚举了地域维和指标维,Excel的透视表供给了丰硕的设置,默认揭示基于各个维度的汇总数据,让我们可以年夜“总-分”的角度不雅察看数据,这对数据剖析很是有用。假如我们使用膳缦沔的透视表进行交叉剖析发现数据是否存在异常?
使用年夜总体到细节的剖析体例,首先可以年夜查看天天发卖额和转化率的汇总数据起头,折叠产物维之后不雅察看最右侧的指标汇总列就可以看到每日汇总数据;如不美观某一天的发卖额或转化率呈现了年夜幅的下滑,我们就可以连系各类维度寻找问题的原因,就是基于各类维度的细节数据,睁开产物维不雅察看当天的哪类产物发卖呈现了问题,然后连系地域维的交叉数据,可以定位哪类商品在哪个省份的发卖呈现了问题,这样就有用地将问题定位到了细节的层面,能够更好地发现问题,进而解决问题。所以交叉剖析其拭魅恰是浮现了剖析“分而析之”的本意。
膳缦沔的体例一般是斗劲常用的基于问题的剖析体例,但我们很少可以一次就定位到问题,往往我们会按照猜测多次发芽数据库或查看Dashboard上的各类报表来定位问题。而连系透视表的交叉剖析,我们使用一张报表就快速地定位了问题地址,年夜总体到细节,逻辑很是清楚,问题的定位也很是切确和到位,所以合理地操作交叉剖析可以辅佐我们加倍高效地排盘问题。
交叉剖析的基本
这里不得不再说一下交叉剖析基于的底层基本数据模子,因为如不美观没有设计好底层的数据模子,上层的交叉剖析是很难实现的,或者多维的交叉受到限制而使剖析存在局限性。
年夜手艺层面来看,交叉剖析基于多维模子,数据的维度越丰硕,所能实现的交叉也越丰硕和矫捷,经由过程各类交叉剖析能够加倍有用地发现问题;但响应的,如不美观要尽可能地丰硕各维度的交叉剖析,对下层模子的要求也就越高。所以若何设计好数据的底层模子很是关头,仍是引用数据立方体与OLAP文中的阿谁数据立方看个简单的例子:

如不美观一张网站剖析的报表只包含以月度为单元的日期维和响应的指标,那么数据的存储就是每个月一标识表记标帜录,但显然这种高度聚合的数据晦气于剖析,我们需要构建如上图的数据立方体来获取加倍细节的数据。用数据立方来拓展数据细节有两种标的目的,一类是纵深拓展,也就是基于一个维度的细分,好比将一个月细分到每一天,那么一标识表记标帜录将会被拓展成30条;还有一种是横向的拓展,就是多个维度的交叉,就像膳缦沔立方中添加了产物维和地域维。这样存储的数据就年夜原本单一的时刻维度扩展成了时刻、产物和地域三个维度,也就是三维立方体所能揭示的形式,当然维度可以继续扩展,四个五个直到N个,理论上都是可行的,这里只要以三个维度进行举例就可以。对于数据存储而言,横向的拓展与纵深拓展的影响是一样的,记实数都是以倍乘的体例增添,假设这里产物维是产物年夜类,有20个产物年夜类,再加上32个省份或直辖市,那么经由纵深和横向拓展之后,原先每月的1标识表记标帜录就酿成了:
推荐阅读
我们网站做seo目的就是经由过程做关头词排名优化,年夜搜索引擎中引进流量,经由过程流量转化赚钱盈利。而要想网站赚钱的暌剐流量是不行的,还有一个主要抉择身分那就是用户体验!一个流量再高的网站,如不美观不在用>>>详细阅读
本文标题:<b>网站数据分析:多维交叉分析 排查网站数据异常</b>
地址:http://www.lgo100.com/a/22/20120412/50030.html

网友点评
精彩导读
科技快报
品牌展示