内容目录
上一篇总结网站分析的前提,是要分析过去,量化目标,用户行为可视化。量化目标的三个重要名词,KGI、CSF、KPI。由于篇幅过大,我们把统计基础知识放在这篇总结。
统计基础知识
基础知识名词定义
平均值
(X1+X2+...+Xn)/n
,分母n数值较小时,平均值容易有很大误差;
平均值是将全体的总和除以次数得到的值,只看平均值是看不出详细内容的。因此要记住即使是相同的平均值,数据的内容也可能有很大的差异,统计学中将这样的数值变化成为分布,相同的平均值,分布也可能不同。中位数,n个数据按升序排列时中间位置的值。当n是偶数时,取中间2个数的平均值;
众数,在n个数据中出现最频繁的值,这个数字可以作为平均值的补充;当中位数和众数跟平均值不同时,意味着分布是偏离的。
另外,在统计学中,把用1个值来表示数据分布特点的平均值、中位数或者众数等称为典型值。以平均值为中心左右对称的分布叫作正态分布,这里强调与Web有关的数据几乎是不会称为正态分布的,而是长尾分布。
相关系数
正相关:散点图中,添加一条近似直线,直线会向右上倾斜;
负相关:散点图中,添加一条近似直线,直线会向右下倾斜;
相关性计算,使用Excel的CORREL函数可以很容易得到结果。请参考Wikipedia ”相关系数“
大数定理,指当参数很少时,单个数据容易对整体造成影响,如果没有达到一定数据量将得不到正确的平均值。
图表理解
种类 | 说明 |
---|---|
折线图 | 用于观察数据随时间发生的变化 |
柱形图 | 用于在特定的轴上比较数据的大小 |
饼图 | 用于在特定的轴上比较数据所占比例 |
面积图 | 用于在特定的轴上观察数据所占比例随时间发生的变化 |
散点图 | 用于从2个轴观察数据的相关性 |
气泡图 | 用于从3个轴观察数据的相关性 |
雷达图 | 用于从多个轴评价特定的信息 |
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...