乏训练。一个经过训练和没有经过训练的营销人员的差别在于:训练有素的营销人员在不同的时间、地点讲同一件事情,陈述的要点和逻辑基本一致;没有经过训练的营销人员,容易东扯西拉,临场发挥。统计学本身就是一门逻辑思维比较严密的科学,而逻辑思考能力是需要时间训练和培养的。任何科学,只要是方法,尤其是可以通过公式展现的方法,都能够通过学习掌握。
抽象思维多于具象思维
在统计学中,大量的数学模型是建立在概率之上的。所谓概率,通俗一点就是模棱两可,可能是左,也可能是右。比如,我们讲到的数据分布类型。无论何种数据组类型,都只分为离散型的随机分布和连续型的随机分布。比如,在抽样调查中,随机抽取的被调查对象的年龄就属于离散型随机分布,收入就属于典型的连续型随机分布。
以离散型随机分布为例,我们可以将其理解为;在某个数据组内,数据之间缺乏相似性和关联性,随机抽取一个数据,在这个数据组内任意数据被抽取到的机会,都有固定的概率,且概率分布没有明显的集中趋势。
随机变量X的取值为:X1,X2,…,XN,其相应的概率为P(X=X1)=P1,P(X=X2)=P2,…,P(X=XN)=PN。将这些结果列表,如表10-1所示:
表10-1随机变量X和概率P
对应折线图(图10-1)表现如下:
图10-1对应折线图
从离散型数据的随机分布来看,需要我们将原来“1+1=2”的精确观念,转换成在一定的概率保证下,“1+1”有可能等于任何数的概念。这种从“一定”到“可能”的思维转变,是学习统计学的基础。
单一的数字分析变成大量数据库的处理
统计学的第二个难点,是数据处理突然呈现爆发式增长。
以平均数这个概念为例,仅从类型上来说,平均数就分为数值平均数和位置平均数两种,各种平均数的适用条件和应用范围又有所差别。比如(如表10-2所示),我们都知道1、2、3的算术平均数等于2,即(1+2+3)/3=2。这时候突然有人告诉你,在一个统计对象里,有50人养1只狗,40人养2只狗,25人养着3只狗,每个人平均养了几只狗?这时候,用简单的算术平均数统计出人均2只狗,就失去了现实意义。
表10-2养狗人数信息表
人均平均养狗数
=(1只×50人+2只×40人+3只×25人)/(50人+40人+25人)
=(50只+80只+75只)/115人
≈1.78只
这其实就是一个调和平均数,也称倒数平均数。每一组狗的总数量就是调和平均数的权数。统计学的难点在于,大量数据出现,你如果不会分组或者分组不科学,这些数据就会弄得你焦头烂额。
经典假设限制了统计学的应用范围
以检验这个功能为例,小学数学里一元一次方程检验,我想大多数人应该还记得,这就是我们通常说的“代入检验”。
例如:1+2x=3,用一元一次方程解答,并检验。
解:因为1+2x=3
2x=3-1
x=1
所以x=1
检验:当x=1时,方程式的左边为1+2×1=3;又因为,方程式的右边为3,所以左边=右边。
但是在统计学中涉及到的检验,以单变量的检验为例,分为参数检验和非参数检验。所谓的卡方检验只适合非参数检验,且是独立样本;符号检验虽然也适合非参数统计,但是必须是两个有依存度的样本。t检验和Z检验虽然同样适用于参数检验,但是Z检验只适合单样本和独立样本的情况;t检验虽然适用参数各种情况,但是样本情况的差异,也会影响到检测结果。如双样本的t检验,其假设条件就是两个样本的方差必须相等,如果这个条件被打破,检验结果就毫无意义。
真正要学统计学,理不清这些限制性条件,统计学依然一知半解。当然,你还有一个选择,那就是只选择你熟悉的限制条件,采用统计学里那些复杂的方法。换句话说,就是固定场景、固定条件、固定公式。
小贴士
统计学的难,难在无从下手。其实每个人都有自己的学习习惯,找到你最熟悉的点,先研究,然后在实践中不断尝试和修正;也可以选择你最熟悉的公式模型,确认使用条件后,先在实践中试用,后在使用中巩固。
第二节五个最经典的销售测算模型
既然系统地学习统计学,对大多数人来说,都是一种负担。那么,我给大家的建议是,从学习和应用统计学函数的经典模型开始,如果能记住这些经典函数的限制条件和应用场景,对很多统计学的初级应用者来说,是一劳永逸的事情。
别让销售波动侵蚀了你的库存和资金——进货或出货均衡性的评估模型
在第30届奥运会上,孙杨在1500米的自由泳竞赛中破了世界纪录。优异成绩的取得,除了源于自身天赋和勤奋外,科学的训练及比赛方法也是其一举摘金的重要因素。据说,在1500米的15段100米比赛中,除了出发和冲刺两段100米外,孙杨基本能够将13段100米的游泳用时时差控制在0.5秒以内。因为孙杨每100米的用时时差非常均衡,这让他能够更合理地控制比赛节奏、分配体力,为后程的发力提供了重要保证。
在销售过程的监控中,销售的均衡性和稳定性一直困扰着经销商和厂家。波动过大的波峰和波谷对资金与库存的隐性侵蚀,让许多经销商和厂家苦不堪言。这种无规律的波动对资金和库存的影响,在“经销商算账的六个误区”中也曾有表述。在分阶段进货后,库存的均衡性到底有没有好转呢?在经典的统计函数模型中,有一个重要方法可以测算日均或月均进货总体标准差。
总体标准差主要是监控日进货、月进货量与日平均进货量、月平均进货量的差异,总体标准差值越大,说明进货的均衡性越差;差值越小,说明进货的均衡性越好。均衡性的进货监控分为两步:
第一步,确认监控的时间段,调取该时间段内等量时间长度的进销货数据,并计算调取数的算术平均数X,原则上调取的数据样本数n≥30,有利于减少误差。
第二步,总体标准差的公式为:
总体标准差的大小代表了等量时间长度的进销货数据与平均进销货数据的偏差情况。
表10-3所示为某公司6、7月份的日出货数据(单位:万元),6月份仍然采取月底销售达成的考核办法。7月份开始执行对经销商分时间段考核进货进度的新政策,即10日、20日、月底三个时间点作为月度进货进度的考核节点,并执行对应的激励政策。请确认7月份均衡进货是否比6月份有所好转?
表10-3某公司6、7月份的日出货数据
第一步,监控以月为单位(6月、7月)的日出货均衡性,6月日出货平均数X=550万元,7月日出货平均数X=414万元。
第二步,
6月日出货总体标准差:
7月日出货总体标准差:
7月日出货波动明显小于6月日出货,即使7月比6月多出了1天,7月按时间节点(10日、20日、月底)考核的方式,对均衡出货有一定的作用。
预测客户愿意掏多少钱来买单——客均单价的经典模型
对很多营销人员来说,经常会计算客单价。用算术平均数计算的结果,代表的是有限样本的历史平均水平,对没有参与计算的样本没有评估价值,对未来客均单价的走向也没有太大的引导价值,这是用算术平均数计算客均单价的最大缺陷。统计函数里有一个经典模型,专门用来计算、评估、指导客均单价的趋势,称之为“区间估计值”模型。
第一步,计算抽样平均误差。
在已经形成销售的订单中,随机抽取一定数量(抽取的销售订单数≥30为佳)的历史订单,计算这些订单额的算术平均数X,并计算这些订单销售额的样本标准差σ(具体算法参照“进货或出货均衡性的评估模型”)。区别在于:进货或出货均衡性的评估模型是总体标准差,所以分母(自由度)为n;而客均单价是样本标准差,所以分母(自由度)为(n-1)。
通过样本标准差计算抽样平均误差μ(抽样平均误差是指抽取的这些销售订单的平均值和所有订单平均值的误差程度)。如果是重复抽样,平均误差的程度要用样本标准差除以样本单位数的平方根;在不重复抽样的