本福特定律(第一数字定律)详解—IT审计网

本福特(Benford)定律又称第一数字定律,它是数字统计的一种内在规律,指所有自然随机变量,只要样本空间足够大,首位1-9的数字出现的概率在一定范围内具有稳定性,即以1开头的样本占样本总量的30.1%,以2开头的样本占样本总量的17.6%,而以9开头的样本始终只占5%左右(如下图)。

常用于检查各种数据是否有舞弊、造假。

举一个例子

某银行有1000多个储蓄账户,存款金额不等。这些数字的第一位(非零)有效数字可能是1到9之间的任何一个。现在,我们设想一下,在上千个存款数据中,第一位数字是1的概率有多大?

大部分人可能很快地回答:应该是1/9吧。因为从1到9,9个数字排在第一位的概率是相等的,每一个数字出现的概率都是1/9,大约11%左右。

这种看似十分正常的思维却与真实的规律相悖。

经研究发现,很多情况下,首位数字是1的概率要比靠直觉预料的11%大得多。数字越大,出现在第一位的概率就越小,数字9出现于第一位的概率只有4.5%左右。各个数字出现在首位的概率遵循图1左图所示的概率分布。从图中可以看出,首位数字为1的概率可达30.1030%,而首位数字为9的概率仅为4.5757%。

这就是本福特定律。

图1:本福特定律(首位数定律)

事实上,本福特定律的发现者并不是本福特,而是美国天文学家西蒙·纽康(SimonNewcomb,1835-1909)。

说来令人奇怪,科学定律的发现有时候来自于一些毫不起眼、小得不能再小的现象,本福特的发现便是如此。“以1开头的数字比较多”,这也算是一个定律吗?

本福特发现这种现象不仅仅存在于对数表中,也存在于其它多种数据中,于是,本福特检查了大量数据而证实了这点。

本福特和纽康都从数据中总结出首位数字为n的概率公式是:

其中d取决于数据使用的进位制,对十进制数据而言,d=10。

图2:本福特从大量数据中得到的首位数字概率表

本福特定律适用范围异常广泛,自然界和日常生活中获得的大多数数据都符合这个规律。尽管如此,此规律仍然受限于如下几个因素:

1、这些数据必须跨度足够大,样本数量足够多,数值大小相差几个数量级;

如何解释本福特定律?

尽管本福特和纽康都总结出了首位数字的对数规律,但并未给出证明,直到1995年美国学者TedHill才从理论上对该定律作出了解释,并进行了严谨的数学证明。虽然本福特定律在许多方面都得到了验证和应用,但对于这种数字奇异现象人们依旧是迷惑不解。到底应该如何直观理解本福特定律?为什么大多数数据的首位数字不是均匀分布而是对数分布的?

有人探求数“数”的方法,来直观解释本福特定律。他们的意思是说,当你计算数字时,顺序总是从1开始的,如果到9就终结的话,所有数字起首的机会都相同,但9之后的两位数10至19,以1起首的数则远多于其它数字。

我们可以用这种方法来理解街道号码(地址)一类的数据。一般来说,每条街道的号码都是从1算起,街道长度有限,号码排到某一个数就终止了。另一条街又有它自己的从1开始的号码排列,以此类推,1开头的号码是要多一些的。但这种解释也太不“数学”了!况且,这种理解无法说明另外一类数据为什么也符合本福特原则,如“物理常数”的集合、出生率、死亡率等,这些数据并不是从1开始计算到有限长度就截止的那种数据。

举个例子来说明这个道理:如果你有100美元的存款,年利率是10%,25年中,你每年的存款金额将是(只保留了整数部分):

100、110、121、133、146、161、177、195、214、236、259、285、314、345、380、418、459、505、556、612、673、740、814、895、985

读者也许会有疑问:上面的数列选择从100开始,1打头的比较多,如果从别的数字开始,规律是否会改变呢?读者可以试验一下,得到的结果仍符合本福特法则。此外,你还可以将美元换算成人民币(乘以6.7),得到的数据仍然会遵循本福特定律,这也说明本福特定律具有“尺度不变性”。

帮助侦破“数据造假”

由于大多数财务方面的数据都满足本福特定律,因此,在现实生活中,它可以用作检查财务数据是否造假!

美国华盛顿州曾侦破过一个当时最大的投资诈骗案,金额高达1亿美元。

诈骗主谋凯文·劳伦斯及其同伙以创办高技术含量的连锁健身俱乐部为名,向5000多个投资者筹集了大量资金。随后,他们挪用公款以作自身享乐。为了掩饰他们的不法行为,他们将资金在海外公司和银行间进行频繁转账,并且人为做假账,制造一种生意兴隆的错觉。

所幸,当时有一位名为DarrellDorrell的会计师感觉不对头,他将70000多个与支票和汇款有关的数据收集起来,将这些数据首位数字发生的概率与本福特定律相比较,发现这些数据无法通过本福特定律的检验。最后经过了3年的司法调查,终于拆穿了这个投资骗局,2002年,劳伦斯被判20年牢狱。

2001年,美国最大的能源交易商安然公司(EnronCorporation)宣布破产,并传出公司高层管理人员涉嫌做假账的传闻。据传,安然高层改动过财务数据,因而他们所公布的2001-2002年每股盈利数据不符合本福特定律。此外,本福特定律也被用于股票市场分析、检验选举投票欺诈行为等。

本福特定律适用场景1、通过多个数据集运算形成的。例如:应收账款=销售量*单价,应付账款=采购量*单价。2、真实交易数据,交易量、重量等。3、大数据量,可观测的数据越多可能越符合。例如:全年的交易数据。4、符合下面规律的会计科目:当一组数字的平均数大于中位数,且偏差为正。例如:大部分的会计科目。本福特定律不适用场景1、数据集合是标志性的编号。例如:对账单号、发票号、邮政编码。2、数字会受到人为影响。例如:商家营销手段,通常会把2000元的商品标价1999。3、数据集合包含大量公司特定的数字。例如:用来记录100美元退款的账户。4、数据集合设定有最大值、最小值的门槛。例如:某类资产必须大于多少金额才会被记录。

游客

20-04-1920:01

如果一组数据,不同的统计口径,本福特的值不同,甚至差别很大,怎么办?比如销售订单,按月、日、小时统计的成交额,本福特指数偏离度分别为:35%,16%,7%,怎么解读?

THE END
1.关于概率法则而最近也验证了这个概率法则。一个初入销售领域的伙伴,一开始非常的茫然,焦虑,一直想退出来。她认为自己的专业知识比较薄弱。透过跟她沟通后,我让她的关注点从专业知识调整到数据概率的法则上,不到一周,她来给我报喜,Wendy, 我开单啦!在听到她破蛋后的喜悦,我内心更加激动,这概率法则实在是神奇。 https://www.jianshu.com/p/244228aa0ed7
2.概率教材全文.pdf例如,对某一目标进行射击,产品的抽样验收,观察某商店每天的销售额,观察某交通 干线上每天交通事故的次数,在分析天平上称量一件物品,记录某地一昼夜的气温……都可 以视为随机试验。由于概率论主要研究大量随机现象,一般不研究个别随机现象,故通常假 定随机试验可以重复进行; 如将一枚硬币抛掷多次观测其出现正反面的...https://m.book118.com/html/2017/0623/117562826.shtm
1.品牌营销的六大核心,销售核心三要素在这个信息爆炸的时代,品牌营销和销售的艺术变得比以往任何时候都要复杂。走在街头,随便问一个人,“你知道哪个品牌的手机最牛吗?”或许能得到几百种答案。但为什么有些品牌能脱颖而出,迅速占领市场,而有些品牌即便有着不小的投入和资源,依然只能“默默无闻”呢?是不是简单的广告宣传就能解决一切?还是说,背后有...http://www.zhongxinlm.com/yinxiao/19325.html
2.销售技巧培训心得体会(通用15篇)通过学习,我也充分了解到,在日后我行金融产品销售技巧培训中,我们必须灵活运用FAB法则,将我行金融产品的利益与顾客的需求相匹配,强调潜在顾客将如何从购买中受益,才能激发顾客的购买欲望,让其做出购买的决定。 销售技巧培训心得体会 8 20xx年8月20日为期一天的《专业销售技巧》培训已经落下帷幕。作为刚刚步入上海宝井...https://www.unjs.com/fanwenwang/xdth/20230308131422_6613735.html
3.销售培训心得体会(精选8篇)5、“F·A·B法则” 透过学习,让认识到FAB法则是指推销员运用产品的特征F(Feature)和优势A(Advantage)作为支持,把产品的利益B(Benefit)和潜在顾客的需求联系起来,详细介绍所销售的产品如何满足潜在顾客的需求。特征F是产品的固有属性,它描述的是产品的事实或特点;优势A是解释了特征的作用,证明产品如何使用或帮忙潜...https://yjbys.com/xindetihui/fanwen/2202710.html
4.销售培训总结心得体会(通用32篇)心情决定行为,行为决定效果,在销售的过程中,始终相信自己的能力,将自己对产品的认识和态度传递给购买者,变被动的购买为主动的需求,这样才会有长久的客源和长久的利益。 四、专业的异议处理方法——太极沟通法则 不管什么样的销售都会遇到拒绝的人,怎么样消除购买者的疑惑、不信任、推托呢?用太极沟通法则,重复对方的活...https://www.ruiwen.com/zongjie/6666339.html
5.营销管理(营销管理)书评第一篇 理解营销管理第1章 定义营销新现实Marketing(市场营销)最简洁的定义是:有利可图地满足需求。营销管理是选择目标市场并通过创造、传递和传播卓越顾客价值,来获取、维持和增加顾客的艺术和科学。销售这是市场营销的冰山一角。德鲁克说,市场营销的目的就是让销售变得多余。营销人员需要营销10个主要类型的实体:产品...https://book.douban.com/review/12450570/
6.保险销售从业人员销售资质分级测试A大数法则B概率统计C黄金法则D运算法则 在普通人寿保险中,不同年龄阶段的死亡概率、生存概率各不相同,体现了风险的()。 A特点B特征C规律性D不规律性 保险费不随被保险人年龄的增长而变化,其实质是在考虑()、利息因素的条件下,把被保险人应在若干年内负担的保险费总额,运用科学的计算方法平均分摊于各个年度。 https://www.wjx.cn/xz/260354778.aspx
7.英国教授破解“彩票中奖法则”彩市大多数人相信买彩票中大奖纯粹靠的是运气,但英国布拉德福德大学和学院的一群教授、助教和雇员们却认为,彩票中奖和数学概率法则有一定的联系。他们设计出了一个最可能的“中奖法则”,在长达4年中一直通过该方法购买彩票,日前,他们的理论终于得到了验证:10月21日,该大学17名联合购买彩票的教授和员工们一举中了530万...https://zx.500.com/dlt/n_dt/cs/20130810_342955.shtml