本福德定律和加密货币交易数据

摘要:在本报告中,我们检验了本福德定律,这是一个数学定律,说明实际生活的各种数字序列中首位数字出现的频率。我们观察了来自加密货币生态系统的各种数据集,例如货币价格和交易量数据。我们认为,不应该孤立地看待这个数学概念,并且必需深刻理解基本经济原理才能得出有力的结论。对于少数的交易平台,尤其是 OKEx 和 HitBTC,我们发现报告的交易量数据所形成的分布似乎不遵循本福德定律。不过,这种模式并不代表数据的不当操纵,而这种出乎意料的分布可能有许多合理解释。

/var/folders/lc/fgzc3_9953x81v6b6dpnl7d00000gn/T/com.microsoft.Word/WebArchiveCopyPasteTempFiles/ben-1024x463.png

(本·阿弗莱克在 2016 年好莱坞电影《会计师》中向安娜·肯德里克解释了数字3异常高的出现率,这可能表明存在财务欺诈。电影中 41 分 40 秒所捕捉情节)

本福德定律概述

本福德定律涉及实际生活的各种数字序列中首位数字的频率分布。可能有人认为大多数情况下首位数字的频率分布为 11.1%( 即 1 为 11.1%,2 为 11.1%,3 为 11.1% 等),而在许多情况下确实如此,例如,随机数生成器应产生这样的频率分布。然而,在物理学、地质学、生物学、化学、建筑学、人口统计学、金融学、商业或其他领域中,存在一些实际生活情况,其遵循不同的频率分布,其中一种情况与下面的图表匹配,其中 1 最为常见(出现频率为 30.1%),其次是 2,依此类推。

指数增长的等比数列中首个数字的频率分布

(资料来源:BitMEX Research)
(注:等比数列从数字 1 开始,每次互动增长 2%,并包含 5,000 个数字)

我们可能很难充分证明为何数字会遵循上述现象,并且也没有适用于所有情况的简明解释。遵循本福德定律所必需的主要特征似乎是,数据必须跨越几个数量级。

我们认为,解释此现象的好方法是研究一个基本等比数列。例如,假设一个等比数列每次迭代增长 10% 。当该数列达到 24 的水平时(到二十多占 40%),该数列中的下一个数字为 26.4,仍在二十多之内,2 为首位数字。如果该等比数列为 84(到八十多占 40%),则该数列中的下一个数字为 92.4,而首位数字已从 8 变为 9。这表明在金融或自然等领域可能出现一些数列,其遵从这样的规律,较低数值的首位数字比较高数值的数字更为常见。

将本福德定律应用到商业和金融

在加入 BitMEX Research 之前,团队中许多成员曾经担任过涵盖股票方面的投资分析师或投资组合经理。早在 2015 年,受美国注册舞弊审核师协会的一篇论文启发,一位同事提议,我们可以将本福德定律作为一种工具,用于在报告的财务报表中查找财务欺诈。其理论依据是,如果公司财务准确地反映了实际生活,则这些数字应遵循本福德定律,但是,如果它们被恶意操纵或随机生成,则这些数字应明显偏离本福德定律,这可能是财务欺诈的信号。不过,如以下情况所示,它可能没有那么简单。

考虑以下两个人为设计的示例:

示例1——分析一家高增长美国科技公司——谷歌的销售额

美国互联网巨头谷歌[GOOGL US]在 1999 年的销售额仅为 20 万美元左右。该公司在过去 20 年显著增长,今天其销售额已超过 1000 亿美元。因此,谷歌的销售额跨越了多个数量级,而本福德定律可能适合分析该集团的财务指标。

示例2 ——分析低增长日本公用事业公司——Hokkaido Electric 的销售额

日本水力、热力和核能发电公司 Hokkaido Electric Power [9509 JP]在截至 2019 年 3 月的财政年度的销售额为 7520 亿日元。25 年前,该公司的销售额为 5440 亿日元,并且在 25 年中,其销售额均在 5000 亿日元至 8000 亿日元范围内。在过去 25 年的每一年中,该公司年收入数据的首位数字是 5、6 或 7,显然不遵循本福德定律。这不一定表示存在欺诈或其他财务不当行为,可能只是反映该公司的保守性,日本人口增长率低,低增长的经济环境以及日本通胀率相对较低。

首位数字的频率分布

首位数字本福德模型谷歌销售额(1999年至2019年)Hokkaido Electric销售额(1995年至2019年)
130.1%33.3%0.0%
217.6%19.0%0.0%
312.5%9.5%0.0%
49.7%9.5%0.0%
57.9%4.8%72.0%
66.7%9.5%12.0%
75.8%4.8%16.0%
85.1%4.8%0.0%
94.5%4.8%0.0%

(资料来源:BitMEX Research)
(注:谷歌销售额为美元,而 Hokkaido Electric 销售额为日元)

以上示例的目的是说明不能盲目地将本福德定律应用于财务分析。为了有效地进行这一分析,可能需要对数学和相关业务的基本经济原理有深刻的理解。我们认为,在没有充分理解数学背后的假设和原理以及它们如何应用于金融的情况下,而仅基于统计或数学分析来推断有关金融市场运作的结论,这是一个人们(尤其是宏观经济学家和计量经济学家)经常犯的错误。我们不想在本报告中再犯次错误。

当我们使用本福德定律分析我们的股票投资组合时,我们能够发现某些行业(例如科技、生物技术或商品)的股票经常遵循本福德定律,而在观察更稳定的行业(例如食品、公用事业、 零售或建筑)时,情况则更为复杂。在对股票进行基本分析时,其可能适用的本福德定律更多是用于衡量数字的波动性或增长,而不是衡量是否对数字有任何恶意操纵。

虽然本福德定律可能被认为是警示有潜在欺诈行为的工具,但显然没有证据证明其有这种作用。在这本报告中,我们不会陷入这样一个误区,就是在评估加密货币领域时,高估本福德定律作为检测欺诈方法的能力。

加密货币价格

下面我们将本福德分析应用于加密货币价格。总体而言,结果表明,加密货币价格的变动确实遵循本福德定律。

加密货币每日价格百分比变化的首位数字的频率分布——截至 2019 年 11 月的 12 个月

(资料来源:BitMEX Research、Coinmarketcap)

在通过本福德模型观察平方差总和的平方根时,恒星币、比特币现金和莱特币的偏差最大,而以太坊和瑞波币的偏差最小。出于以下几个原因,我们不认为这能够证明恒星币、比特币现金和莱特币有价格操纵:

  • 所有货币都紧密遵循本福德模型,而考虑到随机性,预计会有一些偏差
  • 较低的偏差可能只是表明货币价格更加波动,因此价格百分比变化更有可能跨越多个数量级, 
  • 一年的价格数据可能太短,无法得出适当的结论(例如,比特币价格的时间跨度越长,分布越遵循本福德定律)
  • 我们尚未考虑其他可能会导致偏差的因素

加密货币交易平台

在观察了货币之后,我们将分析转移到加密货币交易平台,方式是观察美元兑比特币交易对的每日交易量。这里的结果更有趣,并且偏差也更大。在我们的样本集中,大多数平台都紧密遵循本福德分布,但有一些显著的例外,例如 BitForex、HitBTC 和 OKEx。

加密货币交易平台比特币兑美元每日交易量的首位数字的频率分布

(资料来源:BitMEX Research、英为财情)
(注:自 2018 年 12 月 12 日以来的每日交易量。)

结果表——加密货币交易平台比特币兑美元每日交易量的首位数字的频率分布

/var/folders/lc/fgzc3_9953x81v6b6dpnl7d00000gn/T/com.microsoft.Word/WebArchiveCopyPasteTempFiles/table-1024x276.png

(资料来源:BitMEX Research、英为财情)
(注:自 2018 年 12 月 12 日以来的每日交易量。)

本福德分布平方差总和的平方根

(资料来源:BitMEX Research、英为财情)
(注:自 2018 年 12 月 12 日以来的每日交易量。比特币兑美元)

虽然上述情况与本福德定律的偏差确实很明显,也可能令人关注,但与本报告货币价格部分相同的警告同样适用。即分布可能用于衡量增长或波动,但时间段可能太短,或者其他一些因素可能导致偏离。

结论

本文的结论并不是本福德定律证明了 OKEX 和 HitBTC 伪造了他们的交易量数字,也不是分析证明 Kraken 和 Bittrex 没有伪造其数字。如我们之前所解释,有很多因素可能会影响数字遵循本福德分布的程度,其中许多因素可能是完全合理的,例如平台是处于强劲增长时期还是处于稳定时期。CryptoCompare 的交易所评价 采用一种更全面的方法来评估交易所,远强于仅应用一种特殊的数学概念。不过,如果您已经熟悉加密货币交易平台领域的某些经济原理和趋势,则此分析可能会提供有用的附加信息。

欢迎转载,请注明文章来自

BitMEX (www.bitmex.com)