很多人容易混淆相关性和因果性,产生严重的逻辑漏洞。我来简单介绍一下。
对于这个问题,我尤其敏感,因为我研究生论文是“structure equation” 结构方程模型,其实就是一个测定复杂“因果关系”的数学模型。而99+%统计模型则是在相关性上做文章。先来看简单概念:
相关性:就是字面的意思,2个事情或者数据相关。比如美股暴跌以后,第二天港股大概率也会暴跌。意思就是港股和美股有较强的正相关性。
因果性:2件事情或者数据是因果关系。比如顺丰第一季度亏损,第二天股票跌停。这2件事情显然有因果性,出乎意料的业绩大幅度低于预期导致股票暴跌。而之前的例子美股暴跌,然后第二天港股跌,这里面有没有因果性?可能有,但是我感觉比较模糊复杂,不是那么明确。
相关性和因果性关系通常很密切。具有因果性的事情那么一定是相关的。反过来具有相关性的事情大部分时候是有因果性的,但是主要问题就出在这里:有时候有相关性不代表会有因果性。类似于“黑板是黑的,黑的不一定是黑板”。
在很多事情包括投资中,混淆相关性和因果性会造成逻辑错误。我对制药比较熟,所以还是拿制药来做2个例子吧。
1:小明生病了, 吃了药X,然后病好了。这能不能说X药物有效把小明治好了呢?答案是不能,因为或许小明不吃药,多喝点水休息一下,过几天病也好了。这个是很多人最容易犯的逻辑错误,因为反直觉:我生病吃药然后病好了你怎么能说这个药没用呢?我可是亲身体会的,事实确凿。。。。
实际上要证明这个药有用就必须做对照组试验:一组人吃药,一组人不吃药,而且为了消除安慰剂效应,不吃药那组人要让他们以为自己也吃了药(糖丸什么的)。为了进一步消除偏见,让医生也不知道病人吃的是真药还是假药。到最后如果吃真药的那组的人病情恢复得显著更好,那么就可以认定这药是有用的。
2:最近阿斯利康和强生的新冠疫苗均爆出有血栓副作用。这个致命副作用非常罕见,所以一开始情况就是打了疫苗-->血栓。这只是相关性,因为正常人也会有概率得血栓。假设全中国每天有5000例血栓,那么如果大家同一天打疫苗,第二天就会有5000人得血栓,但这并不是疫苗造成的。所以一开始这个副作用是否和疫苗有因果性并不能直接下定论。也就是打了疫苗,有人得血栓了,这并不代表是疫苗造成的。后来经过详细的研究阿斯利康血栓病例,发现确实是疫苗造成的罕见免疫反应,大致百万分之4有风险。有几篇论文已经发表。这时候因果性才确立