是否随机就意味着不确定,随机对于预测的意义是什么?
随机不等同于不确定,为此统计学上引入了置信度的概念来评价预测的准确性,也就是这个预测有多少的可能性成立,相反的来看,也就是有多少可能不成立。非要认个死理,没有预测准确就是无法预测的话,那么同学,我真的帮不了你了!!统计学告诉我们,预测准确或者不准确,不能说明预测方法的正确或者错误。就像医生就算对一个小手术很有把握,也只会说九成九的把握,事实上医学研究就对统计的要求很高(他们基本都是博士,好吗!)。要用预测结果的准确与否去断言预测可行或者不可行,本就是一件极为荒唐的事。所以置信度(confidence)就成了我们评价预测方法的唯一标准。
有布朗运动(或者叫随机扰动)的存在,百分之一百是不可能的,但是信息足够多的情况下置信度95%是可能的。
另外未来是多久,如果五秒后的未来预测的置信度是95%,那么10秒后就是90.25%,一分种后就是54.03%,五分钟后就是4.6%,这就是指数衰减的力量,这就是统计。
另外如果假设五秒后的预测置信是99%,那么五分钟后的预测置信是54.71%,25分钟后才是4.9%,这是为什么预测精度如此重要,为什么高精度的情况下千分之一或者万分之一的精度提升也价值巨大。若原本的预测精度是99.9%,那么提升万分之一的精度,就相当于预测在置信区间内的时间成了原本的10倍。
参见天气预报,为何天气预报时间较长时间的预报经常不准。现在的天气预报基本三天内是可信的,有兴趣的可以反推一下目前天气预报五秒后的预测精度。
科学角度讲,数据就是现实的抽象反映。你可以用数据以外的手段观察,但是计算机不能理解数据以外的东西,而现代统计学已经脱离不了计算机了。另外,不少数据以外的手段那叫干预,不叫预测。预测是在尽量不干扰原始情况的要求下进行的,一般若是在实验过程中对样本有争议的干预行为,那么就说这个数据dirty了,那么实验结果也往往不被认可。
作者:徐昇
评论