如何通过数据分析做到科学预测?-创新互联
对于未来不确定的事物,大家都习惯于用以往经验来预测。而在这个快速发展的时代,依靠经验来预测到底准不准呢?
预测就是常说的预先推测和测定,它的目的不是为预测而预测,而是用来指导人类的各项行为决策,以免人在决策时因为对未来的不确定而产生担忧。很多人对预测多采用根据经验推测,这种方法虽然简单方便,但缺乏理论依据,而且具有主观性。最终结果是导致预测反映的是个人意愿,而非现实情况。
阿温那什•考希克(Avinash Kaushik)是数字营销与分析方面的专家,他曾在博文《奥卡姆剃刀》中写道:“你我对消费者的需求做预测,有80%的时候都是错的。”
遗憾的是,那些对统计基准预测进行人为操控的人却感觉通过使用自己的判断能够提升预测的准确率。通过研究发现,当预测人员提高预测值时,他们几乎都是错误的,因为他们过于乐观,反而导致预测的准确率更低。相反,当预测人员降低预测值时,由于更为保守,所以往往反而能提高预测准确率。总的来说,影响预测结果上升或下降的细微变化对预测准确度几乎没有影响,这种行为纯粹是浪费时间。那么怎样用科学方法进行预测呢?
我们可以基于数据和分析,利用业务知识对未来进行预测。随着计算机技术和网络技术的发展,大数据技术深入到各行各业。从海量数据中挖掘具有潜在价值的关系、趋势和模式,构建预测模型、做出预测分析是必然趋势。通过数据实现预测可以帮助企业发现市场机会,做出科学的经营决策。
科学的预测离不开数据,数据离不开预测方法,目前的预测方法大致分为如下类:
定性预测法
主要依赖于人的主观判断。当可供参考的历史数据很少时,采用定性预测方法最合适。
时间序列预测法
运用历史数据对未来进行预测,它尤其适用于每年基本模式变化不大的场景。
因果关系预测法
假定需求预测与某些因素相关,因果关系预测法可以找到这些因素与需求的关联性,通过预测这些外界因素的变化来预测未来。
仿真法
模拟模型允许预测人员对预测的条件作一定程度的假设。
科学的预测需经历确定需求—获取数据—分析数据—建立模型—预测未来—支持决策。
先要确定预测的对象、目标和范围,这里的范围包括地理范围和时间范围。收集所需的数据,对数据进行预处理,同时分析数据的周期性、季节性、趋势性和随机性。选择预测方法建立模型,同时要确认模型对预测是否有效。根据前面的数据信息和预测模型对预测对象做出合理的预测。通过预测结果,可为即将到来的事物制定决策,以完成预测的目标。
接下来举一个简单的例子,假如要求你对公司某款产品未来几个月销售量等进行预测,且这些被预测变量具有增长趋势,公司可能会根据你的预测结果,进行战略调整和布局,那么如何进行预测呢?可以使用时间序列预测。
示例数据如下:
对销售数据进行探索分析,商品每月销售量的分布图:
商品在各省销售量的分布图:
商品型号在各省销售量的分布图:
利用Python获得数据的基本信息如下:
从上面可知数据量为218618条,没有缺失值,因此不需要进行缺失值处理。接下来,需要统计每月产品的销售量,然后选择时间序列的方法进行预测,在进行时间序列分析前需分析数据的稳定性,将不稳定的数据利用差分的方法进行稳定处理,同时将数据分解,以分析数据的周期性、季节性、趋势性和随机性,具体细节这里不再赘述。本文选择的是基于python 的SARIMAX的方法。SARIMAX是以差分整合移动平均自回归模型(ARIMA)为基础在添加Seasonal季节性、周期性和eXogenous外部因素。生成的模型概况如下:
利用模型预测未来几个月的结果图如下:
结束语
在当前的数字经济时代,自以为是必定失败。利用数据结合业务知识,使用经过验证的分析,而不是靠纯粹的直觉判断。运用科学的方法,分析和预见其发展趋势,掌握市场变化的规律,提高管理的科学水平,减少决策的盲目性,减少未来的不确定性,降低决策可能遇到的风险,由此决策目标才能得以顺利实现。
另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
网站名称:如何通过数据分析做到科学预测?-创新互联
文章位置:http://ybzwz.com/article/dgicos.html