TICK IT

http://www.linyi.press

模型是什么

建模对于我们认知世界是件非常有用的辅助手段

前段时间有个国内互联网上市公司人事给我电话,问我对他们数据部有没有兴趣,各方面都吹的挺玄乎的,我认为大家不烦聊聊就去了。过去之后大呼后悔浪费时间,这公司看似规模不小,可内部做事流程一团乱,首先是HR连我的简历都没有打印,似乎也没有和面试官通过气,对方好像完全不知道我要过去聊以及聊什么。更可笑的是,对方身为号称大数据事业部负责人居然对建模这事好不关系,也不知道模型为何物,还摆出县官大老爷姿态以为应聘者真在“求”职(这种招数在当代拿来吓唬应届生都未必奏效)。聊了半天让我感觉对牛弹琴,又不好意思掀桌走人,实在心苦。事后想来,这类公司建立所谓大数据业务事业部完全为了配合二级市场炒作,随便糊弄一下,再发几条公告“布局大数据业务”,二级市场自然相关概念鸡飞狗跳。仔细看该公司上市8年,2014年那轮牛市借助相关概念炒作股价轻松过百,现在市价已不足最高点的六分之一。

在咨询行业服务的客户多了,工作中也会发现,某些客户常会认为模型是一种高深莫测的魔术黑箱,他们不关心模型的架构和设计的合理性,却一心想要得到完美的输出(预测)。遇到这种客户耗时就要长了,这么多年过来慢慢的也磨出点耐心。

模型是指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式。任何模型都是由三个部分组成的,即目标、变量和关系。

我很喜欢这个简单定义的,内部沟通和交流的时候也常常会拿出来和同事们讨论。根据我的观察,面对建模,人会分为两派,一种喜欢搞特别高深复杂的模型,不明觉厉,另一种则恰恰相反。我应该属于后者,信奉简单原则,“白猫黑猫抓到老鼠就是好猫”。

模型本质上是对现实世界问题的一种抽象拟合,既然是拟合不可能100%精确,这里面除了首先是建模是否正确外,还有拟合程度的问题,噪声的影响几乎不可能消除。吴军在其《数学之美》中提到一个西方日历计算由来的故事(P173):

托勒密基于地球为中心的宇宙假说,建立40个大圆套小圆的方程,计算并制定了儒略历,即每年有365天,每4年增加一个闰年多一天。1500年来,人们根据他的计算决定农时。经过1500年,托勒密对于太阳运动的累积误差,多了10天。1582年,教皇格里高利十三世在日历上取消掉10天,然后将每一个世纪最后一年的闰年改成平年,每400年再插回一个闰年,这就是今天用的日历,这个日历几乎没有误差。

用现今的观点回看,托勒密的模型当然是错误的,地球中心论早已被证谬。可是这里面有个有意思的问题,即便错误的模型依然有可能正确的运行上千年,然后才会产生偏差,这对人类有限的生命来说已经足够。套用凯恩斯经济学观点,“长远来讲我们都会死…”

世界本是不可被绝对认知的

这是我个人见地,不排除多年之后回首我会否定它。世界本是不可被真正认知的,比如,宇宙中即便有其他生命一定是以水作为纯在基础的吗?变形金刚是否就一定在电影中才会存在?任何定理定律的提出都基于一定的假设,谁能保证这个假设一定是真理,即便物理中重力公式 G = mg ,重力等于质量的定比,一定是这种形式吗?没有半点误差?

但这种形式是最简单,并且用现代观点论证,产生的误差足够小到不影响实际运用。

“如无必要,勿增实体” –奥卡姆剃刀定律

许多经典理论模型经过多年的修正迭代都会体现出非常简单的形式。不搞学术研究而只做特定领域实际运用,只要大方向正确,模型尽可能简单,没有必要把简单问题过于复杂化。杀鸡焉用牛刀,生活除了建模,还有诗和远方。

May 21, 2016 Publish Date
建模