模型是什么

建模对于我们认知世界是件非常有用的辅助手段

前段时间有个国内互联网上市公司人事给我电话，问我对他们数据部有没有兴趣，各方面都吹的挺玄乎的，我认为大家不烦聊聊就去了。过去之后大呼后悔浪费时间，这公司看似规模不小，可内部做事流程一团乱，首先是HR连我的简历都没有打印，似乎也没有和面试官通过气，对方好像完全不知道我要过去聊以及聊什么。更可笑的是，对方身为号称大数据事业部负责人居然对建模这事好不关系，也不知道模型为何物，还摆出县官大老爷姿态以为应聘者真在“求”职（这种招数在当代拿来吓唬应届生都未必奏效）。聊了半天让我感觉对牛弹琴，又不好意思掀桌走人，实在心苦。事后想来，这类公司建立所谓大数据业务事业部完全为了配合二级市场炒作，随便糊弄一下，再发几条公告“布局大数据业务”，二级市场自然相关概念鸡飞狗跳。仔细看该公司上市8年，2014年那轮牛市借助相关概念炒作股价轻松过百，现在市价已不足最高点的六分之一。

在咨询行业服务的客户多了，工作中也会发现，某些客户常会认为模型是一种高深莫测的魔术黑箱，他们不关心模型的架构和设计的合理性，却一心想要得到完美的输出（预测）。遇到这种客户耗时就要长了，这么多年过来慢慢的也磨出点耐心。

模型是指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式。任何模型都是由三个部分组成的，即目标、变量和关系。

我很喜欢这个简单定义的，内部沟通和交流的时候也常常会拿出来和同事们讨论。根据我的观察，面对建模，人会分为两派，一种喜欢搞特别高深复杂的模型，不明觉厉，另一种则恰恰相反。我应该属于后者，信奉简单原则，“白猫黑猫抓到老鼠就是好猫”。

模型本质上是对现实世界问题的一种抽象拟合，既然是拟合不可能100%精确，这里面除了首先是建模是否正确外，还有拟合程度的问题，噪声的影响几乎不可能消除。吴军在其《数学之美》中提到一个西方日历计算由来的故事（P173）：

托勒密基于地球为中心的宇宙假说，建立40个大圆套小圆的方程，计算并制定了儒略历，即每年有365天，每4年增加一个闰年多一天。1500年来，人们根据他的计算决定农时。经过1500年，托勒密对于太阳运动的累积误差，多了10天。1582年，教皇格里高利十三世在日历上取消掉10天，然后将每一个世纪最后一年的闰年改成平年，每400年再插回一个闰年，这就是今天用的日历，这个日历几乎没有误差。

用现今的观点回看，托勒密的模型当然是错误的，地球中心论早已被证谬。可是这里面有个有意思的问题，即便错误的模型依然有可能正确的运行上千年，然后才会产生偏差，这对人类有限的生命来说已经足够。套用凯恩斯经济学观点，“长远来讲我们都会死…”

世界本是不可被绝对认知的

这是我个人见地，不排除多年之后回首我会否定它。世界本是不可被真正认知的，比如，宇宙中即便有其他生命一定是以水作为纯在基础的吗？变形金刚是否就一定在电影中才会存在？任何定理定律的提出都基于一定的假设，谁能保证这个假设一定是真理，即便物理中重力公式 G = mg ，重力等于质量的定比，一定是这种形式吗？没有半点误差？

但这种形式是最简单，并且用现代观点论证，产生的误差足够小到不影响实际运用。

“如无必要，勿增实体” –奥卡姆剃刀定律

许多经典理论模型经过多年的修正迭代都会体现出非常简单的形式。不搞学术研究而只做特定领域实际运用，只要大方向正确，模型尽可能简单，没有必要把简单问题过于复杂化。杀鸡焉用牛刀，生活除了建模，还有诗和远方。

TICK IT

模型是什么