
作为一个在商学院事情了十多年的统计学教员,,一天到晚为自己,,为学生,,或者年轻相助同伴多写俩Statistical Paper绞尽脑汁,,也是无聊透顶,不知道几多脑细胞因此牺牲。。难堪空闲的时间,,就瞎琢磨几个深刻的问题。。虽然,,我也不知道这么深刻的问题,,该不应我来琢磨。。可是既然琢磨了,,就不如写下来跟各人分享探讨。。这几个问题就是:中国统计学未来生长的大偏向是什么??????背后的逻辑是什么??????套用一句时髦的互联网语言就是:中国统计学的风口在那里??????

人说以史为鉴!以是,,首先简朴回首一下某些统计学领域的生长史,例如实验设计。。昔时,,这个领域是怎样生长起来的??????岂非是少数天才学者的智力游戏吗??????显然不是。。这是农业生产的需要。。相关科学实验是最基础的驱动力。。那么厥后呢??????是工业化历程,,以至于又催生了质量控制、可靠性等相关学科。。罢了往这十年是盘算机实验。。那么未来呢??????我想一定是互联网。。这说明什么??????这说明统计学的生长要顺应工业厘革,,这是时势所趋!
再看一个例子,,高维数据剖析是最近20年才被提出来的吗??????不是!早在这个之前,,就有学者,,受个人学术兴趣的驱动,,也曾提出过类似的问题,,但没有形成天气。。为什么??????是由于其他学者其时有眼无珠吗??????我以为不是。。一个主要原因是,,这样的要领在其时似乎没什么主要的现实应用。。这就难怪其时主流统计学研究不体贴这个问题。。但为什么,,这个昔时让人脑洞大开的异类问题,,却成了最近20年的研究主流了??????由于科学手艺变了。。以DNA Microarray为代表的生物手艺的重大前进,,爆发了大宗这样的数据。。而这些数据,,蕴藏着关乎人类生命康健的神秘,,具有主要的科学价值。。这成绩了已往这些年的(超)高维数据研究。。这说明什么??????这说明统计学的生长依赖于手艺前进,,这是时势所趋!
最后一个例子。。为什么制药统计学在美国那么主要??????由于生物制药这个工业极其强盛。。默克、强生、施贵宝等一大批制药巨头,,每年要实验大宗的临床实验,,爆发了大宗的数据,,造成了海量的剖析需求,,进而推动了制药统计学的生长。。为什么这些巨头愿意投入重大的时间、财力、物力作临床试验??????是它们对科研的好奇心??????照旧品德上的高尚??????可能都有一些,,但不是最基础的。。最基础的是美国食物药物监视局(FDA)对市场的强力羁系。。这个制度情形造成了相关企业必需实验严酷的临床试验,,进而爆发了强劲的统计剖析需求。。而制药统计的生长,,又极大地增进了相关领域,,例如:生物统计学的生长。。这说明什么??????这说明统计学的生长需要一定的制度情形,,这是时势所趋!
以是我们无妨下一个结论:“统计学的时势所趋,,从不以任何个人的兴趣喜欢为转移。。而是由工业厘革(例如:工业化历程),手艺前进(例如:DNA Microarray),,尚有制度情形(例如:FDA政策)所决议”。。这一点,,我以为一定要看清晰!雷军说:站在风口,,猪都能飞!这说的是,,重大选摘要顺势而为。。背后隐含的另外一个结论是,,若是逆风而动,,鹰也飞不起来。。这是我个人看待中国统计学生长偏向的基本逻辑。。那么,,在中国这片土地上,,面临当下的工业基础,,政策情形,,安博电竞时势在那里??????统计学的风口在那里??????要当飞起来的猪??????照旧被打爬下的鹰??????或者更好:顺势而为的鹰??????

要回覆这个问题,,需要磨练一下中国的现状。。中国有强盛的制药工业吗??????我相信未来会有。。但不是今天,,不是明天,,不是我们可见的未来5到10年。。为什么??????由于我们缺乏强有力的制度情形。。越发详细地说,,我们缺乏类似FDA的强力羁系机构。。现在的国家药品监视局(即:中国的FDA)已经做了许多有意义的事情,,可是显然还远远不敷。。为什么??????君不见各人对食物清静的焦虑吗??????这还缺乏以批注安博电竞制度情形需要long way to go吗??????若是上面讨论的是对的,,那么请允许我做一个悲催的预测:在中国,,未来可见的相当长时间内,,生物统计学,,将会是一个主要的保存,,可是不可能大放异彩。。为什么??????由于:没有响应的制度情形。。对,,就这么简朴!
那么中国有哪些工业在全球规模内是有竞争力的呢??????第一、互联网;;第二、制造业。。这很好明确。;;チ矫,,我们有以BAT为代表的一大批有竞争力的企业。。而制造业方面,,中国是天下的中心,,孕育了像华为这样伟大而优异的企业。。这两个行业,,有可能形成风口,,或者正在形成。。这两个行业就是统计学研究的时势所趋,,风口所在!

更进一步地,,这两个时势对统计学研究的详细影响会是什么呢??????我们先讨论一下互联网,,尤其是移动互联网,,由于各人都很熟悉。。讨教:移动互联网爆发了什么奇异数据??????它们的价值何在,,应该怎样研究??????要回覆这个问题,,看看自己最常用的APP就知道谜底了。。我们最常用什么??????微信。。外洋呢??????Facebook andTwitter。。它们是什么??????所有都是基于社交的软件或者服务。。它们爆发了什么样的数据??????首先是网络结构数据,,用于描绘了用户之间的社交关系。。关于统计剖析,,这会带来什么样的转变??????最基础的转变就是让信息沿着网络结构最先流通。。通俗地讲,,以前,,我们判断一个人是好人照旧坏人(因变量),主要参考他自己的特征(诠释性变量)。。可是,,有了网络结构,,与之相连个体的所有信息(即包括因变量、也包括诠释性变量),,都可以被使用起来,,以提高预测精度。。可是,,能够切合该理念、知足该需求的统计学模子却少之又少。。这就是网络数据赋予统计学生长的重大时机,,这就是风口所在!
再看看制造业。。制造业有几个特点。。第一、中国是全天下的制造中心,,可是亟待工业升级,,进入工业4.0时代。。第二、与天下制造中心相对应的是,,对中国制造业的数据,,我们却极其无知,,远远落伍于互联网。。爆发这个征象,,可能有两个原因:首先可能是是古板制造业的数据收罗难题,,不如互联网利便;;其次可能是互联网的故事太抢眼,,让我们遗忘了古板工业。。可是,,我个人感受到的古板行业,,尤其是制造业,,却蓄势待发!为什么??????两个基本事实:(1)物联网手艺越来越成熟,,响应的数据收罗越来越利便。。一个典范的案例就是车联网。。毋庸置疑,,未来的汽车一定被成百上千个、种种各样的探测器所困绕。。这些探测器会准确纪录汽车行驶的方方面面。。例如:胎压、发念头温度、地理位置、行驶偏向、行驶速率、加速率、角速率等。。这就组成了统计剖析的数据基础。。(2)由于古板制造业体量重大。。动则一个汽车厂商年产汽车百万台,,或者一个家电企业年产电视机万万台。。因此,,若是数据剖析能够爆发任何有益的刷新方案,,带来的价值都是极其重大的,,很可能远远大于数据剖析(例如:精准营销)之于互联网的价值。。由此可见,,关于古板制造业,,数据剖析,,很可能不以消耗者为第一焦点。。而是以流程再造、产品刷新、本钱节约为第一焦点。。这点跟互联网行业很纷歧样。。而这一切,,都是以物联网的大规模、低本钱的实验为条件。。因此,,物联网将是另外一个风口所在!

基于以上讨论,,作为统计学事情者的我们应该怎样应对??????我以为需要以一种很是谦卑开放的心态,,去学习营业知识,,相识应用场景,,实践统计学理论。。这方面,,可供我们实践的沃土太富厚了。。它们包括但不局限于:游戏、电商、社交、广告、投资、金融、征信、可衣着装备、车联网、装备监控、政府、医疗等。。已往的历史已经很清晰地说明:统计学的生长,,一定要顺势而为。。要顺应工业厘革,,手艺前进,,以及制度情形。。在中国,,互联网和物联网就是时势所趋,,这就是风口所在。。统计学从这里出发,,想不飞都难!