
作为一个在商学院事情了十多年的统计学教员,,,一天到晚为自己,,,为学生,,,或者年轻相助同伴多写俩Statistical Paper绞尽脑汁,,,也是无聊透顶,不知道几多脑细胞因此牺牲。。。。难堪空闲的时间,,,就瞎琢磨几个深刻的问题。。。。虽然,,,我也不知道这么深刻的问题,,,该不应我来琢磨。。。。可是既然琢磨了,,,就不如写下来跟各人分享探讨。。。。这几个问题就是:中国统计学未来生长的大偏向是什么??????背后的逻辑是什么??????套用一句时髦的互联网语言就是:中国统计学的风口在那里??????

人说以史为鉴!以是,,,首先简朴回首一下某些统计学领域的生长史,例如实验设计。。。。昔时,,,这个领域是怎样生长起来的??????岂非是少数天才学者的智力游戏吗??????显然不是。。。。这是农业生产的需要。。。。相关科学实验是最基础的驱动力。。。。那么厥后呢??????是工业化历程,,,以至于又催生了质量控制、可靠性等相关学科。。。。罢了往这十年是盘算机实验。。。。那么未来呢??????我想一定是互联网。。。。这说明什么??????这说明统计学的生长要顺应工业厘革,,,这是时势所趋!
再看一个例子,,,高维数据剖析是最近20年才被提出来的吗??????不是!早在这个之前,,,就有学者,,,受个人学术兴趣的驱动,,,也曾提出过类似的问题,,,但没有形成天气。。。。为什么??????是由于其他学者其时有眼无珠吗??????我以为不是。。。。一个主要原因是,,,这样的要领在其时似乎没什么主要的现实应用。。。。这就难怪其时主流统计学研究不体贴这个问题。。。。但为什么,,,这个昔时让人脑洞大开的异类问题,,,却成了最近20年的研究主流了??????由于科学手艺变了。。。。以DNA Microarray为代表的生物手艺的重大前进,,,爆发了大宗这样的数据。。。。而这些数据,,,蕴藏着关乎人类生命康健的神秘,,,具有主要的科学价值。。。。这成绩了已往这些年的(超)高维数据研究。。。。这说明什么??????这说明统计学的生长依赖于手艺前进,,,这是时势所趋!
最后一个例子。。。。为什么制药统计学在美国那么主要??????由于生物制药这个工业极其强盛。。。。默克、强生、施贵宝等一大批制药巨头,,,每年要实验大宗的临床实验,,,爆发了大宗的数据,,,造成了海量的剖析需求,,,进而推动了制药统计学的生长。。。。为什么这些巨头愿意投入重大的时间、财力、物力作临床试验??????是它们对科研的好奇心??????照旧品德上的高尚??????可能都有一些,,,但不是最基础的。。。。最基础的是美国食物药物监视局(FDA)对市场的强力羁系。。。。这个制度情形造成了相关企业必需实验严酷的临床试验,,,进而爆发了强劲的统计剖析需求。。。。而制药统计的生长,,,又极大地增进了相关领域,,,例如:生物统计学的生长。。。。这说明什么??????这说明统计学的生长需要一定的制度情形,,,这是时势所趋!
以是我们无妨下一个结论:“统计学的时势所趋,,,从不以任何个人的兴趣喜欢为转移。。。。而是由工业厘革(例如:工业化历程),手艺前进(例如:DNA Microarray),,,尚有制度情形(例如:FDA政策)所决议”。。。。这一点,,,我以为一定要看清晰!雷军说:站在风口,,,猪都能飞!这说的是,,,重大选摘要顺势而为。。。。背后隐含的另外一个结论是,,,若是逆风而动,,,鹰也飞不起来。。。。这是我个人看待中国统计学生长偏向的基本逻辑。。。。那么,,,在中国这片土地上,,,面临当下的工业基础,,,政策情形,,,安博电竞时势在那里??????统计学的风口在那里??????要当飞起来的猪??????照旧被打爬下的鹰??????或者更好:顺势而为的鹰??????

要回覆这个问题,,,需要磨练一下中国的现状。。。。中国有强盛的制药工业吗??????我相信未来会有。。。。但不是今天,,,不是明天,,,不是我们可见的未来5到10年。。。。为什么??????由于我们缺乏强有力的制度情形。。。。越发详细地说,,,我们缺乏类似FDA的强力羁系机构。。。。现在的国家药品监视局(即:中国的FDA)已经做了许多有意义的事情,,,可是显然还远远不敷。。。。为什么??????君不见各人对食物清静的焦虑吗??????这还缺乏以批注安博电竞制度情形需要long way to go吗??????若是上面讨论的是对的,,,那么请允许我做一个悲催的预测:在中国,,,未来可见的相当长时间内,,,生物统计学,,,将会是一个主要的保存,,,可是不可能大放异彩。。。。为什么??????由于:没有响应的制度情形。。。。对,,,就这么简朴!
那么中国有哪些工业在全球规模内是有竞争力的呢??????第一、互联网;;第二、制造业。。。。这很好明确。。。。;チ矫,,,我们有以BAT为代表的一大批有竞争力的企业。。。。而制造业方面,,,中国是天下的中心,,,孕育了像华为这样伟大而优异的企业。。。。这两个行业,,,有可能形成风口,,,或者正在形成。。。。这两个行业就是统计学研究的时势所趋,,,风口所在!

更进一步地,,,这两个时势对统计学研究的详细影响会是什么呢??????我们先讨论一下互联网,,,尤其是移动互联网,,,由于各人都很熟悉。。。。讨教:移动互联网爆发了什么奇异数据??????它们的价值何在,,,应该怎样研究??????要回覆这个问题,,,看看自己最常用的APP就知道谜底了。。。。我们最常用什么??????微信。。。。外洋呢??????Facebook andTwitter。。。。它们是什么??????所有都是基于社交的软件或者服务。。。。它们爆发了什么样的数据??????首先是网络结构数据,,,用于描绘了用户之间的社交关系。。。。关于统计剖析,,,这会带来什么样的转变??????最基础的转变就是让信息沿着网络结构最先流通。。。。通俗地讲,,,以前,,,我们判断一个人是好人照旧坏人(因变量),主要参考他自己的特征(诠释性变量)。。。。可是,,,有了网络结构,,,与之相连个体的所有信息(即包括因变量、也包括诠释性变量),,,都可以被使用起来,,,以提高预测精度。。。。可是,,,能够切合该理念、知足该需求的统计学模子却少之又少。。。。这就是网络数据赋予统计学生长的重大时机,,,这就是风口所在!
再看看制造业。。。。制造业有几个特点。。。。第一、中国是全天下的制造中心,,,可是亟待工业升级,,,进入工业4.0时代。。。。第二、与天下制造中心相对应的是,,,对中国制造业的数据,,,我们却极其无知,,,远远落伍于互联网。。。。爆发这个征象,,,可能有两个原因:首先可能是是古板制造业的数据收罗难题,,,不如互联网利便;;其次可能是互联网的故事太抢眼,,,让我们遗忘了古板工业。。。。可是,,,我个人感受到的古板行业,,,尤其是制造业,,,却蓄势待发!为什么??????两个基本事实:(1)物联网手艺越来越成熟,,,响应的数据收罗越来越利便。。。。一个典范的案例就是车联网。。。。毋庸置疑,,,未来的汽车一定被成百上千个、种种各样的探测器所困绕。。。。这些探测器会准确纪录汽车行驶的方方面面。。。。例如:胎压、发念头温度、地理位置、行驶偏向、行驶速率、加速率、角速率等。。。。这就组成了统计剖析的数据基础。。。。(2)由于古板制造业体量重大。。。。动则一个汽车厂商年产汽车百万台,,,或者一个家电企业年产电视机万万台。。。。因此,,,若是数据剖析能够爆发任何有益的刷新方案,,,带来的价值都是极其重大的,,,很可能远远大于数据剖析(例如:精准营销)之于互联网的价值。。。。由此可见,,,关于古板制造业,,,数据剖析,,,很可能不以消耗者为第一焦点。。。。而是以流程再造、产品刷新、本钱节约为第一焦点。。。。这点跟互联网行业很纷歧样。。。。而这一切,,,都是以物联网的大规模、低本钱的实验为条件。。。。因此,,,物联网将是另外一个风口所在!

基于以上讨论,,,作为统计学事情者的我们应该怎样应对??????我以为需要以一种很是谦卑开放的心态,,,去学习营业知识,,,相识应用场景,,,实践统计学理论。。。。这方面,,,可供我们实践的沃土太富厚了。。。。它们包括但不局限于:游戏、电商、社交、广告、投资、金融、征信、可衣着装备、车联网、装备监控、政府、医疗等。。。。已往的历史已经很清晰地说明:统计学的生长,,,一定要顺势而为。。。。要顺应工业厘革,,,手艺前进,,,以及制度情形。。。。在中国,,,互联网和物联网就是时势所趋,,,这就是风口所在。。。。统计学从这里出发,,,想不飞都难!