数据收罗和存贮手艺的飞跃生长,,,,,,孕育了众多领域的大数据。。。。大数据泛起在包括金融、经济、治理等种种领域,,,,,,为计量经济学的生长带来了前所未有的机缘和挑战。。。。在已往的二十年间,,,,,,大型因子模子被普遍地用来剖析高维数据。。。。经济学和金融学中的高维数据集通常以较大的横截面维度N和较长的时间维度T为特征。。。。而高维因子模子可以用少数几个潜在的因子来捕获到高维变量中的大部分信息,,,,,,因此获得了经管学科的普遍关注。。。。
关于高维因子模子的理论研究和数据剖析经常是基于线性的假设。。。。然而现实的宏观经济运作、企业谋划治理经常受到国家政策、新手艺刷新、全球金融危;鹊挠跋,,,,,,因此其数据结构经常爆发转变。。。。另外,,,,,,思量到大数据视察时间长,,,,,,样本容量大的特点,,,,,,经济学模子很容易具有结构不稳固性和非线性的特征。。。。因此,,,,,,结构不稳固性的剖析在经济数据,,,,,,特殊是高维时间序列数据上起到至关主要的作用。。。。忽略高维因子模子中泛起的结构不稳固性,,,,,,将会导致过失的推断和预测。。。。
安博电竞商务统计与经济计量系涂云东教授在因子模子及其结构不稳固性领域举行了深入研究。。。。由涂云东教授与其指导的博士生马辰辰配合撰写的两篇论文“Group Fused Lasso for large factor model with structural breaks”和“Shrinkage Estimation of Multiple Threshold Factor Models”先后揭晓在计量经济学国际顶级期刊Journal of Econometrics (《计量经济学杂志》)上。。。。两篇论文针对经济和金融数据的结构不稳固性,,,,,,在高维因子模子的框架下,,,,,,提出了关于结构变点和门限效应参数的全新预计要领,,,,,,力争提升参数预计的准确性和盘算效率,,,,,,进而展现计量经济学和统计学的要领在剖析经济问题中的普遍应用。。。。
因子模子接纳少数因子即可捕获到高维视察变量中的大部分信息,,,,,,因此成为剖析高维时间序列数据的一个主要的工具。。。。尤其是在现在的大数据时代,,,,,,因子模子受到了越来越多的关注,,,,,,其模子表达如下:

其中xit是我们视察到的高维时间序列数据,,,,,,ft是潜在的因子,,,,,,λi是响应的因子载荷,,,,,,eit是残差项。。。。自从Stock和Watson(2002)以及Bai和Ng(2002)的有影响力的研究以来,,,,,,计量经济学领域和统计学界对高维因子模子中推断的研究兴趣激增,,,,,,最新生长包括Bai和Li(2016)、Chen等人(2021)等。。。。
在现有的文献里,,,,,,对因子模子理论研究和数据剖析大多都是基于线性模子假设(Bai 和 Ng,,,,,,2002;;Bai 和 Li,,,,,,2012;;Bai 和 Liao,,,,,,2016),,,,,,也就是说这里的因子载荷λi是一个不随时间转变的常数。。。。然而,,,,,,现实的经济情形经常;崾艿娇萍纪黄啤⒄策宣布、金融危;鹊挠跋,,,,,,因此其数据结构经常爆发转变,,,,,,这使得上述的线性因子模子的假设在现实的数据剖析中变得十分懦弱。。。?K剂康酱笫菔硬焓奔涑,,,,,,样本容量大,,,,,,因子模子可能具有结构不稳固性和非线性特征。。。。因此,,,,,,为相识决真实重大大数据中的因子降维,,,,,,带有结构性转变的大型因子模子和非线性因子模子成为近年来研究的热门。。。。
Stock 和 Watson(2002, 2009)研究得出结论,,,,,,当因子载荷泛起小的(局部收敛到0)突变时,,,,,,通过主因素剖析预计的因子同样具有一致性。。。。可是Breitung 和 Eickmeier(2011)发明若是忽视因子载荷中的突变,,,,,,将可能会导致识别出更多因子的过失效果。。。。于是学者针对因子模子中的结构变点陆续提出了差别的磨练和预计的要领(Chen et al.,,,,,,2014;;Han 和 Inoue,,,,,,2015;;Su 和 Wang,,,,,,2017;;Ma 和 Su,,,,,,2018;;Baltagi et al.,,,,,,2017,,,,,,2020)。。。。大部分的研究仅仅关注于因子载荷中只保存一个变点的情形。。。。可是在大数据时代,,,,,,研究者越来越致力于研究更高维的数据集,,,,,,这些数据会包括数百个变量,,,,,,并包括极大的时间跨度,,,,,,部分甚至所有的变量都可能在采样周期爆发凌驾一个突变。。。。可是现在关于多个变点的研究中,,,,,,通常;岜4娴骼聿问虼啦问嗟奈侍,,,,,,从而使得要领过于重大,,,,,,理论研究难度较大。。。。以是当因子模子中保存多个结构性变点时,,,,,,简朴易行的预计和磨练要领亟待提出。。。。
涂云东教授等2023年揭晓的论文很好地解决了这一问题 (Ma 和 Tu,2023a)。。。。他们思量在大型因子模子中,,,,,,因子载荷中保存的多个变点的预计问题。。。。也就是说因子载荷λi在时间维度上被划分成多个时段:

这里结构变点为t1, ... ,tm ,,,,,,αi1, ... , αim+1,,,,,,为因子载荷λi在差别时段上的取值,,,,,,相邻两段上的因子载荷互不相同。。。。
该论文拓展了Chen等人(2014)关于简单变点的效果,,,,,,将因子载荷中结构变点的识别问题转化为因子回归方程中系数的结构变点预计,,,,,,然后提出了一种基于group Lasso 的预计要领来识别变点日期。。。。这里思量的因子模子允许变点的数目和日期都未知。。。。别的,,,,,,这篇论文允许因子个数随着时间的转变而转变,,,,,,也就是说变点前后可能有新的因子泛起,,,,,,也可能有旧的因子消逝。。。。预计要领可以通过简朴的两个方法实现:首先,,,,,,忽略变点,,,,,,用主因素要领预计因子,,,,,,并用Bai 和 Ng(2002)提出的信息准则预计因子的数目。。。。其次,,,,,,用其中的一个预计的因子(例如,,,,,,拥有最大特征值的因子)作为因变量,,,,,,其余的因子作为自变量举行线性回归。。。。将因子载荷中突变点的预计转换为线性回归方程的突变点的预计问题。。。。因此可以用Group Fused Lasso的要领(Qian 和 Su, 2016)将回归方程中所有突变点同时预计出来。。。。
该论文在理论上建设了变点预计量的一致性并推导了其渐进漫衍。。。。同时,,,,,,数值模拟批注,,,,,,与现有要领的效果举行较量,,,,,,该要领在大幅度提升预计效率的同时获得相对较小的预计误差。。。。最后,,,,,,论文将该要领运用到美国宏观经济的数据举行实证研究。。。。这个数据集包括108个美国月度的宏观经济数据集,,,,,,包括现实经济活动指标、价钱、利率、钱币和信贷总量、股票价钱和汇率等变量。。。。其时间跨度从1959年1月份到2006年12月份。。。。通过建模和剖析,,,,,,该研究识别出5个变点,,,,,,划分是1979年9月、1983年9月、1990年11月、1995年7月和2000年5月。。。。这些变点对应于伊朗革命、大缓和时期、劳动生产率的提升和经济衰退等。。。。
思量高维因子模子结构不稳固性的另外一种模子是最近被频仍研究的门限因子模子。。。。门限因子模子和带有多变点的因子模子相似却又差别。。。。一个主要的区别在于,,,,,,变点模子的转变是爆发在时间维度上的,,,,,,而门限模子则是允许因子载荷凭证门限变量的巨细爆发转变。。。。以是,,,,,,门限因子模子更适合于形貌一些历史重复的征象。。。。在文献中,,,,,,Ng和Wright(2013)模拟了一个切合高维门限因子模子的数据,,,,,,以研究非线性对商业周期动态的影响。。。。Massacci(2017)和Liu和Chen(2020)思量了高维时间序列的门限因子模子,,,,,,其中假设时间序列在两种状态之间切换。。。。Wu(2021)进一步将Massacci(2017)的剖析拓展到一个带有多个门限的因子模子中。。。。门限因子模子不但为降维提供了一个强盛的工具,,,,,,还增强了建模的无邪性,,,,,,提供了一个更易于诠释和预测的框架,,,,,,可以轻松捕获潜在的非线性。。。。
高维多门限因子模子中载荷的建模详细为:
这里的zt是可视察的门限变量,,,,,,凭证其取值巨细因子模子被分成差别的区制。。。。γ1, ... , γm是待估的门限值。。。。αi1, ... , αim+1为因子载荷λi在差别区制上的取值,,,,,,且相邻区制上的取值差别。。。。
涂云东教授及其相助者2023年的另一篇文章对这种门限驱动的结构不稳固性举行了详细地叙述,,,,,,并提供了一种立异的预计要领(Ma和Tu, 2023b)。。。。仅仅借助于重排、主因素剖析和压缩预计,,,,,,该要领能够将门限的个数和参数值一致地预计出来,,,,,,并且在操作上简朴易实验,,,,,,盘算上也能大大提高效率。。。。预计要领包括两个主要的方法。。。。第一,,,,,,文章通过将可视察的时间序列xt凭证门限变量zt的巨细举行重排,,,,,,将多门限因子模子转化为多变点因子模子;;第二步运用涂云东教授提出的因子模子变点预计要领 (Ma and Tu,2023a)识别变点,,,,,,继而凭证变点的位置找到响应门限变量的值来对门限值举行预计。。。。详细的要领介绍拜见Ma和Tu(2023b)。。。。
理论方面,,,,,,他们证实晰门限数目和预计值的一致性。。。。蒙特卡洛模拟批注该要领在有限样本中预计得很好。。。。进而,,,,,,文章将提出的要领运用到剖析美国金融市场数据的剖析中。。。。数据跨度为1985年1月到2011年12月,,,,,,共有324个月度视察值。。。。这里使用的门限变量zt是Baker等人在2016年提出的关于经济政策不确定性的权衡指标。。。。正如Baker等人所说,,,,,,经济政策不确定性指数与国防、医疗保健、金融和基础设施建设等政策敏感部分的股价波动和就业有关。。。。当政策不确定性差别时,,,,,,金融市场的行为也响应有所差别,,,,,,因此文章中通过提出的多门限因子模子来研究经济政策不确定性是怎样影响金融市场,,,,,,盘算了多元非线性动态系统中的连通性(connectedness) (Massacci, 2017),评估了每个区制中因子的主要性,,,,,,最后也比照了门限因子模子和结构变点因子模子的有用性。。。。
该表格截取自涂云东教授文章中(Table 5, Ma 和 Tu, 2023b)。。。。从该表可以看出,,,,,,随着经济政策不确定性的增添,,,,,,连通性逐渐增添,,,,,,这说明经济变量之间的相关性变强,,,,,,可能会增添系统风险水平。。。。这一发明有利于风险的权衡和治理。。。。因子的个数在差别区制中也有所差别。。。。涂云东教授在文章中也剖析了每段中因子所代表的详细寄义,,,,,,发明与市场风险相关的变量在金融市场中施展着要害作用。。。。尤其是在第二个区制中,,,,,,7个因子中有5个与风险有关。。。。别的,,,,,,随着经济政策不确定性的增添,,,,,,一些行业投资组合,,,,,,如食物和煤炭行业,,,,,,在金融市场中占有着越来越主要的职位。。。。

涂云东,,,,,,安博电竞商务统计与经济计量系和北京大学统计科学中心联席教授,,,,,,研究员。。。。入选首批“日出东方”北大安博电竞青年人才,,,,,,教育部“长江学者奖励妄想”青年长江学者,,,,,,两次获评北京大学优异博士学位论文指导西席。。。。2012年获美国加州大学河滨分校经济学博士学位,,,,,,同年6月加入北大安博电竞。。。。三十余篇学术论文揭晓在Journal of Econometrics,,,,,, Econometric Reviews , Journal of Business and Economic Statistics,,,,,,Oxford Bulletin of Economics and Statistics ,,,,,,Statistica Sinica ,,,,,,Journal of Empirical Finance,,,,,,Computational Statistics and Data Analysis等国际一流专业杂志。。。。理论研究领域涵盖非参数/半参数计量经济模子,,,,,,模子选择和模子平均,,,,,,网络数据建模,,,,,,金融计量,,,,,,信息计量经济学,,,,,,模子设定磨练等;;应用研究包括宏观经济预测,,,,,,价钱指数建模,,,,,,网络数据剖析,,,,,,股票市场预测,,,,,,新冠肺炎预测等。。。。