R语言分析股市相关结构:用回归估计股票尾部相关性(相依性、依赖性)

发布时间 2023-06-16 14:42:11作者: 拓端tecdat

原文链接:http://tecdat.cn/?p=25860 

最近我们被客户要求撰写关于股票尾部相关性的研究报告,包括一些图形和统计输出。

什么是尾部相关性?

假设市场出现了属于最差 5% 的日子的回撤(缩减):
图片
有人可以问,鉴于市场处于蓝色区域,特定股票下跌的概率是多少?

我们都了解股票相对于市场的贝塔系数、股票相对于市场的敏感性(例如标准普尔 500 指数)的概念。尾部相关性的概念类似,因为它是股票对市场回撤的敏感性。如果每次市场下跌,股票下跌,那将意味着两件事:

  1. 鉴于市场已经下跌,股票下跌的概率是 100%。
  2. 股票对市场下跌非常敏感

直观地认为,这样的方法会与高beta 值相伴而行。但这并不是一对一的。很有可能的是,与另一只低beta 的股票相比,高beta 的股票对下跌的敏感度较低。

形式上,股票左尾对市场左尾的相关性定义为:

(1) 图片

其中 Q 是分位数,这取决于您如何定义尾部,在我们的示例中为 5%。从概率来看,如果两个事件是独立的,那么看到这两个事件的概率是每个事件概率的乘积:

(2) 图片

其中 A 是事件: 图片, B 是事件 图片。根据经验,我们所做的估计只是简单地计算位于股票 5% 临界值以下的点数,对于位于市场 5% 以下的每个点。这个函数使用这个概念来衡量两个时间序列之间的尾部相关性:

 
# cc参数定义了尾部。默认为5%。

co<- function{

# 如果两个序列不在同一长度上,则停止。

if(length!=length(sb)){stop }

TT <- length(



# 计算有多少是低于5%的

ind0 <- ifelse
ind <- which

# 鉴于序列a低于5%(意味着有缩减),计算序列b中有多少个

ind1 <- sum(ifelse(reb<quantile,1,0))

# 计算概率

p0 <- id1/TT # 两者都放弃的概率

让我们拉出 10 只 ETF,看看 beta 与尾部相关性度量有何不同。我们拉动股票代码并转换为每周收益。

 
sym 
l=length
end
dat0 = (getSymbols
n = NROW

w0 <- NULL

for (i in 1:l){

dat0 = getSymbols
w1 <- weeklyReturn
w0 <- cbind
}

现在我们计算 beta 和尾部相关性度量,并绘制它。

 
pr <- bet <- NULL

for(i in 1:(l-1)){

bet[i] <- lm
pr[i] <- cortr
}

barplot

图片

蓝线是 图片 ,这是我们对两个完全(尾部)独立序列的期望。


点击标题查阅往期内容

图片

R语言实现 Copula 算法建模相依性案例分析报告

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

用简单的计量经济学对尾部相关性建模,可以考虑使用回归设置。使用无截距回归同样可以达到第二张图表的底部面板:

(3) 图片

其中, 图片 是事件 A 发生时股票出现回撤的指标函数。看一看:

 
fiquan <- quantile
indl <- ifelse
betdpe <- NULL

for(i in 1:(l-1)){

fivuan <- quantile
indk <- ifelse
betence[i] <- lm$coef[1]

}

图片

因此,我们可以使用我们对回归的了解并将分析扩展到多变量案例,而不是使用困难的多维 copula 和收敛问题。在不仅有B的缩减,而且有C和D的缩减的情况下,我们看到A的缩减有多大可能。

不足和展望

  • 我们可以进行推断,但不使用回归系数的通常 STD,因为它是指标回归.
  • 我们还必须包括交互项,以使推理有效。
  • 我们用更新的回归方法来改进估计;套索lasso、bagging等

最后,我想知道 XLU(公用事业)ETF 的情况如何,为什么尾部相关性相对于 beta 而言看起来很弱,以及与 XLY相比,情况有何不同。

 
plot
lines(lowess, lwd = 2, col = 4)

图片
我们的估计对一些极端观察很敏感。也许稳健的回归会提供更稳定的估计,因此这是另一个可能的扩展。


图片

本文摘选 《 R语言分析股市相关结构:用回归估计股票尾部相关性(相依性、依赖性) 》 ,点击“阅读原文”获取全文完整资料。


点击标题查阅往期内容

样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据
【视频】CNN(卷积神经网络)模型以及R语言实现回归数据分析
用收缩估计股票beta系数回归分析Microsoft收益率风险
对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
多项式Logistic逻辑回归进行多类别分类和交叉验证准确度箱线图可视化
R语言分段线性回归分析预测车辆的制动距离
R语言分段回归数据数据分析案例报告
R语言stan进行基于贝叶斯推断的回归模型
R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响
R语言线性回归和时间序列分析北京房价影响因素可视化案例
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归
R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据
【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
R语言如何和何时使用glmnet岭回归逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化
高维数据惩罚回归方法:主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集
实现广义相加模型GAM和普通最小二乘(OLS)回归
贝叶斯线性回归和多元线性回归构建工资预测模型
Python支持向量回归SVR拟合、预测回归数据和可视化准确性检查实例
逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例
广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证
非线性回归nls探索分析河流阶段性流量数据和评级曲线、流量预测可视化
特征选择方法——最佳子集回归、逐步回归
线性回归和时间序列分析北京房价影响因素可视化案例
贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化
PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
spss modeler用决策树神经网络预测ST的股票
R语言中使用线性模型、回归决策树自动组合特征因子水平
R语言中自编基尼系数的CART回归决策树的实现
R语言用rle,svm和rpart决策树进行时间序列预测
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证
R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
如何用R语言在机器学习中建立集成模型?
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测在python 深度学习Keras中计算神经网络集成模型R语言ARIMA集成模型预测时间序列分析R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言基于Bootstrap的线性回归预测置信区间估计方法
R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线
matlab使用分位数随机森林(QRF)回归树检测异常值