[ad_1]
美联储于2022年3月开始上调联邦基金利率。此后,几乎所有资产类别均表现不佳,而固定收益资产与股票之间的相关性飙升,导致固定收益作为对冲工具的传统作用失效。
随着资产多元化的价值至少暂时减弱,对联邦公开市场委员会 (FOMC) 前景的客观和量化理解变得越来越重要。
这就是机器学习 (ML) 和自然语言处理 (NLP) 的用武之地。我们将 Loughran-McDonald 情感词列表以及用于 NLP 的 BERT 和 XLNet ML 技术应用于 FOMC 声明,以查看他们是否预期联邦基金利率的变化,然后检查我们的结果是否与股市表现有任何相关性。
Loughran-McDonald 情感词汇表
在计算情绪分数之前,我们首先构建词云来可视化 FOMC 声明中特定词的频率/重要性。
文字云:2017 年 3 月联邦公开市场委员会声明
文字云:2019 年 7 月联邦公开市场委员会声明
尽管美联储 增加 2017 年 3 月的联邦基金利率和 减少 it 在 2019 年 7 月,两个对应语句的词云看起来很相似。 这是因为 FOMC 声明通常包含许多与 FOMC 前景无关的无情绪词汇。 因此,词云无法区分信号和噪声。 但定量分析可以提供一些清晰度。
Loughran-McDonald 情感词列表分析 10-K 文档、收益电话会议记录和其他文本,将词分为以下几类:消极、积极、不确定、诉讼、强模态、弱模态和约束。 我们将此技术应用于 FOMC 声明,将词语指定为正面/鹰派或负面/鸽派,同时过滤掉不太重要的文本,如日期、页码、投票成员和货币政策实施的解释。 然后,我们使用以下公式计算情绪分数:
情感得分 =(正面词 – 负面词)/(正面词 + 负面词)
FOMC 声明:Loughran-McDonald 情绪评分
如上图所示,FOMC 的声明在 2021 年 3 月变得更加积极/鹰派,并在 2021 年 7 月达到顶峰。在随后的 12 个月走软之后,情绪在 2022 年 7 月再次上涨。尽管这些走势可能部分是由复苏推动的从 COVID-19 大流行来看,它们也反映了 FOMC 在过去一年左右的时间里面对不断上升的通胀而变得越来越强硬。
但巨大的波动也表明了 Loughran-McDonald 分析的一个固有缺陷:情绪分数只评估单词,而不评估句子。 例如,在“失业率下降”这句话中,这两个词都被认为是消极/温和的,尽管作为一个句子,该声明表明劳动力市场正在改善,大多数人会将其解释为积极/鹰派。
为了解决这个问题,我们训练了 BERT 和 XLNet 模型来逐句分析语句。
BERT 和 XLNet
Bidirectional Encoder Representations from Transformers 或 BERT 是一种语言表示模型,它使用双向而不是单向编码器来进行更好的微调。 事实上,凭借其双向编码器,我们发现 BERT 优于使用单向编码器的 OpenAI GPT。
与此同时,XLNet 是一种广义自回归预训练方法,它还具有双向编码器但没有掩码语言建模 (MLM),它为 BERT 提供一个句子并优化 BERT 内部的权重以在另一侧输出相同的句子。 然而,在我们向 BERT 提供输入句子之前,我们在 MLM 中屏蔽了一些标记。 XLNet 避免了这一点,这使其成为 BERT 的改进版本。
为了训练这两个模型,我们将 FOMC 声明分为训练数据集、测试数据集和样本外数据集。 我们提取了 2017 年 2 月至 2020 年 12 月的训练和测试数据集以及 2021 年 6 月至 2022 年 7 月的样本外数据集。然后我们应用了两种不同的标记技术:手动和自动。 使用自动标记,我们根据句子是否表示联邦基金利率增加、减少或没有变化,分别给它们赋值 1、0 或无。 使用手动标记,我们将句子分类为 1、0 或无,具体取决于它们是鹰派、鸽派还是中立。
然后我们运行以下公式来生成情绪分数:
情绪分数 =(正面句子 – 负面句子)/(正面句子 + 负面句子)
人工智能模型的性能
伯特 (自动贴标) |
XL网 (自动贴标) |
伯特 (手动标注) |
XL网 (手动标注) |
|
精确 | 86.36% | 82.14% | 84.62% | 95.00% |
记起 | 63.33% | 76.67% | 95.65% | 82.61% |
F分数 | 73.08% | 79.31% | 89.80% | 88.37% |
预测情绪得分(自动标记)
预测情绪得分(人工标注)
上面的两个图表表明,手动标记更好地捕捉了 FOMC 立场的近期转变。 即使 FOMC 最终降低(或提高)联邦基金利率,每份声明都包含鹰派(或鸽派)的句子。 从这个意义上说,逐句标记可以很好地训练这些 ML 模型。
由于 ML 和 AI 模型往往是黑匣子,因此我们如何解释它们的结果非常重要。 一种方法是应用本地可解释模型不可知解释 (LIME)。 这些应用一个简单的模型来解释一个更复杂的模型。 下面的两个图显示了 XLNet(带有手动标签)如何解读 FOMC 声明中的句子,将第一句解读为积极/强硬的基于劳动力市场的增强和适度扩张的经济活动,将第二句解读为消极的/鸽派的因为消费者价格下降通货膨胀率低于 2%。 该模型对经济活动和通胀压力的判断似乎是恰当的。
LIME 结果:联邦公开市场委员会强势经济判决
LIME 结果:FOMC 弱通胀压力判
结论
通过从声明中提取句子然后评估他们的情绪,这些技术让我们更好地掌握了 FOMC 的政策观点,并有可能使中央银行的沟通在未来更容易解释和理解。
但 FOMC 声明的情绪变化与美国股市回报之间是否存在联系? 下图绘制了道琼斯工业平均指数 (DJIA) 和纳斯达克综合指数 (IXIC) 的累积回报以及 FOMC 情绪评分。 我们调查了相关性、跟踪误差、超额回报和超额波动,以检测由纵轴衡量的股票回报的制度变化。
股票回报率和 FOMC 声明敏感性评分
结果表明,正如预期的那样,我们的情绪评分确实检测到状态变化,股票市场状态变化和 FOMC 情绪评分的突然变化大致同时发生。 根据我们的分析,纳斯达克可能对 FOMC 情绪评分反应更灵敏。
总的来说,这项研究暗示了机器学习技术对投资管理未来的巨大潜力。 当然,归根结底,这些技术如何与人类判断相结合,将决定其最终价值。
我们要感谢 Yoshimasa Satoh, CFA、James Sullivan, CFA 和 Paul McCaffrey。 Satoh 作为主持人组织和协调了 AI 研究小组,并以深思熟虑的见解审查和修改了我们的报告。 Sullivan 编写了将 PDF 格式的 FOMC 声明转换为文本和摘录及相关信息的 Python 代码。 McCaffrey 为我们完成这份研究报告提供了大力支持。
如果你喜欢这篇文章,别忘了订阅 进取的投资者.
所有帖子均为作者的意见。 因此,它们不应被解释为投资建议,所表达的意见也不一定反映 CFA Institute 或作者雇主的观点。
图片来源:©Getty Images/AerialPerspective Works
CFA 协会会员的专业学习
CFA 协会会员有权自行决定和自行报告所获得的专业学习 (PL) 学分,包括关于 进取的投资者. 会员可以使用他们的在线 PL 跟踪器轻松记录学分。
[ad_2]
Source link