[ad_1]
美联储于2022年3月开始上调联邦基金利率。此后,几乎所有资产类别均表现不佳,而固定收益资产与股票之间的相关性飙升,导致固定收益作为对冲工具的传统作用失效。
随着资产多元化的价值至少暂时减弱,对联邦公开市场委员会 (FOMC) 前景的客观和量化理解变得越来越重要。
这就是机器学习 (ML) 和自然语言处理 (NLP) 的用武之地。我们将 Loughran-McDonald 情感词列表以及用于 NLP 的 BERT 和 XLNet ML 技术应用于 FOMC 声明,看看他们是否预期联邦基金利率的变化,然后检查我们的结果是否与股市表现有任何相关性。
Loughran-McDonald 情感词汇表
在计算情绪分数之前,我们首先构建词云来可视化 FOMC 声明中特定词的频率/重要性。
文字云:2017 年 3 月联邦公开市场委员会声明
文字云:2019 年 7 月联邦公开市场委员会声明
尽管美联储 增加 2017 年 3 月的联邦基金利率和 减少 it 在 2019 年 7 月,两个对应语句的词云看起来很相似。 这是因为 FOMC 声明通常包含许多与 FOMC 前景无关的无情绪词汇。 因此,词云无法区分信号和噪声。 但定量分析可以提供一些清晰度。
Loughran-McDonald 情感词列表分析 10-K 文档、收益电话会议记录和其他文本,将词分为以下几类:消极、积极、不确定、诉讼、强模态、弱模态和约束。 我们将此技术应用于 FOMC 声明,将词语指定为正面/鹰派或负面/鸽派,同时过滤掉不太重要的文本,如日期、页码、投票成员和货币政策实施的解释。 然后,我们使用以下公式计算情绪分数:
情感得分 =(正面词 – 负面词)/(正面词 + 负面词)
FOMC 声明:Loughran-McDonald 情绪评分
如上图所示,FOMC 的声明在 2021 年 3 月变得更加积极/鹰派,并在 2021 年 7 月达到顶峰。在随后的 12 个月走软之后,情绪在 2022 年 7 月再次上涨。尽管这些走势可能部分是由复苏推动的从 COVID-19 大流行来看,它们也反映了 FOMC 在过去一年左右的时间里面对不断上升的通胀而变得越来越强硬。
但巨大的波动也表明了 Loughran-McDonald 分析的一个固有缺陷:情绪分数只评估单词,而不评估句子。 例如,在“失业率下降”这句话中,这两个词都被认为是消极/温和的,尽管作为一个句子,该声明表明劳动力市场正在改善,大多数人会将其解释为积极/鹰派。
为了解决这个问题,我们训练了 BERT 和 XLNet 模型来逐句分析语句。
BERT 和 XLNet
Bidirectional Encoder Representations from Transformers,或 BERT,是一种语言表示模型,它使用双向而不是单向编码器来进行更好的微调。 事实上,凭借其双向编码器,我们发现 BERT 优于使用单向编码器的 OpenAI GPT。
与此同时,XLNet 是一种广义自回归预训练方法,它还具有双向编码器但没有掩码语言建模 (MLM),它为 BERT 提供一个句子并优化 BERT 内部的权重以在另一侧输出相同的句子。 然而,在我们向 BERT 提供输入句子之前,我们在 MLM 中屏蔽了一些标记。 XLNet 避免了这一点,这使其成为 BERT 的改进版本。
为了训练这两个模型,我们将 FOMC 声明分为训练数据集、测试数据集和样本外数据集。 我们提取了 2017 年 2 月至 2020 年 12 月的训练和测试数据集以及 2021 年 6 月至 2022 年 7 月的样本外数据集。然后我们应用了两种不同的标记技术:手动和自动。 使用自动标记,我们根据句子是否表示联邦基金利率增加、减少或没有变化,分别给它们赋值 1、0 或无。 使用手动标记,我们将句子分类为 1、0 或无,具体取决于它们是鹰派、鸽派还是中立。
然后我们运行以下公式来生成情绪分数:
情绪分数 =(正面句子 – 负面句子)/(正面句子 + 负面句子)
人工智能模型的性能
伯特 (自动贴标) |
XL网 (自动贴标) |
伯特 (手动标签) |
XL网 (手动标注) |
|
精确 | 86.36% | 82.14% | 84.62% | 95.00% |
记起 | 63.33% | 76.67% | 95.65% | 82.61% |
F分数 | 73.08% | 79.31% | 89.80% | 88.37% |
预测情绪得分(自动标记)
预测情绪得分(人工标注)
上面的两个图表表明,手动标记更好地捕捉了 FOMC 立场的近期转变。 即使 FOMC 最终降低(或提高)联邦基金利率,每份声明都包含鹰派(或鸽派)的句子。 从这个意义上说,逐句标记可以很好地训练这些 ML 模型。
由于 ML 和 AI 模型往往是黑匣子,因此我们如何解释它们的结果非常重要。 一种方法是应用本地可解释模型不可知解释 (LIME)。 这些应用一个简单的模型来解释一个更复杂的模型。 下面的两个图显示了 XLNet(带有手动标签)如何解读 FOMC 声明中的句子,将第一句解读为积极/强硬的基于劳动力市场的增强和适度扩张的经济活动,将第二句解读为消极的/鸽派的因为消费者价格下降通货膨胀率低于 2%。 该模型对经济活动和通胀压力的判断似乎是恰当的。
LIME 结果:联邦公开市场委员会强势经济判决
LIME 结果:FOMC 弱通胀压力判
结论
通过从声明中提取句子然后评估他们的情绪,这些技术让我们更好地掌握了 FOMC 的政策观点,并有可能使中央银行的沟通在未来更容易解释和理解。
但 FOMC 声明的情绪变化与美国股市回报之间是否存在联系? 下图绘制了道琼斯工业平均指数 (DJIA) 和纳斯达克综合指数 (IXIC) 的累积回报以及 FOMC 情绪评分。 我们调查了相关性、跟踪误差、超额回报和超额波动,以检测由纵轴衡量的股票回报的制度变化。
股票回报率和 FOMC 声明敏感性评分
结果表明,正如预期的那样,我们的情绪评分确实检测到状态变化,股票市场状态变化和 FOMC 情绪评分的突然变化大致同时发生。 根据我们的分析,纳斯达克可能对 FOMC 情绪评分反应更灵敏。
总的来说,这项研究暗示了机器学习技术对投资管理未来的巨大潜力。 当然,归根结底,这些技术如何与人类判断相结合,将决定其最终价值。
我们要感谢 Yoshimasa Satoh, CFA、James Sullivan, CFA 和 Paul McCaffrey。 Satoh 作为主持人组织和协调了 AI 研究小组,并以深思熟虑的见解审查和修改了我们的报告。 Sullivan 编写了将 PDF 格式的 FOMC 声明转换为文本和摘录及相关信息的 Python 代码。 McCaffrey 为我们完成这份研究报告提供了大力支持。
如果你喜欢这篇文章,别忘了订阅 进取的投资者.
所有帖子均为作者的意见。 因此,它们不应被解释为投资建议,所表达的意见也不一定反映 CFA Institute 或作者雇主的观点。
图片来源:©Getty Images/AerialPerspective Works
CFA 协会会员的专业学习
CFA 协会会员有权自行决定和自行报告所获得的专业学习 (PL) 学分,包括关于 进取的投资者. 会员可以使用他们的在线 PL 跟踪器轻松记录学分。
[ad_2]
Source link