人工智能正在改变风险建模的格局。金融机构正在评估他们是否可以通过部署大语言模型(LLM)如ChatGPT等来获得优势,但LLM是否真的比传统建模方法更有效呢?
如今,如果你是一个精通技术的金融机构,你需要评估应用人工智能,特别是像ChatGPT这样的大语言模型(LLMs)的风险和机会。
大语言模型(LLM)是否能够提供更深入的洞察,并进一步提高生产效率?为了找出答案,我对澳大利亚联邦政府债券进行了定量风险分析。我使用了公开可用的数据,并在我的个人电脑上运行了ChatGPT4——OpenAI生成式人工智能技术的最新版本。
我是看看ChatGPT4如何通过无监督的机器学习方法识别收益曲线的聚类。ChatGPT4的语言界面是否有助于从数据集中分离出异常曲线?它与编写程序并手动生成解决方案的传统方法相比如何?哪种方法会更有效率?
应用:ChatGPT4和机器学习
作为第一步,我让ChatGPT4从澳大利亚储备银行的网站中为我收集数据并存入文件。有趣的是,ChatGPT4创建了一个带有模拟利率的文件。它指出替换的原因是“无法访问RBA网站”。
因此,我不得不手动下载利率。但从这里开始,事情进展得非常迅速。在上传收益数据文件后,我向ChatGPT4发出了以下请求:
[>]请对2023年3年期和10年期逐日收益率走势进行聚类分析。
这个请求并没有解释“收益率”,我也没有告诉系统如何构造逐日的变动。我的初步想法是,这可能对于ChatGPT4来说太过宽泛了。但为什么不从这里开始,看看会发生什么呢?
在对我的请求进行了大约15秒的“分析”后,ChatGPT4出人意料地提供了3年期与10年期收益率走势的聚类和异常值的即时数据,并给出了以下图表:
ChatGPT4很顺利地通过了这一关。我仔细验证了输出结果,一切正常。因此,我现在有信心提交这个后续请求:
[>]请提供对2023年的逐日收益率变动数据的聚类分析,并在图表中绘出由此得出的收益率曲线聚类图。
经过更多的分析和几个步骤,ChatGPT4给出了以下图表:
[>]请绘制2年期和10年期差异最大且过零的日收益率曲线。
在分析了我的问题后,ChatGPT4制作了一张图表,该图表描述了最大的差异,但它的两年点和10年点都是负数。它并没有围绕零点旋转,因此是错误的。此外,它只绘制了两年期和10年期的点。为了解决这些问题,我对我的问题进行了提示设计,ChatGPT4回复了以下图表:
PythonandSciKit:基准
作为本次比较练习的基准,我使用了Python3.12编程语言。为了快速解决Python中的一些数据结构例程并设置我的编码环境,我得到了ChatGPT3.5的帮助。这些内容在Python手册中都有介绍,但手册已经过时了!
这使我能够使用开源库来加速各种任务,如读取输入数据文件和转换文件格式。我还使用了SciKit库,该库拥有大量机器学习模型,包括我通过Kmeans算法对收益率曲线进行聚类所需的无监督ML模型。
从开始到结束大约六个小时,我就能够对数据进行聚类分析、显示图表和中心点,以及用Python生成包含结果的数组。我感受到编程的成就感与过去截然不同。
进一步的想法
回到本次练习的初衷,哪种方法更有效?ChatGPT4在一次持续了整整五分钟的对话中完成了6小时的Python工作。生产力提高了72倍!
显然,我确实需要再次加快编程速度,但使用ChatGPT4根本不需要编写任何代码。ChatGPT4生成了代码供我查看和复制,以防万一我将来想使用它。
要充分发挥大语言模型(LLM)的作用,需要综合运用各种技能。数据科学家与经验丰富的风险经理(如金融风险管理师-FRM持证人)之间的合作可以带来巨大的收益。
大语言模型(LLM)仍然需要得到正确的解决方案的提示,并且必须接受局限性测试。生成式人工智能模型的结果也必须经过人工的验证。换句话说,对人工智能增强型风险解决方案的开发和实施提供适当的治理仍然至关重要。
生成式人工智能的未来已经到来,其优势显而易见。虽然有些人可能仍然对这种先进技术的风险持谨慎态度,但领先的金融机构至少会对其进行尝试,因为他们明白,要帮助人工智能做出决策,仍然非常需要人类的智慧。