大型语言模型(LLM)由与数百万或数十亿个参数相关联的人工神经网络组成,并根据大量数据(无论是自我监督学习还是半监督学习技术)进行训练,以理解和重申信息。出于各种原因,金融业已经开始利用这些工具,包括预测股市、金融教育、经济咨询、交易策略、情绪分析和风险管理。随着ChatGPT带来的技术进步,BloombergGPT和FinGPT是专门为金融领域开发的。所有三个LLM都有可能对金融部门产生影响。
ChatGPT
佛罗里达大学金融系的两位教授认为,在金融业使用先进的法学硕士可以预测股市中更准确的结果,并且只会有利于交易策略。在这项研究中,作者使用ChatGPT“使用新闻头条的情绪分析来预测股市回报”。他们发现,与BERT,GPT-1和GPT-2等模型相比,ChatGPT表现最好,只有像ChatGPT这样的更高级的模型才能分析大量数据以成功预测股票市场。
ChatGPT 是基于生成式预训练转换器架构的 LLM,由人工智能研究和部署公司 OpenAI 于 2022 年 <> 月首次推出。根据作者的说法,“GPT架构使用多层神经网络来模拟自然语言的结构和模式。使用无监督学习方法,它在大量文本数据上预先训练,例如维基百科文章或网页。在这项研究中,作者使用了从证券价格每日回报率研究中心、新闻头条和RavenPack中提取的数据集。
作者说,他们研究的最终结果只是强调了ChatGPT作为金融业根据情绪分析预测股市的工具的潜力。他们还指出,还需要更多的研究。
BloombergGPT
今年50月,彭博发布了自己的LLM,名为BloombergGPT,这是一个专门为金融业开发的363亿参数LLM。根据彭博社发表的一篇研究论文,专有的BloombergGPT由从彭博数据源中提取的345亿个代币数据集组成,该数据集还包括来自通用数据集的<>亿个代币。
表 1.BloombergGPT 如何在两大类 NLP 任务中执行:特定于财务的任务和通用任务。照片:彭博社
研究人员在金融特定的自然语言处理(NLP)基准上验证了BloombergGPT。LLM还通过彭博自己的内部基准套件进行了验证。他们发现,与GPT-NeoX,OPT66B,BLOOM176B和GPT-3等LLM相比,BloombergGPT表现最好。表 1 显示了 BloombergGPT 在两大类 NLP 任务中的性能得分:特定于财务的任务和通用任务。
“机器学习和NLP模型的质量取决于你放入其中的数据,”彭博ML产品和研究团队负责人Gideon Mann说。“由于彭博社四十多年来收集的财务文件,我们能够仔细创建一个大型且干净的特定领域数据集,以训练最适合金融用例的LLM。我们很高兴使用 BloombergGPT 来改进现有的 NLP 工作流程,同时也想出新的方法来让这个模型发挥作用,让我们的客户满意。
FinGPT
与基于专有知识的BloombergGPT不同,FinGPT是一个开源LLM,也是专门为金融行业开发的。FinGPT 被描述为由 Finblox 于 2023 年 <> 月发布的人工智能财务顾问,Finblox 是由蜻蜓和红杉支持的加密交易应用程序。该组织的目标是使金融领域的法学硕士民主化。
“我们的使命是为用户提供知识和工具,以控制他们的财务未来,”Finblox首席执行官Peter Hoang说。“我们致力于让每个人都能获得金融知识和包容性。凭借其用户友好的界面和个性化的推荐,FinGPT代表了朝着创建更具包容性和吸引力的金融生态系统迈出的重要一步。
来自哥伦比亚大学和纽约大学(上海)的一组研究人员认为,FinGPT可以为研究人员和用户提供为金融业开发LLM所需的资源。FinGPT 的数据集来自财经新闻、社交媒体、文件、趋势和学术设置。FinGPT 采用以数据为中心的方法,并采用全栈框架。两个相关的代码在 GitHub 上可找到。