以人工智能赋能金融研究——释放AIGC的力量

以人工智能赋能金融研究——释放AIGC的力量

Frank Ling

Senior Customer Learning Manager - APM, Quant, Data & Feeds

Jayden Zhang

Solutions Consultant - Investment Solutions

前言

2022年11月30日,OpenAI推出ChatGPT,开启了AIGC时代。ChatGPT从GPT-1到GPT-4o不断提升语言理解和生成能力。这不仅是计算机科学的突破,更是一场生产力智能化的变革。数据在这之中尤为重要,在金融行业,数据的价值正被重新挖掘。

 

本次研讨会邀请了LSEG的数据科学家Jayden Zhang分享AIGC在金融投研领域中的应用,探讨未来发展趋势。

正文

很高兴参加这个分享会。我所在团队的职责是为客户提供定制化方案,提高金融信息和数据处理效率。

大语言模型(LLM)在金融业的应用主要分RAG(检索增强)和Fine-tuning(微调)。我们的方案侧重于RAG,核心是提升数据检索效率,保护客户数据隐私,辅助日常决策。

工作流程一:投研助手


我们开发了一个投研助手,帮助从事行业研究或交易的人。他们通常需要查看大量新闻和报告以把握资产价格变化背后的原因,这非常耗时。

我们的方案旨在提高数据检索效率。利用大模型和友好用户界面,只需输入问题,它就会生成答案,还会展示使用的原始信源。

方案有四大优势:

第一,高质量数据保证。我们有路透新闻、公司电话会议记录、研究报告和公司公告等。

第二,输出结果可验证。结果附带信息源,方便核查,也免去查找大量内容的麻烦。

第三,支持多语言和多资产类别。以提问语言回答,数据检索跨地区,提供更全面的信息。

第四,提供云服务和本地部署两种形式。

工作流程二:投资分析与投顾

我们开发了结合量化因子和文本数据的解决方案,帮助投资顾问筛选标的,并生成解释。可以持续监控,并自动显示新交易想法,以及风险提示。

我们能基于市场情绪分析进行选股并回测。 数据显示高情绪股票回报更高,证明情绪因子有效。还有Starmine因子和基本面因子,在不同市场中也表现出色。 我们根据客户关注的资产定制化流程。

工作流程三:风险监测

风险监测分两种情况:一种是通过晨报查看隔夜持仓的相关重要信息。另一种是在日内交易时及时提示重要价格变化和可能的驱动信息。

价格异动的资产分为事前预测和事后预测。事前预测基于经验识别重要信息,如兼并收购,并及时提醒。事后预测在价格变化时,找到可解释原因的信息。

这个方案还可与投研助手结合。用户既能监控市场,又能调查研究。

工作流程四:文本标签

这个任务是标记实体,包括公司和人物等重要信息。

传统上可以训练私有化机器学习模型来完成,但有了大模型后,门槛降低了很多。我们可以把文本交给大模型进行定制、挖掘。无需像用NLP模型那样预先训练。即使语料不够,大模型识别效果也很不错。

我们的优势是优质数据和定制化,在提供结果的同时列出关键信息来源。

工作流程五:一目投研

交易员需要筛选出当天的重要潜在交易标的。我们可以将文本数据处理成机器可读形式,再由大模型分析汇总,帮助用户快速“一目了然”目标资产的最新研究报告和市场观点,从而做出决策。

尽管传统技术可解析PDF文本,但可能遗漏信息。而我们的机器可读新闻和研报API经过专利模型处理文本,确保信息准确,达到处理数字数据的精度。

总结

在以上的5个案例中,我们非常依赖LSEG的一些非结构化优质数据产品。

例如,机器可读新闻(MRN)帮助我们用大模型或传统模型分析。新闻源由路透社提供独家支持。路透机读历史新闻可追溯到1996年,每年增长约1100万篇,支持多种语言。

另外,我们有覆盖广泛券商和资产类别的机器可读研究报告,包括公司、固收、货币、大宗商品、行业、宏观、ESG、量化、衍生品等主题。

我们还有情绪因子产品,与Marketpsych独家合作,提供对全球多类资产的独一无二的情绪分析。三季度我们将推出基于Transcript文本的情绪分析功能。

期待大模型时代AIGC为金融投研带来的更多变化,特别是对非结构化文本数据的价值挖掘。

我们第三季度再见,谢谢。