21世纪经济报道记者 陈植 上海报道
ChatGPT迅速崛起,正让私募基金看到投研能力的新提升空间。
“对量化私募基金而言,其投研能力的高低,很大程度取决于三大因素,一是数据能力,如今越来越多行业头部量化私募基金拥有数百TB的数据,二是算法能力,包括深度学习、文本挖掘等算法能力的持续升级;三是交易能力,比如通过低延迟技术研发,将交易时间从20微秒缩短至2微秒。” 宽邦科技创始人CEO梁举向记者表示。ChatGPT的兴起,恰恰给量化私募基金数据挖掘与算法升级带来新的想象空间。
以往,量化私募基金往往获取的是预先写好的结构化数据信息,但在ChatGPT可以用自然语言与私募基金量化投资建模人员沟通交流,以通俗易懂的语言解释那些结构化信息数据,一方面帮助私募基金量化投资建模人员更精准地寻找交易投资机会,另一方面能根据这些建模人员需要,将投研报告里的相关信息数据呈现出来,大幅提升投研效率。
梁举向记者透露,目前他们正在尝试将ChatGPT与量化投研能力输出工作相结合,比如使用ChatGPT辅助写代码,在某些简单的代码撰写方面,ChatGPT的工作成效甚至超过不少工程师。
“未来,我们希望能将各类投研报告放入统一的预训练模型,让私募基金直接询问,通过自然语言的交互沟通,获取他们想要的分析师观点与投研报告作者对某些调研上市公司的情绪,甚至是每天金融市场不同交易时段的市场分析报告要点等。”他指出。
在上海蒙玺投资管理有限公司总经理李骧看来,ChatGPT的兴起,也预示着AI技术在量化私募基金领域的应用日益广泛。
“今年我比较看好中证500与中证1000指数增强策略,但就超额回报获取角度而言,中证1000指数增强策略更适合擅长量价相关研究、且AI运用能力比较突出的私募机构。因为它需要更强的数据处理维度能力,以及它的预测性相对线性模型的提升能力要求更高。所以我们的量化模型要与量化因子强相关,若AI深度学习能力做得更好,超额回报获取能力会高于中证500指数增强策略。”他指出。
朝阳永续首席金融工程师陈实向记者指出,目前ChatGPT对量化私募基金投研能力提升的最直接表现,就是帮助后者更精准地把握投研报告作者对所调研上市公司的情绪。
“这也是文本挖掘技术急需提升的一个突破口。以往量化私募基金在提取投研报告要点时,往往只能看到纯粹的结构性信息数据,无法全面了解报告作者对上市公司的情绪,可能对报告所呈现的投资价值研判缺乏更敏锐的洞察。但chatGPT通过自然语言交互,有效解决这个问题。”他直言。未来基于ChatGPT的更广泛应用,第三方数据研发机构可以提供个股研报情感评分,个股专家的情感评分一致预期,行业股票的分析师情绪指数变化等,帮助量化私募基金更全面地了解市场对相关股票的投资偏好细微变化。
ChatGPT如何强化量化私募投研能力
在陈实看来,ChatGPT兴起,让不少量化私募纷纷“脑洞大开”。比如有些私募机构给ChatGPT一篇投研报告,要求它按照自己的需求,将相关报告摘要找出来;还有私募机构正打算用ChatGPT写投研报告或投资策略。
在他看来,这都得益于自然语言模型技术的蓬勃发展。
记者获悉,自然语言模型的发展,主要经历三个阶段。
第一阶段以语言统计模型为主,它的做法相对简单——即给它一句话,让它将这句话切成词,并根据上下文关系预测其中一个字的出现概率。但这个模型的两大痛点,一是文本语义识别能力不强,比如对语言统计模型而言,“你喜欢我”与“我喜欢你”是同一个意思;二是当文本内容较多时,语句统计模型的某个文字权重矩阵会出现偏差,不利于算法模型运算。
到了第二阶段词向量模型的诞生,有效解决上述两大痛点时也解决了切词后的文本信息丢失问题。但词向量模型也有某些缺陷,一是单词的向量是唯一的,无法区分某些多义词的多重含义,二是模型训练时容易出现维度“爆炸”,且训练过程是串行的,导致算力资源耗费巨大且训练时间漫长。
记者获悉,这导致前两个阶段的自然语言模型只能处理相对简单的工作,比如简单的文本解析、情绪分析与主题模型搭建,但无法处理复杂任务。而Transformer技术的兴起,彻底改变了这种状况。
究其原因,Transformer解决了自然语言模型的注意力机制问题,即通过词与词的关联性训练,它会给每个词之间设立单独的权重曲线,且通过并行训练模式大幅提升训练速度。正是Transformer技术的兴起,它将自然语言模型引入第三发展阶段——预训练语言模型,即它能通过训练,将文章主题与相关逻辑、内容资料“提取”出来,整合成新的文本提供给读者。
记者了解到,如今的预训练语言模型有两大代表技术,一是GPT,二是BERT,前者将自己生成的结果通过再训练并输入到模型,适合文本生成类工作;后者则通过上下游训练,比较合适语言理解工作,可以作为文本生成、更深层次的语义情感分析与阅读理解,信息检索与问答对话。
梁举告诉记者,若将AI模型分成两类,一是分析型AI,二是生成型AI,前者主要类似搜索引擎,提供一个分析结果与预算,后者则是生成用户所需的信息文本。
“ChatGPT属于后者,且它已经历多个发展阶段。如今ChatGPT3.5版本拥有逾1700亿参数,预计4.0版本的数据参数可能会再扩大100倍,预计未来3-5年,ChatGPT可能会自己写代码与文本,到时量化私募基金只需提一些投资策略文本需求,它就能直接写出来,包括图表与视频的生成。”他认为。
记者多方了解到,目前个别大型量化私募基金已开始尝试使用ChatGPT撰写投资策略代码,因为金融投资的文本信息需求,主要涵盖投资者与媒体的关注度;管理层、投资者与媒体的情绪;财务报告文本可读性;新闻的隐含波动率指数;投资者分歧;行业分类等六类,数据来源来自搜索指数、股吧数据、上市公司报告、上市公司电话会议等,若能将这些数据收集起来与词向量模型匹配,再通过ChatGPT按照自身要求生成更通俗易懂的自然语言文本,就能对行业相关上市公司各类信息的了解更加全面精准,从而促进投资策略的迭代升级与精准投资决策。
陈实告诉记者,目前量化私募基金提升数据与算法能力的迫切需求,主要表现在两方面,一是从分析师报告提取分析师的情绪,再做预测。二是对分析师报告股价同比性做研究,甚至建立分析师文本因子以预测未来个股投资的超额收益率。但这都需要 ChatGPT的自然语言交互功能,以便私募基金更好地理解分析师在报告里的“情绪”与对上市公司投资价值的“预判”。
在李骧看来,包括chatGPT等AI能力的持续发展,对量化私募基金提前洞察投资风险也有着较大的促进作用。比如随着量化私募行业规模增长,高频策略的集中度日益提高,令机构获取高频策略超额回报的难度增加,驱动高频策略私募纷纷拓展中低频策略,但这需要私募机构需不断优化风控能力,包括设定其他人尚未发现的风险点并进行求解。各类AI能力的持续发展,将有助量化私募基金风控能力的不断优化。
产品路演与投资者交互的新应用
记者获悉,随着 ChatGPT兴起,越来越多私募基金开始尝试用它做更多工作。
梁举向记者透露,在ChatGPT刚面世时,他们将它应用在私募策略能力开发环境里,一是私募机构可以用ChatGPT纠正他们所写的代码;二是根据私募基金投资者对产品的询问,ChatGPT可以自动分析询问内容并生成文本,有效解决投资者与私募基金的某些投资纠纷。
一位主观策略私募基金负责人告诉记者,近期他们发现不少投资者都会询问为何去年产品净值回撤幅度较大,目前他们正在尝试通过ChatGPT生成文本解答。
“我们也不善于与投资者沟通,以往解释净值回撤的话术比较生硬,容易引发更强烈的投资者矛盾,如今ChatGPT可以用更柔和的话术向投资者解释净值回撤较大的原因,反而更能赢得他们的理解。”他直言。比如他们的某些投资策略需要2-3年才能收获理想回报,但期间可能因市场环境变化出现不小的净值回撤幅度,以往他们都是站在机构角度回复,导致语句比较生硬,让投资者感到不适,但ChatGPT更容易站在投资者立场做回复,更能赢得投资者认可。
但他表示,随着ChatGPT发展,它未必能彻底能替代基金经理与投资者的沟通,因为涉及到未来投资策略的优化,他们仍需“面对面”与投资者沟通,争取投资者同意修改基金的某些投资条款。
记者获悉,目前不少私募基金还在尝试将ChatGPT作为产品募资路演的“新工具”。以往,他们在产品募资路演期间介绍投资策略时,总是会搬出一大堆专业术语,但很多高净值投资者对此未必理解,导致彼此在投资策略与投资理念方面出现某些偏差,令私募错失不少客户。
如今,他们会将某些专业术语通过ChatGPT转化成通俗易懂的自然语言文本展现给潜在投资者,争取他们对投资策略的更精准理解,从而提升募资效率。
“未来,ChatGPT在私募领域会有多大的应用,仍是未知数。但可以预见的是,AI不会取代人,但会用AI的人会取代不会用 AI的人。”梁举直言。