DeepSeek对证券行业的影响有多大?
关于DeepSeek背后的技术逻辑、方案模型以及产品优缺点的介绍,市场上已有大量的文章展开阐述,我们用一句话概述,DeepSeek是由杭州深度求索公司推出的高性能、低成本和多品类开源大模型,其最新版本在性能上已接近或者媲美全球领先大模型水平。
追溯2022年底,彼时以百度为代表的文心一言,因代表“国产新势力”GPT受到追捧,当时也有十余家券商宣布接入,跟目前的Deepseek与证券公司合作有一种“似曾相识”的感觉。
目前市面上GPT类产品层出不穷,上百款的应用模型也有多年的积累和推广时间,我们在23年初写过一篇结合证券行业的思考文章,《ChatGPT能否改变证券行业?》,在彼时环境中,我们给出了长路漫漫Or未来可期的双路径结论。但这次,我们认为,证券公司搭上DeepSeek为代表的国内高性能、以中文语言为代表的高质量大模型,会成为一个影响证券行业长久的标志性事件,或者是证券行业全面金融大模型AI时代的开端。
一、DeepSeek成功原因:并不是最聪明的私募量化团队会更了解一切
一般认为,DeepSeek大模型凭借“模型技术安全自主可控、金融应用场景深度契合、成本效率优势显著”的优势,在证券行业在金融智能领域的应用提供了广阔空间。但为什么是DeepSeek大模型,而不是月之暗面或者豆包其他国内大厂的模型?
1.量化投资跨界到AI和AIG有基因
当其他互联网大厂的AI都在找场景中,私募量化幻方旗下的DeepSeek因为有自主开发的深度学习平台“萤火”作为算力场景使用以及“量化投资”的主战场,显得更为淡定。因此,无需全市场找市场和客户去做应用场景的使用,只要大模型服务好“金融”主业,就是最大的场景。此外,幻方在2019年搭建“萤火”场景时候,就购买了1000多张GPU,在后续“萤火”平台升级的时候,GPU数量高达10000多张。
正是DeepSeek有“量化投资”的主战场以及“萤火”的算力场景硬件的支持,幻方在场景+算力两个领域已经是GPT的主要选手,更是了解金融的GPT供应商。
2. AI界的拼多多服务金融降本增效
国内AI大模型的大降价,其“始作俑者”就是DeepSeek。2024年5月,DeepSeek推出第二代MoE模型DeepSeek-V2,输入/输出定价分别为每百万tokens 1元和2元,仅为GPT-4-Turbo价格的近1%,打破原来国内原来近20元每百万tokens的高价,打响了AI降级浪潮的第一枪,当然,其背后的逻辑就是DeepSeek没有选择复刻欧美技术的“复制升级”,而是逆向选择“改变基础算法”,采用了 Multi-Head Latent Attention (MLA,一种新的多头潜在注意力机制) 和DeepSeek MOE(混合专家)架构,把计算量降度进行优化,把训练成本降低到极致。2025年初发布的DeepSeek-V3和R1模型延续了低价策略,对于之前券商和大模型大厂高达百万级的定制收费,DeepSeek相对低廉和本地化部署的大模型迎合了国内降本增效的金融大趋势。
3. 并不是最聪明的私募量化团队
与大厂“讲究”学历和“海外”背景不同,DeepSeek没有海龟,也没有奇才。创始人梁文锋坦言,团队“都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人”。
DeepSeek的成功需要金融机构深入思考和反思的一个问题是,并不是最聪明的私募量化团队如何实现逆袭成功?梁文锋的多次采访给了答案,顺人性,别逆人性管理。DeepSeek的人才例证就是一个,当金融机构对学历和文凭趋之若骛,从“内卷”走向“创新”的结果就是,尊重和企业家树立的文化。正如梁文锋所述,创新往往都是自己产生的,不是刻意安排的,更不是教出来的。
二、券商躬耕入局:本地化的DeepSeek模型对内地券商更具有吸引力
截至2月13日,根据统计,全市场已经有超20家券商开展了对DeepSeek模型的部署工作。
先说结论:DeepSeek作为本地部署的大模型,对合规要求高的内地券商而言,更具有吸引力
1.安全合规的本地化部署及适配性是第一要务
对于国内的证券公司而言,金融数据本地化留存、信息技术安全、系统和交互的安全是做金融人工智能的第一要务。
根据大模型、数据安全相关的法律法规如《生成式人工智能服务管理暂行办法》《互联网信息服务深度合成管理规定》《金融数据安全数据安全分级指南》等选择符合要求的企业和模型,以及根据证券公司《证券基金经营机构信息技术管理办法》
其次,DeepSeek的本地化部署以及本土化的适配性,与之前的云端接入或者定制化服务而言,降低了券商对外部技术供应商的依赖,业务边界的安全性和自主选择的可控性都在券商手中。
2.先卡位、再展业是证券公司布局入场的主旋律
就国内证券公司而言,数字化转型浪潮是大家的必选题。先卡位,先入局,是证券公司的第一步,从我们梳理的证券公司而言,大券商金融科技迭代能力强,有实力也有技术盈余,因此卡位意识十分突出,截至2月13日,大部分券商都是上市券商以及大中券商开展布局DeepSeek模型。中小券商可能出于各种理由,先观望,测算成本以及场景更多丰富后再入场,这也是大部分中小券商可预见的方式。
其次,展业步骤也是相对有序。根据已经披露接入DeepSeek的证券公司公告而言,目前,DeepSeek已经成为公司多个核心业务领域的利器,聚焦在:客服服务、客户画像、赋能信息检索、文档处理、行业研究、市场研判、辅助软件研发、辅助制定营销方案、合规问答、业务办理指引等多个业务场景。一般而言,我们认为DeepSeek模型,证券公司共性的尝试方向大概是:
在客户层面:先对内(员工)、再对外(客户);
在业务层面:先试点(部分)、再推广(全面);
在服务层面:先投教(个人)、再投研(机构);
在场景层面:先网点(业务)、再总部(职能);
在应用层面:先语义(静态)、再视频(动态)。
三、AI大模型焦虑:从业人员与证券公司又喜又怕
AI大模型的快速发展正在重塑金融行业,尤其是证券领域。从业人员和机构在享受技术红利的同时,也面临多重挑战,形成了“喜忧交织”的复杂局面
1.从业人员:既要卷,又怕AI抢饭碗
技术迭代更新也成为一些人制造“认知断层”的一个新故事。未来,AI+客服、AI+经纪、AI+投研、AI+投顾、AI+合规、AI+文档、AI+一切,技术飞速更迭下人们“怕掉队”,内卷成为从业人员的常态,但是AI技术带来了效率革命(喜),无论在客户服务、投研效率提升,还是在风险管理,流程管理,都带来了巨大升级。
但同时,AI的成熟应用,对初级程序员、投顾人员、投研人员等职业带来了巨大的冲击,职业重构压力成为大家的新话题,被替代成为焦虑时代的共同话语。一些传统的标准化的数据处理、基础报告撰写等投研、投顾和客服岗位需求下降,高盛研究显示未来5年券商基础分析师需求可能缩减40%。此外,掌握金融工程、模型微调等新技能成为必备选项,某头部券商2023年内部调研显示仅15%员工自评"具备AI协作能力"
2.证券公司:既要用AI,也要反对全AI替代
面对AI大潮,AI竞赛成为新的赛道,头部券商势必通过技术储备、资金储备碾压中小券商,因此,跟进AI浪潮既是主动选择,也是时代要求。另一方面,部分业务不能通过AI的替代,就如同大学的期末考试不能通过AI实现,因为部分业务,需要有人性和温度实现,有需要差异化的专业去实现。
同时,证券公司也可以用部分手段防止AI的过度滥用:如使用反AI技术(如检查错别字、标的符号)、用AI投喂查询AI纯度等。AI在证券公司的业务层,除了沙盒监管外,其实也需要进行隔离墙管理。
证券行业正经历从"人力密集型"向"智力+算力”的范式转移,面对这一轮的AI大模型时代,监管也会根据全面的时代特征开展新的“游戏规则”,如AI大模型在证券行业的应用中,数据安全和隐私保护问题需要从技术、管理和法规等多个层面综合解决。但我们有理由相信,DeepSeek的发展当前仍处于初级阶段,虽然人工智能可以在特定领域展现出超越人类的能力,但无法完全替代人类独特的思维和人类独有能力,证券公司作为链接投资者和资本市场的桥梁,具有不可替代的多重因素,正如我问DeepSeek的一个问题,我们会被AI代替吗?它的回答:"AI不是替代人类,而是解放我们去做更富创造性的价值判断。”
本文作者为知名券商研究创新部战略总监
责任编辑:liuyj