您好,欢迎来到华百科平台
梁文锋
本词条由 钟大叔 编辑发布

梁文锋,男,1985年出生于广东省湛江市,量化私募幻方量化创始人、国产大模型企业深度求索(DeepSeek)创始人,本科、研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位。

词条类别

企业人物

出生日期

1985年

出生地

广东省湛江市

毕业院校

浙江大学

专业

信息与电子工程学

从事领域

人工智能、金融量化交易

学位

硕士

身份

量化私募幻方量化创始人、国产大模型企业深度求索(DeepSeek)创始人

目录

     简介

    梁文锋,男,1985年出生于广东省湛江市,量化私募幻方量化创始人、国产大模型企业深度求索(DeepSeek)创始人,本科、研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位。
    梁文锋梁文锋

    2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2015年,幻方量化正式成立。2019年,其资金管理规模就突破百亿元。次年,幻方投资的AI超级计算机“萤火一号”正式投入运作。2021年,幻方投入十亿建设“萤火二号”,同年,幻方量化的资产管理规模突破千亿大关。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。2024年5月,DeepSeek发布了DeepSeekV2,其因创新的模型架构和性价比而引发热议出圈。同年12月26日,DeepSeek宣布上线并同步开源DeepSeek-V3模型,并公布了长达53页的训练和技术细节。2025年1月20日, DeepSeek正式发布DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。同日,梁文锋参加总理座谈会并发言。

    人物经历

    教育经历

    1985年,梁文锋是广东省湛江市吴川市覃巴镇米历岭村人,其父母都是小学语文老师。他小学就读于吴川梅菉小学,小学六年级时通过考试被吴川一中录用,在吴川一中完成了初中、高中学业。
    2002年,梁文锋考入浙江大学电子信息工程专业,后在浙大继续深造,于2010年获得信息与通信工程硕士学位,论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。在校期间,他对金融市场产生了浓厚的兴趣。特别在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了基础。

    工作经历

    2013年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015年,创立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。在2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。
    2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,幻方量化几乎所有的量化策略都采用AI模型计算。2018年,幻方正式确立了以AI为核心的发展战略。随着业务的快速扩展,算力瓶颈逐渐显现。2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。同年8月30日,梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,引发金融从业人士热议。次年,幻方累计投资超亿元、占地面积相当于一个篮球场的AI超级计算机“萤火一号”正式投入运作。2021年后,梁文锋团队研发“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。同年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。
    2023年5月,梁文锋宣布做通用人工智能(AGI),7月,他正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究和开发。2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,并宣布DeepSeek-V2的推理成本被降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。随后国内排名靠前的大模型先后跟进降低成本,DeepSeek因此被称为“AI界的拼多多”。同年12月26日,DeepSeek宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。模型测算数据显示,DeepSeek-V3虽然文字生成类任务较弱,但其代码、逻辑推理和数学推理能力均名列前茅。在DeepSeek研究团队同步公开的技术论文中,一个细节引发广泛关注:DeepSeek-V3整个训练过程仅用了不到280万个GPU小时,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元(约4000万元人民币),这一成本几乎是GPT-4o训练成本的二十分之一。
    2025年1月20日晚,DeepSeek正式发布DeepSeek-R1,该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。此外,DeepSeek同步开源模型权重,并表示将DeepSeek-R1训练技术全部公开,以期促进技术社区的充分交流与创新协作。2月18日,深度求索(DeepSeek)发表了一篇关于NSA(Natively Sparse Attention,原生稀疏注意力)的论文,梁文锋在署名之列,该论文于2月16日提交到预印本平台arxiv。

    个人生活

    梁文锋从小成绩优异,一直是学校里的“尖子生”,并在数学学科表现出极大天赋。梁文锋的高中同学兼好友陈先生表示,读书的时候,梁文锋就经常做课题实验,学习刻苦,也热爱足球。

    社会活动

    2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。梁文锋参加此次座谈会并进行了发言。在座谈会上,李强总理提到,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。”
    2025年2月17日上午,中共中央总书记、国家主席、中央军委主席习近平在京出席民营企业座谈会。在听取民营企业负责人代表发言后,习近平发表了重要讲话。梁文锋参与了此次会议。

    相关事件

    DeepSeek的主要挑战

    梁文锋曾表示DeepSeek在迈向“国产大模型之光”的路途上,主要挑战是“高端芯片的获取问题”,可能还有量化私募在国内所受的毁远大于誉的境况。

    回应DeepSeek“爆火”

    2025年1月20日,DeepSeek最新发布的R1模型不仅在性能上比肩甚至超越了OpenAI的 o1,并完全开源,且以极低的成本实现了这一突破。随着DeepSeek全球“爆火”,梁文锋表示,中国AI不可能永远处在跟随的位置,“我们经常说中国 AI 和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”

    个人财富暴涨

    2025年2月11日,彭博社发文表示,7位创业公司创始人和人工智能专家对DeepSeek的估值存在巨大分歧,估值区间在10亿美元到1550亿美元之间。按照彭博亿万富翁指数中间值估算,DeepSeek估值约在20亿至300亿美元,而持有公司84%股份的梁文锋,身家可能在16.8亿到252亿美元之间,有望跻身亚洲最富有的科技大亨之列,甚至问鼎中国首富。不同业内人士给出的估值差异极大。波士顿风险投资公司Glasswing Ventures创始人鲁迪纳・塞塞里认为,按同行公司估值,DeepSeek 最少值10亿美元;研究工程师Sebastian Raschka则觉得,凭借强大的品牌认知度,其估值应在20亿到100亿美元之间,高于 Mistral AI。而Sweat Free Telecom创始人查纳基亚・拉姆德夫的预测更为乐观,认为DeepSeek估值可达1550亿美元。

    梁文锋署名论文引关注

    2025年2月18日,在大洋彼岸的马斯克展出最新大模型Grok 3的当天,国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并在2月16日提交到预印本平台arxiv。此次论文作者中,梁文锋在作者排名中位列倒数第二。而第一作者是袁景阳。
    粤ICP备2021137309号 Copyright © 2023 华百科

    如您发现词条内容涉嫌侵权,请通过邮箱szmisz@foxmail.com与我们联系,我们将按照相关法律规定及时处理。

    本站所有文本、信息、视频文件等,仅代表本站一家观点或作者本人观点,请网友谨慎参考使用,对任何由于使用本站内容而引起的诉讼、纠纷,本站不承担任何责任。