今年杭州最火独角兽
声明:本文来自于微信公众号 投资界 作者:投资界,授权站长之家转载发布。
大年初一,广东湛江吴川米历岭村,迎来一波又一波打卡人群。
这是爆红全球DeepSeek的创始人梁文锋老家。早年间成长于广东,后来考入浙江大学。硕士毕业后,梁文锋与几位浙大同学开始创业之路。2023年,他带领团队成立DeepSeek,如今席卷全球科技圈。
DeepSeek被视为拉开中国科技爆炸的序幕,成为今年第一个现象级中国企业。甚至有投资人透露,“找他们的人踏破门槛了”。
当DeepSeek在海外大杀四方,央视春晚会上,一群人形机器人登上舞台扭秧歌,背后的宇树科技正是中国具身智能标志性独角兽。追溯下来,他们都来自杭州。
湛江85后
缔造新年最火独角兽
梁文锋,1985年出生于广东湛江吴川,父母都是小学语文老师,这也使得他从小就成绩优异。“湛江发布”提及他一段成长往事:梁文锋性格很文静,但不是书呆子,在学习上很有自己的“一套方法”,初中时就学完了高中数学,甚至开始学大学数学。
2002年,梁文锋以吴川一中“高考状元”的成绩考上浙江大学,本科就读电子信息工程专业,之后又继续攻读浙江大学信息与通信工程专业研究生。大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。
2015年,梁文锋硕士毕业后和几位浙大同学共同创立了量化对冲基金公司幻方量化,并于当年拿到第一张私募牌照,几年时间管理规模迅速超百亿。
有意思的是,2016年幻方量化便首次上线AI策略,并在之后实现投资策略全面AI化,同时也是国内唯一公开宣称拥有万张英伟达A100显卡的企业。大学时期梁文锋便坚信“AI一定会改变世界”,这些都为后来投身AI埋下伏笔。
转折点是2023年,全球AI大模型风起云涌,国内大佬纷纷宣布AI创业,梁文锋也是其中一员。那年4月,梁文锋宣布正式进军通用人工智能领域,“追寻一直以来的技术理想,超越投资去直面更大的课题”。很快,DeepSeek在杭州应运而生——同年11月,DeepSeek 发布了开源的代码大模型。
成立至今,DeepSeek并未开放过外部融资,因此也并未引起创投圈的过多关注。直至2024年5月,DeepSeek发布DeepSeek-V2开源MoE模型,因极度降低推理成本,意外掀起一场大模型“价格战”,开始出圈。
隐秘低调,却聚集了一群AI天才。据悉,DeepSeek包括创始人梁文锋在内,仅有130多名工程师和研究人员。不同于其他明星创业公司,DeepSeek鲜有海归,团队成员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,不少还是在读博士。去年底,雷军开出千万年薪挖角DeepSeek研究员罗福莉。
这一次,DeepSeek正式浮出水面。上个月,梁文锋和团队开发的大模型DeepSeek-V3正式发布。起初在AI发烧友圈内流传,由于表现出色,一时轰动硅谷。1月20日,DeepSeek正式发布DeepSeek R1,开始席卷全球。
一夜掀翻美国科技股
高潮发生在春节前夕。
DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越ChatGPT。这也是首次中国应用能同期在中国和美区苹果App Store占据第一位。
那么,DeepSeek为何这么火?
简单来看,DeepSeek R1在数学、代码、自然语言推理等任务上的性能,可以比肩OpenAI o1模型正式版。
而DeepSeek R1被讨论的焦点,主要集中在低训练与使用成本以及开源两方面。区别于OpenAI“海量数据投喂”的方式,DeepSeek利用算法把数据进行总结分类,经过选择性处理之后输送给大模型,在提高训练效率的同时,也降低了DeepSeek的成本。
据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800GPU集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。以极低成本挑战了大厂们依赖巨额资本投资的模式。
“这可能是个国运级别的科技成果”,《黑神话:悟空》制作人冯骥激动评价,“这样震撼的突破,来自一个纯粹的中国公司。”
值得一提的是,美国总统特朗普上任第二天曾宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”(Stargate)的新公司,计划未来四年在美国投资5000亿美元,用于建设超大规模数据中心。
DeepSeek现象级崛起,无疑为“星际之门”泼了盆冷水。有分析指出,“如果DeepSeek能够通过较小的数据中心生存下来,那么大型科技公司可能在AI计划的电力上花费过多。”
美国科技股被一夜“掀翻”。1月27日美股收盘,英伟达股价下跌近17%,市值单日蒸发近6000亿美元,创下美国上市公司单日损失纪录。此外,不少美股主要科技公司股价也出现不同程度下跌。
目之所及,掀起一场更为激烈的AI竞赛。为了应对压力,OpenAI CEO奥特曼不仅发布首个智能体Operator抢热度,还对外剧透起即将上线的o3-mini。而DeepSeek在除夕当天再次祭出“重磅炸弹”——发布开源多模态模型Janus-Pro,进军文生图领域。
面对突然爆火,DeepSeek反而冷静许多,梁文锋在除夕夜谦逊回应,“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”他还分享了更多细节——“那个能在手机上跑的mini模型,灵感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十天凌晨三点提交错误日志喂出来的。”每一项突破背后,都凝结着更为动人的故事。
现在,DeepSeek还在招兵买马,在招聘平台上,DeepSeek正有超过50个岗位在招人,其中“深度学习研究员-AGI”一职月薪最高甚至达到11万元,年薪百万。正如梁文锋所说,“中国 AI 不可能永远处在跟随的位置”,这一幕正在被一群中国年轻人实现。
杭州,悄悄崛起“六小龙”
“这个春节,杭州赢麻了。”
DeepSeek总部位于杭州,此时同样爆火的还有来自杭州的宇树科技。2025年央视春晚舞台上,宇树科技旗下机器人H1惊艳亮相。十几个人形机器人身穿东北特色花棉袄,手持红手帕登上舞台,与舞蹈演员们默契配合,上演了一场创意融合舞蹈《秧Bot》。
一级市场对宇树科技并不陌生。2016年,浙江90后王兴兴在杭州成立宇树科技,开始融资之路——其中记忆犹新的是2024年春节前夕,宇树科技一举完成了近10亿元的B2轮融资,投资方包括美团、金石投资、源码资本,及老股东深创投、中网投、容亿、敦鸿和米达钧石。
前不久,宇树科技发布了一段最新机器狗产品B2-W的演示视频,视频中B2-W机器狗展现了一系列高难度动作,翻山、涉水、跳高和负重载人都不在话下,还引来马斯克转发评论,火爆海外。
回首2024年,杭州还诞生了火爆全球的游戏大作——《黑神话:悟空》。时间回到2018年,游戏科学组建了一个专注于单机游戏的团队,负责开发一款名为《黑神话:悟空》的高品质单机游戏,并在第二年将团队搬到了杭州。
冯骥曾回忆,“就是喜欢这座城市的氛围,杭州的人才环境非常适合做游戏的艺术设计,因为这里有中国美院,而且整座城市的动漫氛围和人才基础非常好。”
不止于此。2018年,一个来自杭州的考察团在美国波士顿找到强脑科技创始团队。虽然他们制作的模型还很粗糙,就连办公地点都设在地下室,但凭借对未来产业的前瞻布局,杭州还是毫不犹豫将强脑科技招引落地,并为公司提供了总部落户所需的研发和产业化空间。
如今,强脑科技与马斯克的Neuralink成为全球唯二融资超过2亿美元的脑机接口公司,并实现了全球首个便携式高精度脑机接口产品10万台量产。
还有浙大副教授朱秋国创办的云深处科技,旗下机器人“绝影X30”已在新加坡电力隧道进行巡检,是中国机器人走进海外电力系统的“第一单”;以及因开发出市场占有率高达70%的家居设计软件“酷家乐”闻名于世的群核科技。
而它们,被并称为“杭州六小龙”,在海外爆红,成为杭州科技产业的一张张名片。
星星之火,正令杭州科技形成燎原之势。正如梁文锋写道,“或许在不远的未来,当宇树的机器人踩着云深处的步态算法走来,搭载着强脑的神经接口,运行着DeepSeek的认知引擎,用群核构建的虚拟世界作为训练场——那个我们幻想中的具身智能,就会从西溪湿地的晨雾里跌跌撞撞地走向人间。”
在1月中旬召开的浙江两会期间,杭州市委副书记、市长姚高员接受中央广播电视总台专访时,专门回应“杭州六小龙”在国际上出圈走红的现象:
“不管叫‘几小龙’,杭州将坚定不移推进创新活力之城建设,在2025年重点打造‘三个地’:具有全球影响力的创新策源地、全国科技成果转移转化的首选地、发展新质生产力的重要阵地。”他表示,“财力再紧张,也不能去压减科技投入,让创新始终成为杭州的城市气质。”
眼下,中国科技创业者们正在技术洪流中重新定义这一古老文明。借用梁文锋在除夕夜写下的话,“DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持”。