《科创板日报》12月31日讯(记者 杨小小 李明明)DeepSeek已无法再低调。就在DeepSeek在X平台被海外AI技术大牛发帖背书后,小米的一则挖角消息迅速在中文互联网刷屏。
据悉,为发力大模型,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。
公开资料显示,罗福莉硕士毕业于北京大学计算语言学研究所。此后她加入了阿里达摩院机器智能实验室,期间主导开发了多语言预训练模型VECO以及AliceMind的开源工作。2022年,罗福莉从阿里离开,进入DeepSeek担任深度学习研究员,参与了MoE大模型DeepSeek-V2的开发。
而早在2019年,罗福莉就已经在社交网络小范围“出圈”。彼时还在读研的她,在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉本人在知乎进行了回应。“95后AI天才少女”开始成为罗福莉的标签。
可以看到,“90后AI天才”,已经逐渐成为这轮AI 2.0发展的中坚力量。
估值超70亿元的人形机器人独角兽智元机器人,其创始人之一、“华为天才少年”彭志辉,为1993年生人。AI药物研发企业深势科技,其创始人兼CEO孙伟杰与创始人兼首席科学家张林峰,均为北大培元学院的90后毕业生。一度被业内认为国内最有希望在大模型赛道实现弯道超车的3D大模型领域,明星企业之一Vast ,其创始人宋亚宸,是一名创业前就已经有商汤和MiniMax工作经历的“97后”。
“天才”的“逆袭”
雷军、DeepSeek以及“95后AI天才少女”等多个近期热点的叠加,让罗福莉加入小米AI实验室的消息迅速传遍了中文互联网。
《科创板日报》记者联系了小米方面,以对网传的罗福莉入职消息进行确认,但截至发稿并未获回复。
有关自己的成长经历,罗福莉在个人公众号上曾做过分享。和“天才”的标签有所不同,罗福莉坦言,自己刚考入北师大时,有些“迷惘不知所向,期末排名也是靠后”;大二才振作起来专注于学习,成绩终于爬到了前几;大三为保研到更好的学校,“‘随大流’开启学术生涯,但却收到‘你没有天赋’做科研的打击”;大四开始掉头逃离学术,“曾一度考虑转行做产品”。
转折点出现在保研北大后。罗福莉自述,研一开始“正面硬刚学术”,陆续投出了人生第一二篇文章;研二迎来“黎明前的黑暗”,潜心学术研究,终于在这一年收获了8篇顶会文章,收获“天才AI美少女”标签,开始小范围“出圈”。
研究生毕业后,罗福莉并未选择继续学术深造,而是参加校招进入产业界。她表示,自己基本拿下了国内各个大厂最Top的硕士offer,包括阿里星、腾讯技术大咖、百度AIDU计划等。最终她选择加入阿里达摩院做人工智能研究,具体做预训练语言模型相关的研究。
在个人公众号,罗福莉还分享过如何offer大满贯的经验;对于最终选择进入哪家大厂,她也给出了筛选建议。
她称,国内大部分AI部门或者研究部门都不能做到所谓“业务”和“研究”的一个权衡,其中绝大部分情况下只能兼顾其中一个,或者只能做业务(大概率是非核心业务),或者是跟高校差距不大的研究。所以这时候,筛选出那些真正可以做到把“研究”和“业务”均衡的AI部门和团队就非常关键。
罗福莉的公众号更新记录停留在2021年11月。在不久后的2022年,她从阿里离开,加入了幻方量化。
幻方量化是一家私募,但有别于一般的私募投资机构,幻方的投资决策依托的是数学与人工智能。在储备算力方面,幻方甚至走得比国内大厂更早。根据幻方官网,2019年,幻方 AI(幻方人工智能基础研究有限公司)注册成立,致力于 AI 的算法与基础应用研究。AI 软硬件研发团队自研幻方「萤火一号」AI 集群,搭载了 500 块显卡。到2021年,幻方已经储备了1万张卡。
DeepSeek的出现,还是2023年5月的事情。根据公开资料,这是幻方下场做大模型而成立的独立新组织,专注于做真正人类级别的人工智能。以罗福莉在择业中重视的“业务”和”研究”维度来看,DeepSeek以及其所脱胎于的幻方,更侧重的,是研究。
幻方创始人梁文锋在2023年5月接受媒体采访时明确表示,“我们的目标很明确,就是不做垂类和应用,而是做研究,做探索。”
《科创板日报》记者注意到,罗福莉的谷歌学术页面显示,其论文被引次数在2023年以后显著增加,2024年其论文被引次数更是超过了1000次。目前,罗福莉被引次数最高的一篇论文,就与DeepSeek相关。
这篇论文题为《DeepSeek-Coder:当大型语言模型遇上编程——代码智能的崛起》,摘要称,大型语言模型的快速发展革新了软件开发中的代码智能。然而,封闭源码模型的主导地位限制了广泛的研究和开发。为了解决这一问题,团队推出了 DeepSeek-Coder 系列,这是一组开源的代码模型,规模从 13 亿到 330 亿不等,基于 2 万亿标记从零开始训练。团队广泛评估表明,DeepSeek-Coder不仅在多个基准测试中实现了开源代码模型的最先进性能,还超越了现有的封闭源码模型,如 Codex 和 GPT-3.5。此外,DeepSeek-Coder 模型采用宽松的许可证,允许用于研究和无限制的商业用途。
这篇论文共有包括罗福莉在内的13名作者,截至目前,该论文被引次数达396次。
今年5月,罗福莉曾在知乎发表对DeepSeek团队的评价: DeepSeek团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的。
国产AI站满“90后天才”
可以看到,被认为有希望颠覆未来的AI 2.0,目前已经成为了“90后天才”们施展拳脚的大舞台。
最早以“天才少年”身份被看见的,是彭志辉。
彭志辉最早“出圈”也是因为他在社交网络的KOL形象,他在B站上的账号“稚晖君”,主要发布硬核DIY视频,目前已收获超百万粉丝。而他在创业前,更广为认知的另一个身份是“华为天才少年”。2020年,彭志辉从OPPO研究院AI实验室离开,加入“华为天才少年计划”,从事昇腾AI芯片和AI算法相关研究工作。2022年12月27日,彭志辉在微博发文称已离开华为。随后,在2023年2月,其作为创始人之一的智元机器人成立。
智元机器人致力于打造具身智能机器人产品及应用生态,目前,公司已正式开启通用机器人量产。
人形机器人被认为是AI落地物理世界的最佳载体,当前发展迅猛,吸引了各路技术大咖躬身入局。业内备受关注的另一头部企业宇树科技,其创始人王兴兴也是一名90后。
履历显示,出生于1990年的王兴兴,本科毕业于浙江理工大学。从学历背景,王兴兴并不算典型的学霸,而据媒体报道,其初高中成绩并不理想,偏科尤其严重,理科很好,英语很差。不过,和彭志辉相似,王兴兴也擅长发明创造。读研期间,其还曾申请延毕,只为专注设计机器狗“XDog”。业内认为,宇树科技是目前较为成熟的一家具身智能企业。其于近期更新的Unitree B2-W工业级四足机械狗视频,引爆了二级市场,包括长盛轴承、景兴纸业等多只个股一度涨停。
AI落地带来的广阔机遇,还在不断吸引“90后天才”们施展天赋和努力。
专注于AI在医疗领域应用的深势科技。在这轮清华系跑出了更多创业团队的AI 2.0竞逐中,深势科技则是由两位来自于北大的创始人成立。公开资料显示,两名创始人孙伟杰与张林峰均毕业于北京大学元培学院。本科毕业后,孙伟杰留在北大继续深造教育经济与管理学,此后作为天使投资人活跃在科技、教育、企业服务等领域。而张林峰则前往美国普林斯顿大学攻读博士,研究统计物理、分子模拟和机器学习,并在多个领域的工业应用深耕。
公开资料显示,目前,深势科技推出了Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台等微尺度工业设计基础设施,革新了现有的药物、材料领域研发模式。
而曾被业内认为是国内最有望在大模型领域实现弯道超车的3D大模型领域,跑出的标杆企业之一Vast,其创始人宋亚宸,是一名“97后”。媒体报道显示,宋亚宸本科就读于约翰霍普金斯大学,还没毕业他就加入了商汤,进入AI游戏事业部,也是在这里他开始接触3D领域。2021年,商汤AI游戏事业部的兼任负责人闫俊杰离职创业MiniMax,宋亚宸也随之加入MiniMax。
紧接着在2022年底,宋亚宸就创办了3D大模型公司Vast。
此前有头部机构的AI领域投资人对《科创板日报》记者表示,多模态中的3D生成有较大可能在国内出机会。“3D AI现在国内技术不落后海外,也不是特别吃算力。在这个阶段算国内比较值得关注的细分领域。”
在业务方面,据宋亚宸在一场公开演讲中介绍,Vast的3D大模型Tripo,输入一段文字或图片、视频等不同模态,就可以生成3D模型。它的表达方式是mesh,带贴图材质PBR,可以在游戏、动画、元宇宙、XR、MR,包括数字孪生、仿真模拟等行业进行使用。目前,Tripo2.0已上线,据悉其成熟度已达到类似于720p分辨率的水平。
值得一提的是,这些AI领域的“90后天才”们,都受到了资本的青睐,他们创业的公司,目前都已经收获了多轮融资,多家头部资本出手押注。比如,上述智元机器人,在成立不到两年时间里,就已经成为估值超过70亿元的独角兽,背后投资机构包括高瓴创投、BV百度风投、经纬创投、蓝驰创投、比亚迪、红杉中国、尚颀资本以及上海临港新片区基金等,股东阵容相当豪华。
宇树科技从2016年发展到今天,也已经完成9轮融资,集结了红杉中国、顺为资本、深创投以及中国互联网投资基金以及美团龙珠等系列知名资方。
2018年成立的深势科技,截至目前已完成6轮融资,吸引了来自BV百度风投、高瓴创投、经纬创投、启明创投、哈勃投资等的出手。Vast亦已完成两轮融资,春华资本、达晨财智、英诺天使基金以及达晨财智皆为背后投资人。
从资本到产业对人才的大手笔抢先押注现状来看,有关AI的比拼,无疑不止算力,而更在于人才。
网友看法
1、网友世朋:用于研究和无限制的商业用途
本财经资讯由VIP财经发布,版权来源于原作者,不代表VIP财经立场和观点,如有标注错误或侵犯利益请联系我们。