如影随形

影子是一个会撒谎的精灵,它在虚空中流浪和等待被发现之间;在存在与不存在之间....

您现在的位置是:主页 > 模板分享 > 国外 >

梁文锋就是AI界的黄峥

发布时间:2025-01-30 09:03编辑:[db:作者]浏览(153)

    梁文锋率领着DeepSeek,还在持续搅动年夜模子行业。继用R1模子炸场之后,1 月 28 日清晨,大年节夜前一晚,DeepSeek 又开源了其多模态模子 Janus-Pro-7B,发布在 GenEval 跟 DPG-Bench 基准测试中击败了 DALL-E 3(来自 OpenAI)跟 Stable Diffusion。随后特朗普在集会上提到DeepSeek的呈现为美国的企业敲响了警钟,“咱们须要会合精神在竞争中得胜”。相隔一天,据外媒报道,多名美国官员称DeepSeek是“偷盗”,正对其开展国度保险考察。OpenAI也合时宣布申明称始终晓得其余公司试图蒸馏美国当先公司的模子,现在“采用反制办法维护咱们的常识产权”,并表现将跟美国当局严密配合维护开始进模子免受盗取。或者梁文锋本人都想不到,不测火出海的DeepSeek,刺痛着更多人的神经。而一年前,DeepSeek V2模子宣布时,便开端被冠上AI届拼多多的名称。反卷年夜厂的梁文锋,早已在AI范畴复制过黄峥式“青出于蓝”的故事,并在海内掀起打到骨折的年夜模子价钱战。事先,在接收36氪采访中,梁文锋表现,"咱们不是有意成为一条鲶鱼,只是不警惕成了一条鲶鱼。"假如说梁文锋的鲶鱼效应,在于证实了用低本钱也能高效力练习出AI年夜模子,有意卷到了BAT。客岁一年,黄仁勋则在制作另一种鲶鱼效应,即以每6个月为周期,更新更高机能的芯片,使得惧怕抢不到最新GPU而落伍的巨子们,疯抢英伟达GPU,微软、谷歌、Meta、马斯克,都被拽进了这场GPU年夜作战游戏里。一年后,DeepSeek成为硅谷眼中"奥秘的西方力气",被Scale AI开创人亚历山年夜·王(Alexandr Wang)评估道,“从前十年来,美国可能始终在人工智能比赛中当先于中国,但DeepSeek的AI年夜模子宣布可能会‘转变所有’。”原因是DeepSeek在年前宣布了新的开源模子DeepSeek R1,不只机能追上了OpenAI o1完全版,用550万美元的练习开支做到硅谷投入上亿美元的后果。在这场高潮前,年夜模子的主流叙事是英伟达高端CPU“一芯难求”,而现在,黄仁勋的销冠神话,迎来了梁文锋的正面打击。梁文锋所率领的DeepSeek,让美国华尔街开端从新审阅,在这场年夜模子生活战里,英伟达芯片跟高端算力的需要能否存在泡沫。如许的担心,使得英伟达在1月27日一夜蒸发近6000亿美元市值。而这所有,在梁文锋看来,只是“依照本人的步伐来办事”,而后核算本钱订价。梁文锋并非有意成为鲶鱼,但正如硅谷有名风投家Marc Andreessen的评估:“作为开源名目,这是对天下的一份深远奉送 。”他们节俭了大批的本钱,也让良多高薪的硅谷年夜佬,跟享用这个行业宏大泡沫的公司,颜面扫地。1月28日,OpenAI CEO奥特曼终于回应了DeepSeek,他夸奖DeepSeek让人印象深入,特殊在于供给模子的性价比上。随后则话锋一转,夸大OpenAI将供给更好的模子,并停息一些宣布。此前,奥特曼在X上敏捷宣布首个智能体Operator,还开端剧透起了行将上线的o3-mini。网友戏称,“DeepSeek逼出了奥特曼的新年夜招。”同时,依据外媒爆料,DeepSeek的宣布激发了Meta的紧迫加班,工程师猖狂拆解代码,员工爆出其高管的薪资竟比练习全部V3模子的本钱还高。2025年,不想当鲶鱼的梁文锋,严严实实搅动了一池春水。“年夜局部中国公司习气follow,而不是翻新。”而在采访中,对上一次DeepSeek激发年夜模子价钱战的热议,梁文锋表现,DeepSeek正以翻新奉献者的身份,参加到这场此前由美国主导的科技翻新游戏里。这位80后AI创业者,构造起一些Top高校的应届结业生、没结业的博四、博五练习生,另有一些结业才多少年的年青人,他描述团队成员们,“良多人对做研讨的盼望,远超对钱的在意。”梁文锋将DeepSeek界说为“硬核翻新”,做最难的事,仿佛成为他所率领的DeepSeek的分歧认知。在鲶鱼的表面之下,DeepSeek在梁文锋眼中,内中则全是技巧幻想主义的叙事。此前,梁文锋曾断言,“中国必定须要有人站到技巧的前沿”。而这一次,DeepSeek先踏上浪头,但无论是鲶鱼梁文锋,仍是“技巧幻想主义者”梁文锋,要答复的成绩还良多、良多。此次DeepSeek的出圈,总少不了与OpenAI的对照。更有网友调侃,“DeepSeek活成了真OpenAI(开放模子),而OpenAI活成了close AI(关闭模子)”。现实上,奥特曼跟梁文锋,都是典范的学霸型创业者。前者18岁考上斯坦福年夜学盘算机系,年夜二便停学创业;后者结业于浙江年夜学,2015年景破幻方量化,在采访中梁文锋提到,2022岁尾ChatGPT风行时,他们就开端着手应聘了。2023年7月,梁文锋建立了DeepSeek。图注:呈现在消息联播内的梁文锋图源:字母榜截图梁文锋并不讳言OpenAI对他的启示性,乃至,在不少处所都跟奥特曼展示出了惊人的类似。出卖一手开办的始创公司Loopt后,奥特曼创建了风投基金Hydrazine Capital。2015年,30岁的奥特曼成为著名孵化器YC的总裁,但在AGI(通用人工智能)不被看好,融资艰巨的2015年,认定深度进修远景无穷的奥特曼,却跟特斯拉开创人马斯克独特创建了OpenAI。梁文锋曾是币安的晚期成员,并一手开办了幻方量化,作为同样有着投资阅历的创业者,梁文锋入局的2023年,年夜厂探入,很多创业型公司废弃了只专一通用型年夜模子的慷慨向,梁文锋却动摇DeepSeek要专一基本模子的研讨跟冲破。同样,在晚期,兜里没钱的奥特曼,会将“一同构建AGI”写在应聘信息里。这个事先恐怖而悠远的目的,让OpenAI吸引到了一大量年青的AGI信奉者。“年青、有潜力”,成为奥特曼跟梁文锋独特的选人尺度。在梁文锋看来,假如寻求短期目的,找现成有教训的人是对的。但假如看久远,教训就没那么主要,基本才能、发明性、酷爱等更主要。也恰是因而,这个不著名技巧年夜牛,不在播客分享创业感悟的纯外乡创业团队,成了最快追上OpenAI的步队。乃至,在最开端,犹如建立之初以非营利为目标的OpenAI,贸易化也并未写入DeepSeek的to do list。在这点上,奥特曼与梁文锋同样有着分歧的主意。“OpenAI晚期投资人投钱时,想的必定不是我要拿回几多报答,而是真的想做这个事。”在采访中,梁文锋面临年夜模子烧钱的相干发问表现,假如必定要找一个贸易上的来由,(一个贸易公司去做一种无穷投入的研讨性摸索),可能是找不到的,由于划不来。从贸易角度来讲,基本研讨投入报答比很低。但“一件冲动民气的事,或者不克不及纯真用钱权衡。就像家里买钢琴,一来买得起,二来是由于有一群急于在下面弹吹打曲的人。”现在,梁文锋的AGI幻想曾经震撼了全部硅谷。不外,已经以非营利为目标的OpenAI,盼望抗衡至公司的AI霸权,奥特曼随后引入微软的巨额投资。在奥特曼的主导下,OpenAI将成为一家真正的营利性企业。然后来者的梁文锋,却一直保持模子开源,并盼望更多人,哪怕一个小 APP都能够低本钱用上年夜模子,而不是技巧只控制在一局部人跟公司手中,构成把持。对创建初便以AGI普惠全人类为任务的OpenAI来说,奥特曼曾射出这颗枪弹,现在时隔10年,正中本人的眉心。从这一点来看,比拟起做一条鲶鱼,技巧幻想主义者的标签,仿佛更合适梁文锋。但不想成为鲶鱼的幻想主义者梁文锋,却不测两次“卷到了”全部人。第一次,DeepSeek成了激发中国年夜模子价钱战的泉源。在被AI持续轰炸的2024年5月,DeepSeek申明鹊起。原因是它们宣布的一款名为DeepSeek V2的开源模子,可谓价钱屠夫:推理本钱被降到每百万token仅 1块钱,约即是Llama3 70B的七分之一,GPT-4 Turbo的七非常之一。DeepSeek凭仗超绝性价比成了“AI界拼多多”,BAT们也被卷得坐不住,纷纭贬价。中国年夜模子价钱战由此剑拔弩张。起首智谱AI跟进,将入门级产物贬价,随后字节将旗舰模子降到跟DeepSeek同价,接着阿里、腾讯等随即跟上。只管,除了同为DeepSeek开创人的徐进结业于竺可桢学院,是黄峥的学弟,DeepSeek与拼多多并无更多交加。二心想着“让AI酿成大家能够用得起的货色”的梁文锋,乃至惊讶于年夜厂的跟进举措,究竟“年夜厂的模子本钱比咱们高良多,以是咱们没想到会有人亏钱做这件事。”而第二次,DeepSeek激发了硅谷年夜地动。更低本钱、不输OpenAI成熟模子的效力,梁文锋率领下的DeepSeek再次坐稳了“AI界拼多多”的宝座,而且胜利出海。现在,DeepSeek官方尚未颁布练习推理模子R1的完全本钱,但官方颁布了其API订价,R1每百万输入tokens在1元-4元国民币,每百万输出tokens为16元国民币。作为对照,OpenAI o1的运转本钱约为前者的30倍。换言之,梁文锋以不到非常之一的本钱,做出了硅谷须要上亿投入才干烧出的年夜模子。硅谷的震撼多少乎是必定的。除了被拿来片面对标的OpenAI,首当其冲的是Meta。以“年夜模子开源之王”为title的Meta,外部员工匿名宣布新闻称,Meta的天生式AI部分正因DeepSeek处于惊恐中,乃至爆料称尚未宣布的新一代开源模子Llama 4,在基准测试中曾经落伍于DeepSeek。a16z合资人、AI年夜模子Mistral董事会成员 Anjney Midha更是发文说道,从斯坦福到麻省理工,DeepSeek R1多少乎一夜之间就成了美国顶尖年夜学研讨职员的首选模子。与此同时,梁文锋率领的DeepSeek正撬起OpenAI的墙角。企业级AI代办开辟商SuperFocus的结合开创人表现,比拟起正应用的OpenAI旗舰模子GPT-4,DeepSeek供给的支撑不只类似,乃至更好。“SuperFocus可能会在将来多少周转向DeepSeek,由于DeepSeek能够收费下载、在自家效劳器上存储跟运转,并将增添贩卖产物的利润率。”比OpenAI廉价30倍的API价钱,让梁文锋一不警惕就出了海。同时,作为纯外乡团队的DeepSeek火了,梁文锋领军年青中国团队,无海内配景却硬刚硅谷巨子的叙事成了流量暗码。爆火之下,梁文锋还须要答复更多的新成绩。字母榜实验让DeepSeek作为一名记者,对梁文锋提一个成绩,这是DeepSeek的答复:“DeepSeek声称其模子练习本钱仅为行业1/10,但有开辟者指出,这可能是经由过程年夜幅缩减模子参数范围或依附幻方晚期囤积的便宜算力实现的,而非真正的技巧冲破。你能否否认这种‘本钱上风’实质是金融资本套利,而非算法翻新?”令人惊奇的是,这个由DeepSeek问出的成绩,多少乎能够归纳综合现在缭绕着DeepSeek的年夜局部争议。正如ChatGPT横空降生让OpenAI成为当之无愧的AI头部企业,英伟达的GPU凭仗高机能成为算力基本,让黄仁勋享尽高光,当初,DeepSeek的R1模子,却只能证实梁文锋有才能做出一个跟OpenAI最新模子相差无多少的模子。在采访中,梁文锋不止一次地提到盼望攻破硅谷的科技把持,盼望站在“技巧的前沿”,但做一个跟OpenAI最新模子相差无多少的模子,还远谈不上真正的超出,R1依然是对OpenAI的模拟跟追随。DeepSeek爆火之下,冲浪达人马斯克始终常见地并未宣布批评,却在近来点赞了一则推文。此中,推文中提到了DeepSeek大批依附模子蒸馏技巧,须要借助ChatGPT-4o跟o1才干实现练习。只管模子蒸馏是一项罕见的技巧手腕,可能将OpenAI中的大批数据敏捷提炼重点并疾速懂得跟利用,但这种形式只能让DeepSeek濒临OpenAI,而难以真正超出OpenAI。更不用说,只管宣传本人是技巧幻想主义,梁文锋的背地是量化私募巨子幻方,是BAT之外独一可能贮备万张A100芯片的公司。据《财经十一人》报道,2023年时海内领有超越1万枚GPU的企业不超越5家,此中便包含幻方。而可能用非常之一的本钱做出等同范围的年夜模子,也恰是基于梁文锋的试验室曾经投入了数亿美元做后期研讨,并领有年夜范围的芯片。想成为AI界拼多多,一般AI创业团队多少乎难以复现梁文锋的门路。图注:X上有关deepseek的meme图图源:X平台须要确定的是,站在OpenAI这个伟人的肩上,梁文锋率领DeepSeek实现了一场颇为冷艳的解围,但什么时间可能赶在OpenAI后面推出将来一代模子,如GPT- 5,当时才是梁文锋技巧幻想的AHA时辰。彼时,不OpenAI做坐标,梁文锋还是否持续靠低本钱战略做出机能强盛的年夜模子,才是等候DeepSeek的更年夜磨练。梁文锋曾如许先容本人,在广东一个五线都会长年夜,父亲是小学教师。“九十年月,广东赢利机遇良多,事先有不少家长到我家里来,家长感到念书没用。但当初归去看,观点都变了。由于钱欠好赚了,连开出租车的机遇可能都没了。一代人的时光就变了。”梁文锋充斥信念,在他看来,当前的硬核翻新会越来越多。“咱们只是还须要一堆现实跟一个进程。”现在,外界都在等待梁文锋跟DeepSeek会是谁人进程之一。参考材料:《揭秘DeepSeek:一个更极致的中国技巧幻想主义故事》 暗涌Waves《猖狂的幻方:一家隐形AI巨子的年夜模子之路》 暗涌Waves《DeepSeek颠覆两座年夜山》 字母榜