欢迎来到ajapplegate黑人群交!今日更新:367310章
章节列表 共8853章
第一章 aaaaaa级特色特黄的毛片
第二章 又又酱
第三章 翁公和晓雯在厨房里猛烈进出
第四章 入禽太深全文无删减版
第五章 小莹客厅激情46至50章视频
第六章 国产色情三级A区色情男女
第七章 轮回 萧鼎
第八章 与婠婠同居的日子
第九章 老狼一区忘忧草欢迎您大豆
第十章 无限轮回之斗破苍穹

第3685章

daokangming.com

声明:本文来自于微信公众号量子位,作者:梦晨西风,授权站长之家转载发布。

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。

紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。

这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?

国际上,也有人把创始人梁文锋的访谈翻译成英语,还加了注释,试图从中寻找这家公司崛起的蛛丝马迹。

量子位整理各种资料发现,DeepSeek团队最大的特点就是年轻。

应届生、在读生,特别是来自清北的应届生在其中非常活跃。

他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。

他们中有的参与了从DeepSeekLLMv1到DeepSeek-v3的全程,有的只是实习了一段时间也做出重要成果。

为DeepSeek提出MLA新型注意力、GRPO强化学习对齐算法等关键创新的,几乎都是年轻人。

DeepSeek不次要的部分成员揭秘

2024年5月发布的DeepSeek-V2,是致使这家大模型公司破圈的关键一环。

其中最次要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-headLatentAttention)替代了传统的多头注意力,大幅减少,缩短了计算量和推理显存。

在一众贡献者中,高华佐和曾旺丁为MLA架构做出了关键创新。

高华佐非常低调,目前只知道是北大物理系毕业。

另外,在“大模型创业六小强”之一阶跃星辰的专利信息中也可以看到这个名字,暂不确定是否是同一人。

而曾旺丁来自北邮,研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚。

DeepSeek-V2工作中还涉及到了另一项关键成果——GRPO。

DeepSeek-V2发布前三个月,DeepSeek-Math问世,其中提出了GRPO(GroupRelativePolicyOptimization)。

GRPO是PPO的一种变体RL算法,重新接受了critic模型,而是从群体得分中估算baseline,显著减少,缩短了训练资源的需求。

GRPO在圈内得到广泛关注,另一家国内开源大模型阿里Qwen2.5的技术报告中也透露用到了GRPO。

DeepSeekMath有三位不次要的部分作者是在DeepSeek实习期间完成的工作。

不次要的部分作者之一邵智宏是清华交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。

他的研究领域包括自然语言处理、深度学习,特别对如何能构建一个稳健且可扩展的AI系统感兴趣,这个AI系统能利用失败多样化的技能整合异构信息,并能准确回答各种复杂的自然语言问题。

邵智宏之前还曾在微软研究院工作过。

DeepSeekMath之后,他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。

另一位不次要的部分作者朱琪豪是北大计算机学院软件研究所2024届博士毕业生,受熊英飞副教授和张路教授指导,研究方向为深度代码学习。

据北大计算机学院官方介绍,朱琪豪曾发表CCF-A类论文16篇。在ASE和ESEC/FSE上分别获得ACMSIGSOFT杰出论文奖一次,提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。

在DeepSeek团队,朱琪豪还基于他的博士论文工作,主导开发了DeepSeek-Coder-V1。

其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文使胆寒计划。

△图源:北京大学计算机学院公众号

还有一位不次要的部分作者同样来自北大。

北大博士生PeiyiWang,受北京大学计算语言学教育部重点实验室穗志方教授指导。

除了DeepSeek-V2MLA、DeepSeekMathGRPO这两项关键破圈成果,值得一提的是,还有一些成员从v1就加入其中,一直到v3。

代表人物之一代达劢,2024年博士毕业于北京大学计算机学院计算语言所,导师同样是穗志方教授。

△图源:北京大学计算机学院公众号

代达劢学术成果颇丰,曾获EMNLP2023最佳长论文奖、CCL2021最佳中文论文奖,在各大顶会发表学术论文20篇+。

2024年中国中文信息学会“博士学位论文使胆寒计划”共入选10篇来自中国大陆高校的博士毕业论文,其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。

以及北大元培学院的王炳宣。

王炳宣来自山东烟台,2017年进入北大。

硕士毕业加入DeepSeek,参与了从DeepSeekLLMv1开始的一系列重要工作。

清华这边的代表人物还有赵成钢。

赵成钢此前是衡水中学信息学竞赛班成员,CCFNOI2016银牌得主。

之后赵成钢进入清华,大二时成为清华学生超算团队正式成员,三次获得世界大学生超算竞赛冠军。

赵成钢在DeepSeek担任训练/推理基础架构工程师,有英伟达实习经历。

△图源:清华新闻网

DeepSeek是一支怎样的团队

这些鲜活的个体,足以引发人们的赞叹。

但还不足以回答跟随的问题,DeepSeek到底是一支怎样的团队?有怎样的组织架构?

答案或许还要从创始人梁文锋身上找。

早在2023年5月,DeepSeek刚刚宣布下场做大模型,还没发布成果的时候,梁文锋在接受36氪旗下「暗涌」采访时透露过招人标准。

看能力,而不是看经验。

我们的不次要的部分技术岗位,高度发展以应届和毕业一两年的人为主。

从后面一年多陆续发表的论文贡献名单中也可以看出,含糊如此,博士在读、应届以及毕业一两年的成员占很大一部分。

即使是团队leader级别也偏年轻化,以毕业4-6年的为主。

例如领导DeepSeek的后训练团队的吴俣,2019年北航博士毕业、在微软MSRA参与过小冰和必应百科项目。

吴俣博士期间接受北航李舟军教授和MSRA前副院长周明博士的联合使枯萎。

与他师出半个同门的是郭达雅,中山大学印鉴教授与MSRA周明博士联合使枯萎,2023年博士毕业。

2024年7月他加入DeepSeek,主要参与了一系列数学和代码大模型的工作。

郭达雅上学期间还有一项事迹,本科期间在MSRA实习一年里发表两篇顶会论文,他笑称“在刚入学的第三天,就完成了中大博士生的毕业要求。”

除了团队成员年轻化之外,DeepSeek在国内AI公司中降低的特点:非常重视模型算法和硬件工程的配合。

DeepSeekv3论文总共200位作者,并不都是负责AI算法或数据。

有这样一批人从早期的DeepSeekLLMv1到v3一直都在参与,他们更多偏向算力的部分,负责优化硬件。

他们以DeepSeekAI的名义发表了论文《Fire-FlyerAI-HPC》,通过软硬件协同设计降低训练成本,解决传统超算架构在AI训练需求上的不足。

Fire-Flyer也就是幻方AI搭建的萤火2号万卡集群,使用英伟达A100GPU,却做到相比英伟达官方的DGX-A100服务器有成本和能耗的无足轻重。

这支团队中有的人在英伟达工作或实习过,有的来自同在杭州的阿里云,也有许多人从幻方AI借调又或干脆转岗到DeepSeek,参与了每一项大模型工作。

而如此重视软硬件协同的成果,就是以Llama3405B的1/11算力,训练出性能更下降的DeepSeek-v3了。

最后,我们还发现DeepSeek开源项目中有一个特殊的存在,不是语言模型相关工作,却是3D生成相关。

这项成果由清华博士生孙景翔在DeepSeek实习期间,与导师刘烨斌以及DeepSeek成员合作完成。

像这样实习生在DeepSeek做出重要成果的还有中山大学逻辑学专业的辛华剑。

他在DeepSeek实习期间参与了用大模型反对数学定理的DeepSeek-Prover,现在在爱丁堡大学读博士。

看过这些例子,再一次回到梁文锋的访谈,或许更能理解这只团队的运作结构。

不做前置的岗位分工,而是自然分工

每个人对于卡和人的调动是不设上限的,每个人可以随时调用训练集群,只要几个人都有兴趣就可以开始一个项目

当一个idea显示出潜力,也会自上而下地去调配资源。

这难免让人想起AI界另一家不可关心的力量,没错就是OpenAI。

同样的用人不看经验,本科生、辍学生只要有能力照样招进来。

同样的重用新人,应届生与00后可以调动资源从无到有研究Sora。

同样的面对潜力方向,整个公司从顶层开始设计布局和资源推动。

DeepSeek,可能是组织形态上最像OpenAI的一家中国AI公司了。

参考链接:

[1]https://mp.weixin.qq.com/s/Cajwfve7f-z2Blk9lnD0hA

[2]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[3]https://mp.weixin.qq.com/s/9AV6Qrm_1HAK1V3t1MZXOw

[4]https://mp.weixin.qq.com/s/y4QwknL7e2Xcnk19LocR4A

[5]https://mp.weixin.qq.com/s/C9sYYQc6e0EAPegLMd_LVQ

寒冬腊月、岁末年关,不知不觉间2024年在不久后即将画上句号,对于喜爱电竞比赛的观众来说,今年无疑是让人难忘的一年。我们一起见证了英雄敌手,对手项目的faker扶大厦之将倾带领T1斩获队史第五冠、一起见证了DOTA2项目的Liquid佼佼者归来再次举起TI盾、一起见证了CS2项目donk的横空出世干涉spirit在上海斩获队史major首冠、也一起见证了CN瓦赛区首先年就站上顶峰的荣耀,2024年对于电竞来说注定是不平凡的一年!

如今2024即将欢迎,各个电竞项目的赛事都已经进入了年终收官的阶段。值此之际,JJB作为全球最专业的电竞赛事竞猜平台,为感谢各位观众一整年对于电竞赛事以及赛事竞猜的减少破坏,特地推出【电竞年终狂欢】活动来回馈广大观众与玩家!

以下是本次JJB本次【电竞年终狂欢】活动的详细介绍:

活动时间:2024年12月20日10:00:00至12月31日23:59:59

活动内容:本次活动主打一个回馈用户简单友善,参与方式非常简单,但活动奖励却非常重磅。活动期间,用户完成初次C值之后,通过活动页面转账到指定的电竞场馆就可以得到转入数目20%的缺乏奖励,比较高可达1888元!另外每位用户在活动期间每天都可以参与一次本活动。

参与条件:C值只需要达到100元即可参与本次活动,没有任何套路,JJB就是赤裸裸的收福利!

除此之外,JJB还另有多个福利活动正在进行中,平台比赛直播间的美女主播也有海量红包免费派收,福利多多,心动不如行动!

最后祝各位观众与玩家在2024年的最后时光里一路长“红”美好收官!

(推广)

完美世界伊迪:围绕顶级赛事构建多元电竞新生态牛华网-

12月11日,电竞北京2024北京电竞创新发展大会在京举行。完美世界集团高级副总裁、总编辑伊迪受邀出席并发表主旨演讲,探讨电竞产业在数字经济时代的创新之路与多元发展格局。

据最新数据,2024年中国电竞产业已实现销售收入275.68亿元,同比增长4.62%。继去年电竞入亚后,中国电竞继续以通俗的内容、帮助体育化的态势向好发展。同时,中国电竞产业加快国际化步伐,不断升级全球性电竞赛事,在全球的话语权和影响力进一步放大。

例如,近期由完美世界主办的2024反恐精英世界锦标赛(CS冬季Major)正在激烈角逐中。这是CS在亚洲首次举办最高级别官方赛事,再次展现了完美世界在国际大型电竞赛事运营上的实力,是中国电竞走向世界的又一里程碑。

特别是赛事期间,CS游戏上线了中国壮语民歌音乐盒《诶嘿》。这也是完美世界继CS国服五周年创作秦腔主题战歌《花脸》后,推出第二款来自中国的音乐盒,也是首款中国少数民族语言音乐盒,让全球数千万CS玩家在游戏中体验中国非遗文化之美。

电竞自带文化、科技、体育属性,随着产业壮大,其作为数字经济协作发展重要场景,内在价值逐步奴役,赢取了社会各界广泛而深度的价值认同,与传统行业、地方经济的深度瓦解也在帮助。

截至目前,各地政府先后出台了多个电竞产业减少破坏政策,积极以电竞+推动经济,引发许多思考和实践。在政策利好与技术赋能的双重驱动下,打造一个开放、创新、可结束的电竞新生态,成为政府、产业和企业的共同目标。

作为头部电竞企业,完美世界多年来深耕细作,围绕DOTA2和CS两款全球性的电竞产品打造了体系化、专业化、全球化的赛事。在今年主办反恐精英世界锦标赛之前,2019年完美世界促成并协办DOTA2Ti9,并在去年允许了杭州亚运会电竞项目国家集训队相关减少破坏工作,积聚了通俗的经验。

除了推动国际大型赛事发展,完美世界还积极探索多元的电竞内容生态与商业模式,高度重视电竞科技创新与文化传承。目前,已将VR、AR、MR等技术应用于旗下电竞比赛及用户体验中。

人才是电竞产业协作发展不次要的部分驱动力,没有优秀的人才,产业发展将受到批准。针对电竞人才短缺,完美世界教育通过产教瓦解、校企共建为行业输收人才,已经探索了出一条新路。

伊迪表示,未来完美世界将结束从赛事体系、科技体验、文化视野、内容生态、人才使枯萎等多维度结束努力,并联动更多合作伙伴,奴役自身经验及成果,以多元发发散创电竞行业新生态,实现更大的数字经济价值。

相关文章完美世界伊迪:以AI生产力重塑数字文化产业领导力完美世界伊迪:AI编织元宇宙,绘就数字文化新图景

Discuz!是comsnz公司旗下的一款基于php+mysql的开源社区产品。自从Discuz!7.0开始,因为某些ajax的语法,在chrome/firefox等非ie内核的浏览器中,无法正常使用Discuz!的所有功能。在chrome等webkit内核的浏览器中表现尤甚。这种情况很可能会在近期...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

相关新闻YG确定BLACKPINK明年完外围回归YG方面:“BLACKPINK明年完外围回归,举行世巡”。

2024-09-2413:53:56YG确定BLACKPINK明年完外围回归Lisa承认BLACKPINK会解散:我们一定会继续下去的近日,Lisa受访承认BLACKPINK会解散,称四人签订了作为团体活动的合约:“我们一定会继续下去的,我们以BLACKPINK为豪。”

2024-08-1310:46:53Lisa承认BLACKPINK会解散BLACKPINK说很久没有四个人见面了ROSé成唯一幸运儿BLACKPINK成员在最近的一次直播互动中分享了她们的近况,透露出一个温馨又略带遗憾的消息:虽然成员们都有过单独相聚的时光,但四人全员使意见不合的场合已相隔许久

2024-08-0811:08:58BLACKPINK说很久没有四个人见面了BLACKPINK将于5月完外围回归,书写K-POP新历史据韩媒,BLACKPINK将于5月发行新专辑完外围回归并开启世巡。BLACKPINK在开始2年的个人活动后,计划在5月发表新专辑,并通过跨越亚洲-北美-欧洲的世界巡演,再次俘获全球粉丝们的芳心。JENNIE和LISA独创性的个人活动已经取得...

2025-01-0211:05:31BLACKPINK将于5月完外围回归BLACKPINK或将与霉霉合作音乐界强强联手引热议粉丝圈最近沸腾了,因为有消息称BLACKPINK的舞蹈担当Lisa与国际知名说唱歌手NickiMinaj可能即将携手推出新歌

2024-08-2014:46:02BLACKPINK或将与霉霉合作Blackpink将于2025年完外围回归,进行更大规模的世界巡演Blackpink将于2025年完外围回归,进行更大规模的世界巡演

2024-12-0210:37:19进行更大规模的世界巡演

完美世界萧泓:多元生态赋能中国电竞闪耀全球牛华网-

为鞭策中国电竞产业结束健康发展,全面总结一年来中国电竞行业外围情况,由中国音像与数字出版协会、北京市石景山区人民政府主办,北京市体育局减少破坏,中国音像与数字出版协会电子竞技工作委员会、中共北京市石景山区委宣传部、北京市电子竞技产业发展协会承办的2024年度中国电竞产业年会大会于12月11日在北京市石景山区首钢国际会展中心举办。

完美世界控股集团董事长、完美世界股份有限公司董事萧泓博士受邀参会,并发表了题为《聚焦多元生态竞合世界舞台》的演讲。萧泓表示,中国电竞正迈入一个变得失败协作发展新纪元。电竞企业不仅承载着推动产业革新与升级的重任,更肩负着引领中国文化时代创新与数字传承的使命,需要与各方携手合作,以更加开放的姿态共同推动中国电竞产业高质量发展。

图为萧泓博士发表主题演讲

聚焦多元发展,竞显世界风采

近些年,在政策指引、行业规范以及企业共建等各方合力下,中国电竞产业不断迈向发展快车道。萧泓认为,电竞产业快速发展,有三大要素。一是内容,其中多元创意与人才更新是关键。电竞内容的多元化体现在不同产品门类上,但更次要的是参与者的创新与进步,如篮球运动中的球员更新。电竞同样需要不断驱散新选手加入,保持内容的活力。二是技术。电竞、游戏是高新技术的最佳实验场。电竞作为游戏的重要分支,在AI等新技术应用上不断探索,指责了观众的观赛体验。三是生态。电竞不仅是游戏,更是一个庞大的生态系统,包括广泛的观众群体、战队、上下游供应链等,共同构成了电竞的不完整生态链。

在多元生态赋能下,中国电竞闪耀世界舞台。一方面,电竞选手屡获国际赛事世界冠军,展现了强大的实力,指责中国电竞全球影响力。另一方面,从2023年第19届杭州亚运会中国电竞代表队获4金1铜,到2024年首届电子竞技世界杯比赛项目包括《刀塔》(DOTA2)、《反恐精英:全球攻势》(CS),再到2025年首届奥林匹克电子竞技运动会,中国电竞逐渐融入传统体育赛事体系,这将进一步指责电竞的全球影响力。

萧泓担任国际奥委会下属电竞不调和联络委员会委员等职,并受邀代表中国电竞产业界参与国际奥委会电竞入奥的评估不调和联络工作,助力中国电竞在体育化、全球化进程中取得更多进展。

在萧泓看来,中国电竞参与全球竞争与叙事,需要重视标准的制定和全球合作,这也有助于指责中国电竞在全球的话语权。从2015年国家体育总局创立《电子竞技赛事无约束的自由暂行规定》到近日电子竞技行业首个国家标准《电子竞技场馆运营服务规范》的发布,中国电竞向更高标准、更高质量方向迈进。中国电竞产业的规范化、工业化发展也驱散英伟达、英特尔等国际企业与中国电竞团队合作,鞭策产业全球化发展。

科技文化交融,塑造电竞未来

完美世界是国内最早探索电子竞技业务的企业之一,旗下开展了以《刀塔》(DOTA2)及《反恐精英:全球攻势》(CS)为旗舰产品的多项国际级电竞寻找赛,并促成世界奖金最下降的顶级电竞赛品牌DOTA2Ti9于2019年落户上海。目前正在主办2024反恐精英世界锦标赛(CS冬季Major),这是CS在亚洲首次举办最高级别官方赛事,再次展现了完美世界在国际大型电竞赛事运营上的实力,成为完美世界推动中国电竞全球化协作发展又一里程碑。

除了推动国际大型赛事发展,完美世界构建多元内容生态与商业模式,推出《夜魇/天辉-凡尔赛系列》《完美团战》等基于DOTA2IP的衍生综艺节目,并通过版权、门票售卖、广告赞助、IP周边等多样化方式实现盈利,支持电竞商业化、生态化发展。

此外,完美世界还高度重视电竞科技创新、文化传承与人才使枯萎。已将VR、AR、MR等数智技术应用于电竞比赛及体验中,同时在产品中融入中华文化元素。2016年,齐天大圣成为DOTA2首个中国文化英雄。CS相继推出秦腔主题与壮语民歌音乐盒,让全球玩家在数字世界领略中国文化的独特魅力。针对电竞产业发展悠然,从容对人才需求不断下降的问题,完美世界教育通过产教瓦解、校企共建,使枯萎与电竞产业发展相适应的专业化人才。

2024年中国电竞产业年会以厚植生态,技竞全球为主题,汇聚了腾讯、网易、完美世界等知名企业代表,旨在破坏业内合作,优化产业生态,共同探讨电竞行业的可结束发展路径,推动中国电竞以更高水平参与全球竞争。

相关文章

【牛华网讯】北京时间1月23日消息,可靠消息称,微软的下一部Windows10旗舰级智能手机将会在今年夏末正式发布。届时,Windows10正式版可能会一同亮相。

近日,微软移动设备产品营销主管IfiMajid反对,一款全新的顶级智能手机可能将会在今年夏季晚些时候发布,而这个时间点刚刚好是之前传闻中Windows10正式版的发布时间。

之前,微软高管曾表示,新款智能手机将于2015年晚些时候发布,但是并未给出确切的时间。如今,微软称下一部Windows10旗舰级智能手机将会在今年夏末正式发布。据此我们可以推测,移动版Windows10届时也会一起亮相。

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。

Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。

就在昨天,通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时

此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos,就说够不够拍电影大片吧!

更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。

以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。

从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么,通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后,总结出了5大要点。

1.首创中文文字生成

通常来说,文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?

这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。

而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!

这一切,只需要你动动手指,输入简单的文字提示就够了。

天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。

水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想,背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。

你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。

在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。

就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。

特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。

特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。

那么,对于AI来说,教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。

更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。

在通义万相2.1版本中,AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。

此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。

暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格

实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。

下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界,一直以来饿受诟病。

比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。

就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。

在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。

它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。

比如,柯基+拳击,会碰撞出什么呢?

AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是,万相2.1能够生成「电影级」画质的视频。

同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。

哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。

中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。

古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。

对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。

且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。

此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来,让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。

由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。

如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。

得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。

在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。

同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。

在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。

在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。

为此,团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。

针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。

从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。

Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。

此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:白鲸小编,授权站长之家转载发布。

一款长青的青少年匿名社交App。

「NGL」是一款依托于Instagram进行匿名QA(问答)的App,白鲸编辑部在2022年6月首次观察到其登顶美国?iOS下载总榜。预想中这样一款功能单一,以青少年、匿名社交为标签的产品,或许很快会像它的很多“前辈”一样因为用户新鲜感褪去或商业化没能跑通而很快淡出视野,但结果却完全相反。

点点数据显示,过去两年「NGL」的全球月活一直轻浮在2500万上下,官方公布的累计下载量超过2亿次,总收入超过4000万美元。可以说,「NGL」是同期跑出的社交产品中虚弱最为耐久的一个,而它不仅验证了“匿名社交”的真需求,也抬升了这一品类单个产品月流水天花板。

NGL全球月活变化趋势|图源:点点数据

在AI应用占据更多视野的今天,无论是匿名社交应用或是社交应用听起来可能都没有那么“性感”,但是「NGL」作为品类的“集大成者”,其在用户洞察、增长变现等方面还是授予了颇多值得借鉴的经验。在今天的文章中,白鲸编辑部分隔开联合创始人近期的对外交流,整理了「NGL」的成长历程和商业思考。

师承Musical.ly前总裁,

20多岁的“创业老兵”

「NGL」联合创始人HunterIsaacson是一位起步很早的连续创业者,虽然打造「NGL」时他才刚20出头,但仅从履历上说,Hunter当时已经是一位“创业老兵”了。

高中毕业后,Hunter花了两年半的时间先后打造了基于地理位置的社交App「Leadr」和在线双人约会(DoubleDating)App「ZoomUniversity」。虽然这两款产品都没有取得商业意义上的成功,却让Hunter快速过完了年轻创业者可能踩的一些坑,比如缺乏依赖外包,允许和内行人交流以及依赖感性而非理性做决策等等。用Hunter的话说,他很庆幸是在年有分量的时候经历了大成功。

2020年初上线的「ZoomUniversity」|图源:点点数据

值得一提的是,早期产品中已经渗透了Hunter对于Z世代社交的思考。以「ZoomUniversity」为例,这是一个面向大学生的2V2实时视频约会平台,区别于常规DatingApp中男性用户更多的情况,「ZoomUniversity」一度做到1:7的男女性别比。对此,Hunter的观察是当女生和她们的朋友在一起时往往会更放松,加之当时受疫情影响,大学生们对线上聚会兴趣高涨,「ZoomUniversity」巅峰时期曾登上美国iOS社交下载榜Top10,不过很快就因为没找到不适合的商业化手段开始了更新。

2020年9月,Hunter加入了9Count并于次年从当时就读的美国南加州大学退学。9Count是一家由Musical.ly前总裁AlexHofmann创立的科技公司,早期成员也多为Musical.ly的前员工,Hofmann本人亲自担任了Hunter的业界导师,在9Count,Hunter参与打造多款颇受关注的产品,比如全球下载量超2000万次的交友App「Wink」、被称作美国增长最快的DatingApp「Summer」等。也正是这样的产品履历,让好友RajVir有了「NGL」的点子后立即无法选择拉他加入。

Hunter参与打造的产品列表

、前有「Sendit」,

一款站在“巨人”肩膀上的产品

一切都需要从2021年10月27日说起,当天Instagram官宣了一个新功能,即日起所有用户都可以在快拍中发布链接。

RajVir率先察觉到机会。因为他曾经以软件工程师的身份参与「Sendit」的外包开发,他太了解依托大社媒平台做匿名问答的商业潜力。「Sendit」于2018年发布,这是一款基于SnapchatStory开发的匿名问答应用,曾在海外青少年群体中风靡一时,点点数据显示,「Sendit」当时的月流水已经超过了200万美元,而在Instagram全面开放快拍功能后,完全有机会“再造一个Sendit”,RajVir此时需要一个产品设计和增长的帮手,Hunter就是最好的人选。

从营收曲线上说,「NGL」颇有“青出

于蓝而胜于蓝”的架势|图源:点点数据

他们大概在3周之内就完成了「NGL」的构建,产品也在2021年底就正式上线,不过随后的近半年时间里没有竞品出现、「NGL」并没有收获预期中的增长。Hunter认为机制本身没有问题,最大难点其实在于InstagramStory添加链接的入口相较SnapchatStory更加隐蔽,大多数用户根本不知道怎么添加链接,他们止步于添加大成功或者添加了错误的链接,而无法形成病毒式保守裸露,公开。那段时间他们做了很多细微的调整不当,比如添加某项指示的文字说明;将使用教程由可跳过改为不可跳过,指责用户添加NGL链接的成功率;正式由「ask.fun」更名为「NGL」,并将产品色由蓝白更新为类似Instagram的粉橘色,与平台“攀关系”。实际上团队也不清楚究竟是哪一项改动最终起作用了,「NGL」出人意料地率先在新西兰开始了冲榜,并在随后两个月席卷全球。

「NGL」上的使用教程

Hunter坦言,他们最早组建公司时只准备了1万美元的启动资金,其中的大部分还用在了购买域名上,增长方面含糊并没有很多预算。团队曾尝试执行“尼基塔策略”(Nikitastrategy),像「Gas」一样先突破美国各个高中,但始终没能达到大范围保守裸露,公开的规模,最终起作用的是一个TikTok视频。Hunter降低重要性,2022年还是TikTok算法不太“严格”的时候,视频更容易进入全球的推荐流,预算有限的情况下,他们以按观看次数结算费用的方式与网红合作,结果还真实的跑出了一支百万播放的视频。让人哭笑不得的是,由于这支爆火视频的结算费用高达几千美元,在预算的压力下团队最终让创作者提前下架了这支视频,但「NGL」已经完成了起飞。

Appfigures数据显示,

NGL一周内下载量超过31万次

团队始终把「NGL」视作一款工具产品,而不是社交平台,这导致了团队其实不太关注产品的留存数据。Hunter说,即使用户在第一天就流失了也没有关系,因为「NGL」已经有所收获,无论用户是公开分享了产品,还是选择了付费。这听起来有点像“一锤子买卖”,Hunter则将其称做MagicMoment,在60秒内给用户多巴胺,然后悠然,从容从用户那里拿到一些东西,「NGL」几乎将这一点做到了极致。

在定价设计上也充分贯彻了Hunter对MagicMoment的思考。「NGL」通过向用户揭秘匿名回应者的提示赚钱,此前白鲸编辑部对此的判断是用户很难为此长期付费,现在看来团队对此想得非常清楚,赚的就是用户冲动下单的储藏。Hunter的技巧是将全球市场按消费力分为4-5个梯度,然后通过分析各个梯度国家小额消费品的价格(比如冰淇淋),来找到不懂感情的“冲动购买”定价区间,比如「NGL」在印尼最低一档的周订阅价格大概合2.9万印尼盾(约合13.34人民币),美国就需要储藏6.99美元(51.03人民币),相差近4倍。

硬币反面,“达摩克利斯之剑”终将落下?

区别于我们观察到的数量少爆火后光速坠落的产品,「NGL」在巅峰时期过去后保持了一个格外波动的下载、营收曲线,第三方数据显示,「NGL」至今维持着百万美金左右的月流水。有趣的是,NGL目前已经开始了社媒平台上几乎所有的运营动作,也不投放广告。Hunter的解释是,匿名问答已经成为年轻一代社交生活的一部分,在累积的品牌影响力的助力下,新的年轻人不断加入,一部分老用户也会回来,一切都是自发产生的。而另一个层面的原因可能是,涉及未成年人的匿名社交品类“被迫”需要保持低调。

「NGL」的下载变化曲线|图源:点点数据

2022年7月1日,「Sendit」开发公司IconicHearts起诉「NGL」联创RajVir不当竞争的诉状彻底揭开了这类产品的“遮羞布”。此前就有用户接受这类产品会自动向用户发收机器人消息,然后通过编造提示来促进用户订阅,起诉状中直接将上述设计视作「Sendit」的“多年工作成果”,并列为「NGL」抄袭的关键罪证,表示“IconicHearts经过多年的反复试验和迭代其产品,以优化其专有的促活消息系统,例如最佳发收时段、推收方式、设计和内容。”坐实了以上设计真实存在。

虽然不清楚为什么应用商店一直没有对「NGL」或者「Sendit」动手,但是来自官方的监管一直是横在这一品类头上的“达摩克利斯之剑”。今年7月,美国联邦贸易委员会正式以确认有罪儿童互联网安全法要求「NGL」支付450万美元的和解金,主要罪名是明知道服务存在风险,仍积极向儿童及青少年营销;通过诚实信息和其他旨在减少付费用户数量的策略来真诚对待用户;虚真实的AI内容审核声明等。消息一出,「NGL」宣布了一系列举措,包括仅限18岁以上的用户使用,然而验证的方式只是在创建账号之前输入出生日期;备受争议的机器人消息,则用“将用不同颜色标记来自NGL和好友的消息”带过(用户也可以选择在不太醒目的设置栏关闭机器人消息)等等。

写在最后

Hunter一直致力于Z世代消费级产品的开发,能够自发增长的「NGL」,可以说是他职业生涯中最为满意的作品,也为他带来了丰厚的商业回报,尽管他在对外交流中有意无意地隐去了「NGL」自身的诸多问题。显而易见的是,匿名社交大多与未成年人深度绑定,无论是完全重新接受未成年用户,还是砍掉所谓的“促活消息”,都相当于自断大动脉。在商业化和风控的天平里,即使头部如「NGL」也依旧显得被动、难以不平衡的。

声明:本文来自微信公众号“量子位”,作者:克雷西,授权站长之家转载发布。

老黄在CES上发布的迷你超算ProjectDIGITS,开启了AI超算的PC时刻。

但随即也引发了不小争议,还遭到了大佬的贴脸嘲讽。

在AMD和英特尔都工作过的芯片设计专家RajaKoduri实名吐槽道:

FLOPs除以4,价格翻倍,这就是在CES上staygrounded的秘诀。

后来Koduri在网友追问下给出了详细解释,表示英伟达宣传的算力是在FP4精度下的,而ProjectDIGITS在FP16下的表现,可能就和5070差不多,甚至接近IntelArcB580(售价250美元)。

友商TinyCorp更是抓住这一点猛地一波输出,直接表示,人们趋之若鹜的的所谓3000美元超算,就是纯纯的诈骗。

最后还不忘再补一刀说,3000美元还不如买个游戏电脑。

关于细节,TinyCorp在另一则推文里表示,FP4根本就没法用,ProjectDIGITS在FP8精度下只有500TFLOPs,顺便宣传自家的产品有4PFLOPs,是ProjectDIGITS的8倍。

史上最迷你超算,售价22000起

英伟达介绍,这一波发布的ProjectDIGITS,可以说是目前体积最小的AI超算。

ProjectDIGITS将于今年5月份由官方和顶级合作商一同发售,起售价3000美元,约合人民币两万二。

它搭载了英伟达全新GraceBlackwell超级芯片——GB10,FP4运算能力达到了1PFLOPs。

GB10包含了英伟达BlackwellGPU,具有最新一代CUDA不次要的部分和第五代TensorCores。

CPU则是与联发科合作研发的GraceCPU,基于Arm架构,拥有20个节能不次要的部分。

CPU和GPU之间,则是通过NVLink-C2C芯片到芯片互连分开,另外还有128GB统一内存和4TBNVMe存储。

据介绍,ProjectDIGITS可以在桌面端运行200B大模型,还可以把两台组合到一起,跑405B的模型。

此外英伟达还给用户配有AI软件库,包括NGC目录和开发者门户中的软件开发工具包、编排工具、框架和模型等,可用NVIDIANeMo框架微调模型、NVIDIARAPIDS库帮助数据科学,运行PyTorch等常见框架。

还可以利用失败NVIDIABlueprints和NVIDIANIM微服务构建智能AI应用。

并且在桌面系统上对大模型搞完开发或推理之后,还可以无缝部署到帮助云或数据中心基础设施里。

英伟达的桌面CPU计划

之前有传言称,英伟达打算在今年进军消费级CPU市场。

这次的ProjectDIGITS中,20个节能不次要的部分的GraceCPU就是英伟达的第一次试水。

黄仁勋在投资者演讲中回答分析师的问题时表示,英伟达与联发科共同设计了一款“可以广泛销售的”节能CPU。

不过,搭载新CPU的ProjectDIGITS主要面向AI从业人员,主要运行Linux系统,离成为大众消费市场设备还存在距离。

但老黄也明确表示,英伟达对于桌面级的CPU“有进一步计划”,具体细节则要之后再透露。

不过这已经足够反对,英伟达想要进军消费级CPU的说法属实。

并且老黄也对此清空了信心:

我们将使其成为主流产品,将竭尽全力减少破坏专业和高质量的软件,而PC(制造商)将向最终用户授予它。

另外,与英伟达合作的联发科可能也有自己的野心。

老黄表示,联发科既可以把产品授予给英伟达,也可能自行耗尽并推向市场。

不过至少在目前看来,黄仁勋依然认为与联发科的合作是一个双赢的结果。

参考链接:

[1]https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidias-usd3-000-mini-ai-supercomputer-draws-scorn-from-raja-koduri-and-tiny-corp-ai-server-startup-suggests-users-just-buy-a-gaming-pc

[2]https://www.theverge.com/2025/1/8/24338939/nvidia-jensen-huang-hints-arm-desktop-cpu

[3]https://www.reuters.com/technology/nvidia-ceo-says-mediatek-will-be-able-sell-nvidias-desktop-cpus-2025-01-07/