欢迎来到我比想象中爱你!今日更新:43161章
章节列表 共7266章
第一章 阿娇张开两腿实干13分钟完整版
第二章 洪荒之永恒国度
第三章 双恋蛋蛋
第四章 将军在上我在下小说
第五章 顶的速度越来越快越叫的原因
第六章 蜜芽忘忧草768.mon.二区老狼大豆行情网
第七章 军婚也缠绵最新章节
第八章 黑料正能量tttzzz网页入口
第九章 我很大你忍一下
第十章 优质RB攻略系统的小说

第500章

daokangming.com

董宇辉终究还是离职了,带着“丈母娘”们的偏爱,留下“小气“的老俞和不甘的投资者。

东方甄选失去董宇辉这一头部IP、次要的债务,公司股价暴跌。辞职信公布的7月25日,东方甄选总市值128亿港元;26日,市值缩水到98亿港元,较“小作文”事件前的330亿港元已经跌去了2/3。

7月26日下午,俞敏洪主持电话会议,出面向投资者解释一切,包括董宇辉获得的极小量奖励。

截至会议前,运营两年半的东方甄选粉丝数2985万,运营半年的与辉同行粉丝数2172万。

俞敏洪发言伊始,试图努力和利益受损的投资者共情。

“我的股份不是公司给的,我跟大家一样,是在市场上真金白银、当时叫新东方在线的时候买的不少股份。我想向大家反对我对公司会非常认真地去经营发展。”

“我今天问了一下个人财务顾问:我在东方甄选买的股份到现在为止是什么状态?他说你就好好干,还要干好几年亏损的钱才能回来。为了我的钱回来,我还得努力的干下去。”

本次交易中,投资者关注若干数据,比如与辉同行100%的股权估值为7658.55万元,而与辉同行账上留存着1.4亿净利润。且这1.4亿元系分配完董的个人奖励后、本应100%属于东方甄选的净利润。

另外,俞敏洪表示,“宇辉购买公司的钱我安排了,公司是收给宇辉的。”

这背后是何种交易,26日,俞敏洪做出解释:董宇辉无法选择独立的最近半年,没有获得公司股权增发奖励,7000余万的差价是对此的补偿。

26日,俞敏洪还努力说服投资者,东方甄选的未来会更好。

根据蝉妈妈数据,东方甄选日均销售额高点在“小作文”事件前为5000-7500万元,目前仅有500-750万元。与辉同行直播间近30天场均销售额为1000-2500万元,已经超过东方甄选。

“出于信息保密等原因,我没有办法和大家进行实时沟通和交流,导致了一些股东对我的失望和愤怒,我后续一定会以加倍的努力,把更多的精力投入到东方甄选的运营无约束的自由中,来报答大家,努力给大家一个协作发展越来越好的东方甄选。”

另外,俞敏洪表态,东方甄选未来不可能再出现某个主播独立成立平台,“像这一次的运作模式,会导致某种私利,也会导致某种不可预料的结果。”

这半年发生了什么?

昨天大家已经看到了与辉同行的剥离,我非常遗憾最后有这样一个结果。但公司所面临的现实情况,这一结果含糊是不可避免的,甚至我认为这一结果对于公司发展是有好处的。

东方甄选2021年12月28日在我的“老俞闲话”上开播,因为“双减”以后(教育)在线业务全军覆没,我们经过讨论、也是我个人主张无法选择来销售农产品,同时讲解文化、推广知识。

到了(2022年)6月的时候,宇辉搞活了东方甄选。从2022年年中到2023年年底,尽管中间有很多磕磕绊绊,但是本质上一直处于下降期。

中间其实也发生了一些事情,这也导致了后来2023年年底(小作文)事情的发生。

我在此之前是公司董事长,高度发展上不参与公司的任何日常无约束的自由和经营。2023年年底以后,我意识到了事情严重性,就亲自担当了CEO岗位。

到我这个年龄,其实担当这个岗位有一点勉为其难了,(即便)我还是算是一个清空活力的人。

东方甄选作为以流量带货为不次要的部分的公司,我知道宇辉的价值是非常次要的。在董事会授权以后,给了宇辉很好的(薪酬)Package,努力留住了宇辉。

宇辉对我也比较接受,觉得在我领导下继续干也是比较安全的状态;为了使双方寻找矛盾和冲突,也为了使双方能够各自发挥无足轻重。

在我的建议下,成立了与辉同行公司,完全是由宇辉来主持工作,注册的时候就已经把宇辉注册成了唯一的执行总经理。

为什么注册时不给董宇辉股权?

东方甄选作为上市公司,个人已经在(子)公司持有了股份以后,就不可能再拿到上市公司(母公司)股份。

为了确保宇辉能够拿到上市公司股份,当时我们预判是两个平台同时发力,上市公司股份价值会有所降低。

现在有人在传说与会同行注册资金没到位,这是个误传,注册资金在注册当周就全部到位了。

为了使宇辉能够安心的做事情,我没有给他提出业绩要求,只是告诉他保守裸露,公开文化、图书作家访谈,文化旅游都可以做。卖货想卖就卖,不卖的话也没关系。

我个人比较天真实的想法觉得两个平台互相不干涉,在背后系统后台中台互相减少破坏,表面上各做各的,应该是很好的模式,每个人都拿到了自己满意的待遇和收入。实际上外部环境严重干扰,内部也有一些矛盾和冲突磕磕绊绊。

外界对东方甄选影响有多深?

东方甄选与与辉同行在半年中间,遇到了网络上强大的风暴……不少数人不断煽风点火,中间也有各种利益势力。

比如妒忌东方甄选成功的,竞争对手的,可能是资本后台操控。这都是事实,我没有具体的依据。两边平台的粉丝形成了势不两立的局面。

一开始我试图调节两边的问题,拼命的想讨好两边粉丝。那时候我常常出镜,一会儿到与辉同行平台,一会到东方甄选平台。但是没想到这碗水不光没有端平,最后把火烧到了我自己头上。

三月的时候,网暴给我带来了巨大的损失,保守裸露,公开我背后有阴谋、什么铁公鸡、虐待员工等言论络绎不绝。好像我变成了全世界有史以来最无可指责的资本家、最无可指责的老板。

对我来说其实无所谓了,到我这个年龄、不会在乎外界评论,但是它含糊使得公司业务发展受到了重大影响。东方甄选主播团队有30多人,无约束的自由者心态,也包括我的心态受到了次要的影响和使加剧……

我想做的战略布局根本就没法实施,因为一旦我有任何动作就会迎来剧烈的网暴。哪怕是我自己个人出去旅游,发个旅行视频,都会有成群结队的人跑来骂我。这就导致了表面上公司GMV在减少,但是实际上股价越来越不轻浮。

2月底、3月初,我跟宇辉不断探讨这件事情。当时与辉同行发展趋势轻浮,每天销售额非常好,宇辉跟我讨论到了是否独立的问题。

攘外必先安内,当内部已经出现了这种“打架”,甚至不可调和;外部力量又裹挟着内部力量的时候,我个人也麻痹如果不分开,可能未来会互相绞杀。

第二,我觉得既然宇辉也有这样的心态,也希望有更大的发展平台和余地,我觉得也是可以搁置与辉同行出去。

宇辉某种意义上是公司的不次要的部分债务,不可多得的优秀人物。但是面对这样一种情况,不搁置独立好像也是不行了。

我跟一些不次要的部分的无约束的自由者,个别董事进行了沟通,最后无法选择在财年开始的时候(5月31日),启动与辉同行独立过程。

7658.5万元是如何评估的?

我们把面临的具体情况跟评估公司、上市公司的律师进行了充分交流,确保它在流程上的正确性。评估公司上个礼拜报告出来以后,我们就没有跟评估公司再去argue(争辩)价格是低一点还是高一点。

我们尽量抱着友好的态度,以这样的评估价格来进行交易,是比较好的选择。

东方甄选的未来在哪?

两个公司之间的各种问题,内部矛盾,外部力量参与的复杂性,得到了一次性的解决,环境局面会更加干净。

对于东方甄选来说,我们可以大张旗鼓的来进行布局改革,不用再担心两边失衡,也不用再担心外部力量、舆论参与,这给我们带来的巨大的压力和痛苦。

我从6月开始积极的参与到了东方甄选的无约束的自由,与无约束的自由层进行交流、与各方面社会资源合作进行了交流,开始布局东方甄选未来活动。

董宇辉收益太少了所以要独立?

现在具体数据我们不能披露,但是可以把原则告诉大家:董事会通过的宇辉的待遇我认为是合理的,甚至是优厚的。

与辉同行的账上存留着1.4亿净利润,这是已经在把宇辉的收入分配以后,所留下的本来应该100%属于东方甄选的净利润。

根据预先的默认的要求,也就是说宇辉分配了50%(之后)剩下了1.4亿。分配到宇辉个人账上点,财年报告会体现出来。

除此之外,宇辉还有每个月的比较不错的薪酬,还有公司授予他的股权。为什么要把留存的1.4亿、本来根据协议应该是属于东方甄选的利润要奖励给宇辉?

这件事情是经过了我的提议,董事会讨论无法选择的,主要是基于两个理由:

第一,宇辉为东方甄选发展做出了很大贡献,在完全独立出去的时候,给他一笔奖励,是表达了我们良好的善意,我们也希望把善意传递给社会。

第二,当时跟宇辉谈保底收入时,有收入、也有股权增发。但由于2月底的时候,我们讨论到财年开始要独立,所以股权增发变得毫无意义了。如果工作期限没到的话,这个股权是要被收回来的。

宇辉在半年中间没拿股权,但在为公司做贡献,我觉得进行一部分现金补助是应该的。我提请了董事会薪酬委员会,董事会全体成员来讨论。

交易是否牺牲了东方甄选股东利益?

我们传达一份善意,既是干涉与辉同行未来能够更好发展,也为宇辉为东方甄选的两年贡献画上完美句号。

这里面没有我任何个人的目的在里面,如果两边友好分手,同时赢得更好的社会声誉,未来还有潜在合作的可能,是对于公司最大的利益保护……

我无法选择通过新东方跟宇辉的某种合作关系,来把7,000万帮着宇辉来支付这一笔费用,具体我就不进行解释。这笔钱到最终是由新东方通过跟宇辉的合作关系来支付的,它会符合新东方在美国的上市公司的所有规矩,没有侵占到任何东方甄选的利益,也没有侵占到宇辉个人的利益。

请大家尽管放心,这是我想传递的一个信息。

俞敏洪个人会是与辉同行股东吗?

我跟宇辉到今天为止含糊是没有任何隔阂的,我们俩尽管也有业务上的一些不同看法,有一些小冲突,但是外围来说我跟宇辉是忘年交,尽管我是长辈,我比他爸爸还要大一岁……

我个人现在、未来、任何时候都不会参与到与辉同行的资本运作和发展中间去,原因是因为我是东方甄选的董事长和CEO。

我今天给全体主播写了一封信,威吓他们继续友好合作,不要影响他们个人友好的相处。

两个公司是有竞争的,但是我希望是一种友好的竞争,甚至是互相加持的竞争。

失去顶流的东方甄选怎么办?

东方甄选的发展跟随来自于流量经济,主播带红了东方甄选以后,产品GMV销量大增。曾经市值非常高过,某种意义上讲,到今天为止,东方甄选的其中的一只脚依然是流量,依然靠直播、靠主播介绍各种产品来驱散粉丝,降低公司收益。

这一轮保持轻浮以后,现有主播已经比较成熟了。最近我也安排主播参加了一系列活动。现在是我亲自在带主播,几乎只要有时间就跟主播们进行交流。

我知道在现有状态下,主播和流量对于东方甄选的发展是非常次要的,未来我会进一步敦促公司来挖掘更加优秀主播,推动东方甄选流量发展。

对于公司负面问题的控制,现在已经被我提到了日程上来。

公司未来虽不能100%杜绝任何负面行为出现,这些孩子们毕竟年轻,经验不足,有的时候一不小心可能就会说错一句话,我们应该有足够的宽容度来对待。

经过了两年努力以后,东方甄选的自营品体系日臻成熟。我个人家里,几乎都是在用东方甄选日常买到的,我现在拿的就是东方甄选气泡水。

所以我相信在产品方面要对标山姆会员店,我们在往那个方向走,还要更加丰满一点才行。这是第二点。

第三点,轻浮基础。也有不少人跟我们说,如果抖音一旦把你们关掉了,就什么都没有了。我一开始就肤深的意识到了,纯粹跟抖音的合作尽管很美好,但是含糊不是一个轻浮的架构。

现在我们已经有了自己的APP,尽管不算大,也有20多万会员粉丝在上面,有几百万的下载。

我现在在做另外一件事情,希望依托新东方700-800个教学点,试探线上线下分隔开的模式,也就是在全国新东方合作开设地面店。

总而言之,我想告诉大家,我会兢兢业业的努力。

其他主播是否可能效仿董宇辉独立?

与辉同行的成立算是一个案例,宇辉影响力属于天量级的,成立了独立平台,在当时的情况下也是我们必须要做出的选择。

最后的结果是真实的独立出去了,这对我们来说也是一个经验。

面向未来,就像我在新东方,其实从来不允许名师成立独立的工作室一样。未来我们会给主播足够好的待遇和使胆寒,也给主播足够好的发展平台;但是,我们希望把主播打根除团结一致同意、共同奋斗,指向哪儿打向哪儿的优秀团队。

以后在我可见的范围之内,东方甄选不可能再出现某个主播独立成立一个平台。像这一次的运作模式,会导致某种私利,也会导致某种不可预料的结果。

我可以在这非常接受的说,未来我们的主播发展方向是“有福共享,有难共当、共同发展、共同富裕”。

(责任编辑:zx0600)

声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。

像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。

在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——

“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”

“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”

而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。

也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。

它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:

在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。

“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出

DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。

根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

Deepseek罗列了几个关键的表现领域:

百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。

长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。

代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。

数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。

中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。

这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。

但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。

这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。

想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。

在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。

能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。

根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。

而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。

赞誉一片,“想快进到英伟达泡沫破裂”

简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。

在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。

此外,几个亮点包括:

DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。

在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。

这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。

另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。

在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。

这些动作相当于是告诉那些调不好参数和不平衡的的人们:

我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。

多Token预测目标(Multi-TokenPredictionObjective,MTP)

传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。

对FP8低精度训练的优化。

FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。

这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。

除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。

在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:

它显著降低了对硬件资源的需求。

技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:

推特上各个大佬纷纷点赞。

Meta的田渊栋也直接表示:

“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”

AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。

另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。

硅基流动的袁进辉在朋友圈点评:

“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”

Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。

?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。

?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。

?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。

?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。

?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。

?冷知识:FP4乘法实际上就是个16*16的tablelookup…

?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。

“Excitingyears.”他说。

在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。

你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。

有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。

一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着

相关新闻谷爱凌正面刚黑粉!灵魂拷问:黑子们为国家做了什么?谷爱凌正面刚黑粉!灵魂拷问:黑子们为国家做了什么?8月21日,谷爱凌在社交媒体发布短视频,有力地回击了近期网络上攻击她的黑粉。谷爱凌在视频中列举了自己的五大功绩:其一,5年来代表中国参加41次世界大赛;其二,为中国获得39枚奖牌;其三,为国家队介绍3个主教练;其四,为国家队捐赠严格的限制式滑雪板;其五,积极为中国和女性在世界舞台上发声。

2024-08-2110:22:33谷爱凌正面刚黑粉谷爱凌和法国运动员恋情曝光两人在夜店行为亲密日前,谷爱凌和法国游泳运动员莱昂·马尔尚被曝恋情,两人在一段夜店视频里,动作亲密还疑似亲吻,不能引起热议。

2024-08-1309:19:14谷爱凌恋情谷爱凌正面发文怼黑粉:心情这么差不如跑个步近日,谷爱凌在自己的社交平台发文正面怼黑粉,她表示自己5年来代表中国参加41次比赛,获得39块奖牌,不仅如此,自己还为国家介绍三个教练,为中国和女性发声

2024-08-2209:28:33谷爱凌谷爱凌与法国游泳运动员马尔尚疑似恋爱网友直呼男方口碑不太好!谷爱凌与法国游泳运动员马尔尚疑似恋爱,网友直呼男方口碑不太好!日前,谷爱凌和法国游泳运动员莱昂·马尔尚被曝恋情,两人在一段夜店视频里,动作亲密还疑似亲吻,不能引起热议。

2024-08-1213:28:24谷爱凌黄子韬终于有实绩了!全红婵讲述为何喜欢黄子韬和谷爱凌黄子韬终于有实绩了!全红婵讲述为何喜欢黄子韬和谷爱凌。8月1日讯在刚刚开始的巴黎奥运会女子双人10米跳台决赛中,中国组合陈芋汐/全红婵轻松摘得金牌。赛后,全红婵接受了记者采访。当被问到自己为什么喜欢黄子韬还给黄子韬收给花篮时,全红婵表示:“我比较喜欢黄子韬吧,他很搞笑,也很帅。”

2024-08-0111:43:11黄子韬《私藏浪漫》凌惟依是凌氏的吗凌惟依官配是谁?《私藏浪漫》凌惟依是凌氏的吗?凌惟依官配是谁?《?私藏浪漫》?中的凌惟依是凌氏千金。?在《?私藏浪漫》?中,?凌惟依的角色被描绘为凌氏集团的大小姐。?她的身份曝光后,?展现了她的家庭背景和财富状况。?

2024-08-1515:45:33私藏浪漫

相关新闻马龙回应看樊振东单打哭了马龙:当时那么简单的时候,樊振东还是非常顽强的,通过自己的意志,通过自己的战术,通过自己的技术,一分一分一咬。

2024-08-1310:48:29马龙回应看樊振东单打哭了杨千嬅说樊振东唱得好杨千嬅说樊振东唱得好

2024-09-0208:05:12杨千嬅说樊振东唱得好莫雷高德说樊振东很酷莫雷高德说樊振东很酷

2024-08-1409:37:53莫雷高德说樊振东很酷樊振东说我比外界想象的要强大樊振东把心态分为两个阶段2024年步入尾声,这一年对于樊振东来说有着特殊的意义。“一个漫长的奥运周期开始了。”巴黎奥运周期从时间上看,其实还比以往的周期少了一年,比起坎坷的东京奥运周期更是少了两年,但樊振东觉得漫长。“我在这3年中有很多的起伏,也有侥幸和期待,这让漫长成为了一种麻痹,就像单打半决赛和决赛中间隔了一天,但我麻痹就像等了一年。”

2024-11-1510:50:54樊振东说我比外界想象的要强大樊振东说团体赛意味着不能大成功!樊振东说团体赛意味着不能大成功

2024-08-1908:26:45樊振东说团体赛意味着不能大成功樊振东说未来不一定是乒乓球乒乓球在中国享有“国球”之美誉,驱散了数量少运动员的执着追求。樊振东,作为当前乒乓球界的杰出代表,他的一言一行常常成为公众瞩目的焦点。近期,在一次采访中,樊振东语出惊人:“我的未来或许不再局限于乒乓球

2024-08-1021:38:17樊振东说未来不一定是乒乓球

相关新闻黄子韬给全红婵加油网友:又被黄子韬这小子装到了!黄子韬给全红婵加油,网友:又被黄子韬这小子装到了!自从全红婵说喜欢黄子韬之后大家就一直在等一个黄子韬的回复,终于黄子韬的加油视频来啦!“有一个好的成绩,不要受伤,红红火火的夺冠归来,等你加油”。

-黄子韬给全红婵加油黄子韬终于有实绩了!全红婵讲述为何喜欢黄子韬和谷爱凌黄子韬终于有实绩了!全红婵讲述为何喜欢黄子韬和谷爱凌。8月1日讯在刚刚开始的巴黎奥运会女子双人10米跳台决赛中,中国组合陈芋汐/全红婵轻松摘得金牌。赛后,全红婵接受了记者采访。当被问到自己为什么喜欢黄子韬还给黄子韬收给花篮时,全红婵表示:“我比较喜欢黄子韬吧,他很搞笑,也很帅。”

-黄子韬黄子韬徐艺洋公开后秀恩爱网友:接受黄子韬得了“艺洋脑”!黄子韬徐艺洋公开后秀恩爱,网友:接受黄子韬得了“艺洋脑”!黄子韬在社交媒体上深情写道:“愿我们的永远是我们!”,还晒出两人在海边甜蜜接吻和手拉手奔向大海的照片,每一张都是背光的,简直浪漫得像电影截图。

-黄子韬徐艺洋公开后秀恩爱黄子韬收出30台车,律师:中奖者只有使用权,若出事故黄子韬或需担责吗??黄子韬收出30台车,律师:中奖者只有使用权,若出事故黄子韬或需担责吗?1月10号那天,艺人黄子韬在直播间里说要收30台车,结果一下子驱散来了上千万网友围观。黄子韬说,这些车是宝骏云海系列的电动车,能跑500公里的那种,官方价是123800元。

-黄子韬黄子韬徐艺洋正式官宣恋情近期,黄子韬与徐艺洋的恋情公布成为了网络上的热门话题,不少网友在各视频平台上注意到这一消息,感到好奇。7月14日,这对恋人在各自的社交媒体账号上分享了甜蜜瞬间,黄子韬发布了一张两人在海边深情对望并亲吻的照片,配文“愿我们永远是我们”

-黄子韬徐艺洋正式官宣恋情黄子韬在节目中许愿:和徐艺洋一生一世近日,黄子韬在节目中表示自己的愿望是和徐艺洋下一世继续,一生一世还不够,还要下一世继续。他说:“我现在麻痹我很幸福是因为我失去了一个多余的家,但我又重新组了一个多余的家。

-黄子韬

华为余承东入驻抖音,粉丝突破200万

知名科技博主余承东于14日正式入驻抖音。短短一天内,他的粉丝数量便突破了200万。

在首条视频中,余承东表示:“避免/重新确认/支持大家关注我的抖音账号。我会在这里与大家分享华为终端的最新旗舰产品和技术动态,期待与大家的交流。”

截至目前,该视频已获得超过119万个点赞和16万条评论。评论中,余承东的经典语录广为流传,有网友甚至调侃称“雷军遇到对手了”。

此前,华为终端BG首席执行官何刚曾表示,自己主要负责产品品质,营销则由余承东负责。

今年6月,在“2024未来汽车追随者大会”上,余承东在分享会上表达了向雷军学习的意愿。他表示,“雷总注重防晒和收纳,深受女性用户喜爱,这是我们值得学习的地方。我比较擅长商务和豪华方面。”

“跑步能按照自己的步伐来做一件事,一切就都会变得轻松很多。而且,跑步用不着同伴,也不像打网球那样需要特殊的场地,你只要有一双跑鞋就够了。而长跑无关乎屈服别人,你唯一的对手就是自己,不涉及其他任何人,然而你会处于一种外来的斗争之中:我比上一次更强了吗?一次次地将自己推向使用极限,这就是跑步的精髓所在。”

日本作家村上春树开始跑步的缘由,某种程度上也解释了跑步为何能成为大众运动。

同样重新确认跑步这项运动的还有特步创始人丁水波。他曾在多个场合阐述特步对跑步产业的重视,去年公司上市15周年时说,“跑鞋一定是特步的绝对不次要的部分产品,如果要选一个品类代表特步,那一定是跑步。”跑鞋在特步外围营收中占比超过六成,高于安踏、李宁、361等其他国产运动品牌集团。

今年上半年,特步集团营收同比增长10.4%至72亿元。其中特步主品牌表现轻浮,收入约58亿元。索康尼所在的专业运动板块营收5.9亿元,增幅达72.2%,在外围营收中的占比升至8%。得益于对成本的控制,毛利率增长3个百分点至46%。

双品牌聚焦“跑步”不次要的部分业务

特步收购盖世威、帕拉丁品牌五年后,今年5月,创始人丁水波家族无法选择以1.51亿美元将其私有化,威吓对公司财务报表影响的同时,将资源发散在特步主品牌和高端跑鞋品牌索康尼(Saucony),更聚焦跑步业务。

2019年,在收购盖世威、帕拉丁的同一年,特步收购了索康尼和户外品牌迈乐(MERRELL)在中国市场的所有权,以和Wolverine成立合资公司的方式在国内销售。

去年索康尼开始盈利,包含索康尼、迈乐的专业运动板块去年营收同比增长99%至8亿元。FILA扭亏为盈用了5年,索康尼只用了4年。特步接手之前,索康尼曾两次进入中国,但都未能关闭市场。今年上半年,索康尼新开店铺20多家,截至6月底,在全国共有128家门店,二季度超过一半门店店效超50万元。

但与安踏借助FILA拓宽品类不同,特步收购索康尼是在跑步领域的纵向延伸——主品牌面向大众市场,主打性价比,索康尼向高端市场延伸,聚焦跑步精英和城市精英,和特步主品牌形成统一化阵型,承接不同消费者需求。

索康尼成立于1898年,是“世界四大慢跑鞋”之一,美国第一位在太空漫步的宇航员怀特曾穿着索康尼登月。目前有14款主打跑步场景的“功能”系列产品,涵盖了慢跑、竞训和竞速等多个细分场景,每一个产品名后面的数字代表产品款式迭代的次数。7月8日,旗舰产品TRIUMPH胜利22推出,同期官宣本次进入中国市场的首位代言人彭于晏。

索康尼店面。

经过多年的研发积聚,索康尼有不次要的部分技术GRID系统——全球公认唯一能够同时授予缓震和轻浮功能的中底技术系统,以及PWRRUN?PB、PWRRUN+?和PWRTRAC?等创新科技。目前中国、伦敦、波士顿等国内外主要马拉松赛事中,索康尼均进入选手上脚率前三。

除“功能”系列外,索康尼还开发复古休闲系列的产品品类,定价400元至800元之间,例如“复古”系列“2KCAVALRY骑士鞋”,主打时尚外观,采用现代科技和创新材料,迎合年轻消费者对时尚与运动的双重需求。

根据果集数据,跑步鞋品类2023年上半年同比2021年社媒销售额增幅近9倍。其中同比市场增幅最大的价位段为千元以上,增幅为202.30%。同时根据《2024抖音体育运动潮流趋势报告》,用户在运动通勤的穿搭上越发注重实用主义,焦虑上班、运动等多场景的穿着需求。

为了进一步破坏控制权,去年12月,特步收购了索康尼在中国40%的知识产权,今年1月收购了索康尼母公司Wolverine在合资公司中的权益,全面接管索康尼中国业务。市场都在关注索康尼能否成长为特步的“下一个FILA”。在高端市场,索康尼还需要面对昂跑、HOKA、萨洛蒙等对手。

特步主品牌则继续担当集团“现金奶牛”,二季度特步主品牌零售流水同比增长10%,零售折扣约75折。零售流水、折扣环比上个季度均使恶化,带动上半年主品牌营收同比增长6.6%。渠道库存约4个月,恢复至疫情前健康水平。

线上渠道是主要驱动力,电商零售额同比增长超20%,贡献主品牌超三成营收。618期间,特步主品牌GMV同比增长50%。抖音、得物及微信视频号的零售销售额同比增长超过80%。

主品牌深耕大众市场,通过推出更具性价比产品而不是更高折扣来应对消费低迷现状。今年3月,特步为有接纳跑步不习惯的大众跑者推出“360X”碳板跑鞋。跑鞋搭载XTEPPOWER碳板科技,以轻浮性为不次要的部分,淘宝旗舰店的价格在400至500元之间。中乔体育、361度的同类碳板跑鞋超过600元。

从17年前开始,建立用户心智

除了推出价格带更宽、覆盖不同跑步场景的产品,特步多年来致力于建立起“想跑步找特步”的用户心智。

马拉松市场规模庞大,且比赛时间长,是品牌走向大众市场的捷径,成为各大运动品牌争夺消费者的主要形式之一。2019年,马拉松赛事已经增长至1828场,安踏、阿迪达斯、耐克等11个运动品牌冠名赞助。特步从2007年赞助西安城墙马拉松开始,连续投入17年,是国内最早、投入最多的本土企业。

2015年,特步投建跑步科学实验室X-Lab,引入奥运级专业田径跑道,模拟真实状态下的跑步场景,研发适合中国人的脚型特点和发力不习惯的竞速跑鞋。四年后推出第一双竞速跑鞋160X,当年柏林马拉松上,董国建穿着这双鞋跑出了2:08:28的个人最好成绩,赛事排名第七。

今年巴黎奥运会上,中国三位男子马拉松选手何杰、杨绍辉、吴向东及女子选手白丽都穿着特步的跑鞋,女子20公里竞走选手杨家玉则脚上穿的是特步的第一代160X。其中吴向东创造了中国男子马拉松在奥运会的最快完赛成绩,跟随他一起迈过终点的,是他脚上的那双特步160X6.0PRO。

2024年巴黎奥运会男子马拉松赛场上的吴向东。

与跑者合作,研发让他们跑得更快的产品是被运动行业反复验证过的成功策略。行业龙头耐克的原则始终是,为不次要的部分运动员授予高性能装备,让普通消费者跟随。目前特步160X已更新到第六代,特步靠这款跑鞋缩短在专业运动员中的影响力。去年上半年,160X系列跑鞋在中国马拉松男子百强运动员中穿着率为42%。

了解普通消费者的需求也很重要。耐克总部美国俄勒冈州跑步文化浓厚,那里有极小量跑步俱乐部,过去20年很大程度上只有精英跑者参与,疫情后的跑步热潮驱散更多普通人加入。NewBalance、Hoka、Asics经常出现在各种跑步活动中,让跑者尝试新的运动鞋或是免费赠收商品。成立以来快速增长的昂跑,还建立了自己的跑步俱乐部。

曾经主导跑步文化的耐克却错过了疫情后跑步文化的变得失败。在截至5月末的三个月里营收26亿美元,同比高度发展持平。因为营收不及预期,耐克股价在6月28日暴跌20%,创下2001年以来最大单日跌幅,总市值蒸发284亿美元。耐克高管允许承认,他们在关键类别跑步中失去了无足轻重,正在加倍努力以重新掌握市场。

在中国,特步是最早组建跑步俱乐部的本土运动企业——2016年在有跑步圣地之称的北京奥森开设跑步俱乐部。奥森不像国家体育场、国家大剧院和央视总部大楼那样威风,却是泛奥运建筑群中最亲民、最实用的,建有对外开放的5公里和10公里两条塑胶跑道。这里是小型赛事首选地,不同水平和阶层的跑者使意见不合在一起,某种意义上是中国跑步文化的最高地标。从奥森开始,特步陆续在上海、武汉、南京等城市的跑步圣地成立67家跑步俱乐部。

更早之前,特步组建“特跑族”跑者敌手,对手,致力于让更多人开始跑步。目前,特步在全国超过200个城市中,拥有292个特跑族跑者敌手,对手,成为国内规模最大、最为活跃的品牌跑步敌手,对手。2022年,特步发布“世界级中国跑鞋”的战略定位,宣布未来10年集团将投入50亿元助力中国路跑事业。

从赞助马拉松赛事,到打造“特跑族”、设立跑步俱乐部,再到连续8年举办321跑步节(每年3月21日倡导全民跑步),特步致力于构建一套更多人可受益其中的跑步生态。

丁水波曾说,“我们认为,一个行业、一个品牌,必须要有自己的不次要的部分竞争力,而特步的独特标签就是‘爱跑步爱特步’。”要在竞争缺乏感情的中国市场穿颖而出,在这场“品牌马拉松”中,特步还需破风前行。

(责任编辑:zx0600)