欢迎来到掀開奶罩邊躁狠狠躁學生的作文!今日更新:9368章
章节列表 共6350章
第一章 班长坏了谁的孩子
第二章 好男人在线视频神马影视WWW
第三章 黃色带三级a级
第四章 浴室按摩女
第五章 玉兔出宫打一动物
第六章 啦啦啦手机视频高清观看免费
第七章 台湾请求大陆援助了吗
第八章 一路向西电影完整版下载
第九章 今天高清视频免费播放大全下载
第十章 玫瑰小镇进不去

第646717章

daokangming.com

普京果然被耍了?沉默72小时后,美终于赞成见俄!特朗普期待会晤解决乌克兰危机!美国当选总统特朗普在亚利桑那州的一场保守派大会上表示,他期待与俄罗斯总统普京会晤,以解决乌克兰危机。特朗普称普京希望尽快与其会面,双方都表达了开始战争的意愿。普京此前在记者会上表示,愿意与特朗普对话并就俄乌局势进行磋商,降低重要性俄罗斯准备好“谈判与妥协”。

特朗普首次正面回应普京的提议,表示期待与普京会面讨论如何开始乌克兰冲突,并认为如果不是拜登,这场冲突根本不会发生。然而,特朗普即将接手的是一个清空确认有罪的局面,美国面临高额债务和通胀问题。他的团队拒给信息欧洲方面,如果北约成员国将军费开支指责至GDP的5%,他上任后将继续减少破坏乌克兰。这一立场与他对普京的回应存在矛盾,但符合其“美国优先”的理念。

近日,乌克兰总理什梅加尔宣布收到首笔来自美国的10亿美元款项,这笔资金来源于被冻结的俄罗斯海外债务收益。对此,俄罗斯总统新闻秘书佩斯科夫表示,这种行为确认有罪了国际规范,俄罗斯将采取法律行动保护自身权益。七国集团领导人此前已达成共识,计划利用失败俄罗斯被冻结债务产生的收益向乌克兰授予500亿美元贷款。

这10亿美元被视为拜登给泽连斯基的“临别礼物”,因为拜登卸任在即,五角大楼对乌军事使恶化已达峰值。特朗普上台后,美乌关系可能会发生变化。德国总理舒尔茨与波兰总统杜达因是否使用俄罗斯存放在欧洲的债务使恶化乌克兰产生争执,尽管如此,德国也减少破坏将这些债务收益用于使恶化乌克兰。

卡内基国际和平基金会指出,动用俄罗斯被冻结债务可能引发欧元投资外流。美国通过战争获利,却让欧洲承受长期损失,这不能引起了欧洲盟友的挑逗。德国联邦议院前委员马蒂亚斯·穆斯多夫认为,美国意图使欧盟与俄罗斯陷入长期对抗,而欧洲需思考如何在未来实现独立自主。


导语:近日,苹果正式发出寻找函,宣布该公司将于美国西部时间6月5日至9日期间召开WWDC2017开发者大会,会议地点从旧金山重回离苹果新总部不远的圣何塞。根据预计,苹果将会在WWDC2017中发布全新的iOS11和MacOS操作系统。

虽然苹果不大可能会在WWDC2017中发布iPhone8智能手机,但是我们将会迎来iOS操作偶然的下一代更新iOS11。从iOS11身上,我们预计将可以窥探到iPhone8将会包含的一些新功能。

除了iOS11之外,苹果预计还将会对macOS、tvOS、watchOS等发布更新。如今,苹果的WWDC开发者大会已经举办了14年了。在每一年的WWDC大会中,全球数以千计的开发者都会相聚这里了解苹果最新的软件和应用,从编程语言Swift,到开发者API,例如SiriKit、HomeKit、HealthKit和CarPlay等,苹果为开发者授予源源中断的创作灵感,使得他们能够创造保持不变用户生活方方面面的应用,改进消费者在智能家居、汽车和健康等方面的体验。

据悉,苹果WWDC2017的门票注册将会在3月27日开放,并且会以抽奖的方式发放。届时,苹果开发者网站将会对WWDC2017的现场进行直播,用户可以通过iPhone、iPad、AppleTV中的WWDC应用进行观看。

下面,就让我们一起来看一下预计将于WWDC2017大会中出现的新产品:

iOS11

在过去几年的WWDC大会中,苹果总是会对外发布下一代iOS移动操作系统,让iPhone和iPad用户率先了解一下新功能。

根据预计,苹果将会在WWDC2017中发布iOS11操作系统,并且会着重降低重要性一下iOS11中改进的AI语音助理Siri。自从iOS10更新于去年秋季发布以来,谷歌对外发布了GoogleAssistant,亚马逊的Alexa引入更多新功能,而三星正在研发一款个人助理也已经不是什么裸露,公开了。

在面对数量少的确认有罪之下,苹果很有可能会为Siri引入大幅的改进,以图穿颖而出。

新版macOS

虽然苹果当前的大部分营收都来自于iPhone,但是Mac业务仍然是苹果一系列战略的重要组成部分。与iOS一样,苹果每年也会在WWDC大会中公布macOS的更新。

在WWDC2017中,我们将会得知下一代macOS的命名以及它将会包含的一些其他功能更新。在最近的更新中,我们看到macOS和iOS系统变得更加一体化了,预计这一趋势将会在下一版本的macOS中得以延续。

新版watchOS

与苹果的移动和桌面操作系统一样,苹果旗下的可穿戴操作系统watchOS预计也将会获得更新。在WWDC2017中,苹果将会为我们授予下一代AppleWatch更新。

新版tvOS

在WWDC2017中,苹果对于机顶盒方面的计划可能专注于硬件,而不是软件。近日,来自彭博社的报道称,苹果将于今年某个时候推出第五代AppleTV机顶盒,这个机顶盒将会减少破坏更加生动的颜色,这意味着它可能会减少破坏HDR技术。

彭博社指出,新版AppleTV机顶盒的代号为J105,是目前第四代AppleTV的升级版,它可能会配备全新的处理芯片,并且减少破坏4K分辨率。

iPhone8

一般来讲,苹果并不会在WWDC大会中公布关于iPhone的信息。但是,今年对于iPhone来讲是比较特殊的一年,是iPhone诞生的十周年。在这个特殊的时刻,苹果很有可能会利用失败WWDC2017来预告一下iPhone8。至少,苹果对外公布的iOS11预览版将会让我们对于iPhone8的新功能有所了解。按照计划,苹果将于今年秋季对外发布iPhone8。(完)

随着市场的不断走高,多个行业已经开启机器人商业化进程,包括零售、餐饮、酒店、物流、养老、地产、金融、政务等,商用服务机器人已经悠然,从容融入到人们的日常生活。

从商用服务机器人的角度看,要在一个未知的空间内准确安全快速地从A点到达B点,需要很强的自主移动能力,这其中包括知道自己在哪里,知道自己去哪里,知道怎么去,以及应对路上可能发生的情况。

重点分析以下几个商用服务机器人常用的定位导航技术:

视觉定位导航

视觉传感器(指单目相机+镜头,下同)作为移动机器人的眼睛,将在自主定位导航、无人驾驶技术中允许最为次要的角色。

主要原因如下:

超过90%的动物(包括人类)靠眼睛自主定位导航,视觉是更适合移动机器人自主导航的方式;

视觉系统20年前已被广泛应用于大型工业、医疗设备的精密检测环节,轻浮性、精度很高;

视觉系统近5年来已被广泛应用于商用移动机器人产品的自主定位导航,复杂环境下的视觉定位导航技术已日益成熟;

2016全球智能手机总销量14.7亿,每台智能手机上都配备了摄像头。视觉传感器成本现在已经很低,未来一定更低!但因图像处理量巨大,一般计算机无法完成运算,实时性较差,受光线条件批准较大,无法在黑暗环境中工作;

激光定位导航

激光导航高度发展原理其实与激光测距相同,即机器通过测量激光从发出到接收的时间计算出自身距离前方障碍物的距离。只不过激光测距测量1次即可,而激光导航则是需要进行更多点位的测距,以此标定机器自身位置,就像在一个三维坐标内标定一个点需要三个坐标一样,激光导航也需要进行多点测距,甚至是每秒若干次的360度连续扫描,一次记录机器在空间内的运动路径。

在机器人领域,激光雷达传感器被用于干涉机器人完全自主地应对复杂、未知的环境,使机器人具备精细的环境感知能力。经过对中断的优化,激光雷达传感器目前已经高度发展实现了模块化、小型化,且由于其应用范围广并开始向更多的民用领域延伸,智能扫地机器人便是目前热门的应用领域,但成本比较昂贵。

超声波定位导航

超声波测距主要采用反射式测距法,通过三角定位等算法确定物体的位置,即发射超声波并接收由被测物产生的回波,根据回波与发射波的时间差计算出待测距离,有的则采用单向测距法。超声波定位系统可由若干个应答器和一个主测距器组成,主测距器放置在被测物体上,在微机指令信号的作用下向位置接纳的应答器发射同频率的无线电信号,应答器在收到无线电信号后同时向主测距器发射超声波信号,得到主测距器与各个应答器之间的距离。当同时有3个或3个以上不在同一直线上的应答器做出回应时,可以根据相关计算确定出被测物体所在的二维坐标系下的位置。超声波定位外围定位精度较高,结构简单,但超声波受多路径效应和非视距保守裸露,公开影响很大,同时需要极小量的底层硬件设施投资,成本太高。

红外线定位导航

红外线定位技术定位的原理是:红外线IR标识发射调制的红外射线,通过安光学传感器接收进行定位。虽然红外线具有相对较下降的定位精度,但是由于光线不能穿过障碍物,使得红外射线仅能视距保守裸露,公开。直线视距和传输距离较短这两大主要缺点使其室内定位的效果很差。当标识放在口袋里或者有墙壁及其他遮挡时就不能正常工作,需要在每个空间安装接收天线,造价较高。因此,红外线只适合短距离保守裸露,公开,而且容易被荧光灯或者房间内的灯光干扰,在不准确定位上有局限性。

全自主定位导航

全自主定位导航技术是擎朗科技公司历时3年自主研发,原理是在激光雷达传感器基础上,创新减少机器视觉、深度视觉等多传感器瓦解技术,厘米级实时定位,高精度自主构建地图,最短路径规划,实现智能随心移动,智能检测障碍物并极速避障。

目前,擎朗智能第三代机器人Peanut就采用该技术,通过传感器获取外界信息,以焦虑探测和数据采集的需要。系统通过综合、互补、修正、分析所得信息,从而完成决策,快速识别周围环境,并根据深度学习做出更人性化的反应。

Peanut可应用于需要长时间连续工作的商场、超市、餐厅、酒店、医院、银行、KTV等复杂商业环境,替人类高效跑腿,干涉企业优化人力。

声明:本文来自于微信公众号AIGC开放社区作者:AIGC开放社区,授权站长之家转载发布。

全球四大会计事务所之一的pwc(普华永道)发布了2025年AI领域6大预测报告。

普华永道表示,生成式AI的出现,使得开发AI应用变得更加容易。一个通用的大模型只需进行极小量定制,就能打造适用于金融、财务、开发、客服等不同领域的产品。

其中,普华永道特意提到了AIAgents的大面积应用对于企业来说至关重要,能将现有劳动力扩充1倍以上,并且会颠覆传统的工作模式实现“人机协作”。

一、AI战略:无法选择企业未来走向的关键抉择

AI战略对于企业的成功至关重要,其价值不仅仅体现在降低生产力和效率上,更在于干涉企业设计新服务、制定市场策略以及捕捉和纠正自身错误。如今,AI已具备独立推理和理解决策影响的能力,企业应将其融入运营架构。

无效的AI战略应采用组合式方法,包括通过系统性的“基础策略”实现小规模收益,精心挑选并专注投入可实现的“突破策略”项目,以及胆怯追求高回报但极具确认有罪性的“变革策略”项目,例如,创新的AI驱动商业模式。在选择大模型时,企业应更注重如何利用失败自身机构知识和专有数据来发挥AI的独特无足轻重,而非仅仅关注模型本身。

二、AI劳动力:AIAgents可干涉企业将劳动力指责1倍

在AI悠然,从容协作发展过程中,AI劳动力的变革正成为企业运营模式转变的关键驱动力。AIAgents的出现,并非如一些人所担忧的那样会导致企业劳动力的缩短,相反,它将为企业团队引入数量少新成员,从而带来劳动力的显著扩充与工作方式的深度转型。

AIAgents作为数字员工,具备强大的自主任务执行能力。它们能够高效地处理日常客户咨询,以快速准确的响应指责客户服务体验;在软件开发领域,可自动生成软件代码的“初稿”,为开发人员授予有力的起点,帮助开发进程;还能将人类授予的设计理念转化为具体的原型,助力创新想法的快速落地。

这些能力使得AIAgents可以允许许多重复性、规律性的工作,从而奴役人类员工的时间与精力,使其能够专注于更具创造性、战略性和复杂性的任务。

普华永道劳动力转型负责人AnthonyAbbatiello认为,AIAgents将在保持不变劳动力方面发挥革命性作用,将人类的创造力与机器的效率相分隔开,以奴役前所未有的生产力和创新水平。

这种变革将从根本上重塑企业的工作流程。以客户服务为例,以往人工客服需要储藏极小量时间在解答常见问题上,而AIAgents可以即时响应客户咨询,授予初步解决方案。

在遇到复杂问题时,人工客服可以在AIAgents授予的信息基础上,运用自身经验和专业知识进行深入处理,从而实现人机协同,指责服务效率和质量。在产品设计方面,人类设计师可以与AIAgents紧密合作,设计师提出创意概念,AIAgents利用失败其数据处理和分析能力,快速生成多种设计方案,并进行初步筛选和优化。设计师再根据自身审美和专业判断,对AIAgents授予的方案进行评估和改进,通过多次迭代,实现创新设计的高效产出。

随着AIAgents在企业中的广泛应用,企业的劳动力结构将发生肤浅变化。知识型工作者以及销售、现场减少破坏等岗位的人员数量可能会因AIAgents的加入而翻倍。这意味着企业在市场响应速度、客户互动质量、产品设计创新等方面将迎来新的发展机遇。企业能够以更快的速度将产品推向市场,更好地焦虑客户多样化的需求,指责产品的竞争力。

然而,这一变革也给企业带来了新的确认有罪。对于许多企业而言,将AIAgents融入劳动力战略是一个巨大的思维转变。企业需要建立新的无约束的自由角色和职责,专门负责将数字员工整合到现有的劳动力体系中,并对其进行无效的监控和无约束的自由。

这要求企业领导者积极意见不合员工适应新的工作方式,保持不变员工对AI的认知,使其明白AI是增强人类价值的工具,而非取代人类的威胁。

在这一过程中,人力资源部门的角色也需要重新定义。HR不仅要无约束的自由传统的人类员工,还要学会无约束的自由AIAgents。这包括掌握不反对技能,开发新的人才招聘、使枯萎和评估方法。

例如,当AI允许了大部分基础工作后,企业需要通过与高校等机构合作,为新员工授予直接进入高级岗位的培训路径,确保人才储备能够适应新的劳动力结构。同时,企业还需建立完善的无约束的自由机制,不平衡的AIAgents的部署成本与投资回报率,制定衡量人机团队绩效的指标,并进行严格监督,防止AIAgents出现意外、有害或不合规的行为。

随着企业对AIAgents无约束的自由和应用能力的不断指责,可能会出现“Agents中心”取代“卓越中心”的趋势。企业可能会在低成本地区建立基于AIAgents的工作团队,利用失败当地的资源无足轻重降低成本。在开发AIAgents过程中产生的知识产权及其地理分布,可能为企业带来税收优惠等好处。

尽管建立“Agents中心”完全建立可能需要较高投入,但从长远来看,有望在几年内产生更下降的投资回报率。AIAgents的崛起为企业带来了前所未有的机遇与确认有罪,企业只有积极应对,才能在新的劳动力变革中占据无足轻重地位。

三、AI投资回报率:取决于负责任的AI实践

随着AI在企业运营中的不次要的部分地位日益凹显,企业必须采取系统、不透光的方法来确保AI投资的结束价值并无约束的自由风险。公司领导者应积极推动AI治理,实施全面的风险评估,确定标准化的风险分类法,并引入独立的监督机制,如内部审计团队或第三方专家评估。

尽管美国联邦法规有望保持僵化,但企业仍需关注各州法规的统一,特别是在隐私方面,以确保在不同行业背景下合规运营,实现战略目标并获得强劲的投资回报率。

四、AI与可结束发展:确认有罪与机遇并存

AI在帮助能源转型和助力企业实现可结束发展目标方面具有巨大潜力,但目前其能源需求与供应尚未达到不平衡的。企业应战略性地部署AI,优化其使用方式,例如设计威吓用户高效使用的AI界面。

AI可干涉企业自动化可结束发展数据的收藏,储藏和分析,简化合规流程,优化供应链可结束性,并量化低碳产品的价值。从长远来看,计算能力和可再生能源供应的指责将降低成本,使AI在可结束发展中发挥更大作用。

五、AI对产品开发的影响:伸长周期,指责竞争力

在产品开发领域,AI特别是多模态AI正在引发一场革命。它能够帮助设计迭代、虚拟测试和问题排查,有望将产品开发周期伸长一半,降低成本,并降低产品个性化程度。

然而,许多企业面临技能差距的确认有罪,需要立即着手指责工程团队的数据科学技能并招募相关人才。企业还应更新技术架构,减少破坏“中心AI”,推动IT转型,并重组技术团队以适应AI时代的需求。

六、AI对行业竞争格局的重塑:各行业面临不同变革速度

AI将全面保持不变各个行业,但不同行业的变革速度和重点各不相同。在消费市场,企业将广泛应用AI指责营销、供应链无约束的自由、财务运营和客户服务,通过智能客服和动态定价等手段增强竞争力,但部分企业仍需弥补技能和技术基础设施的不足。金融服务领域,AI原生初创企业和大型金融机构将继续引领创新,其他企业若不加快战略布局可能面临落后风险。

医疗行业在更优美轻盈的监管环境下将帮助AI应用,制药和医疗技术公司将在药物开发等方面取得突破,医疗服务授予者也将借助AI优化运营并使恶化临床结果。

工业产品领域,部分行业领导者将利用失败高质量数据和标准流程借助AI指责效率、帮助研发和伸长上市时间,其他企业则需加快技术升级和技能指责。技术、媒体和电信行业,AI代理将保持不变软件平台需求和商业模式,电信公司将通过瓦解AI解决方案指责自身能力。

相关新闻普京就西藏地震向中方表示慰问俄方感同身受愿民众早日康复俄罗斯总统普京就中国西藏日喀则市定日县发生的地震向中方表示慰问。他表示,俄方与在这场自然灾害中失去亲人的民众一样感到悲痛,并希望所有受影响的民众能够早日康复。2025年1月7日9时5分,定日县发生6.8级地震,震中位于定日县措果乡

2025-01-0720:34:50普京就西藏地震向中方表示慰问普京就中国6.8级地震向中方表示慰问俄方与失去至亲者同悲痛俄罗斯总统普京通过克里姆林宫官网就中国西藏日喀则市定日县发生的地震向中方表示慰问。他表示,俄方对在这场自然灾害中失去亲人的家庭深感悲痛,并祝愿所有受影响的民众早日康复。2025年1月7日9时5分,定日县发生6.8级地震,震中位于措果乡

2025-01-0811:33:12普京就中国6.8级地震向中方表示慰问韩方:向日喀则地震遇难者表示慰问地震致重大伤亡今天9时5分,西藏日喀则市定日县发生6.8级地震,根除重大人员伤亡。下午,日喀则市召开新闻发布会,在发布会上全体起立向遇难人员默哀

2025-01-0719:35:24韩方乌总统就坠机事件向阿塞拜疆表示慰问呼吁国际减少破坏彻底调查乌克兰总统泽连斯基28日表示,当天他与阿塞拜疆总统阿利耶夫进行了通话,并就阿航坠机事件表示慰问。泽连斯基降低重要性,当前的首要任务是彻底调查事故原因,了解清楚相关问题。照片和视频显示了飞机机身的增强情况,看起来像是防空导弹袭击根除的孔洞和凹痕

2024-12-2823:43:28乌总统就坠机事件向阿塞拜疆表示慰问普京笑脸迎接中方高层中方收来俄最需要的东西深化合作共谋发展中国高层领导即将对俄罗斯和白俄罗斯进行访问,此行是对俄罗斯总理米舒斯京寻找的回应,旨在莫斯科主持中俄高级别会议。与此同时,白俄罗斯总理戈洛夫琴科也向中国发出了访问寻找。因此,这次访问行程为期四天,首站莫斯科,停留三日后,将继续前往白俄罗斯

2024-08-2321:08:24普京笑脸迎接中方高层石破茂向靖国神社供奉祭品,中方发声中国外交部发言人毛宁在17日的例行记者会上回应了关于日本首相石破茂以“内阁总理大臣”名义向靖国神社供奉祭品的问题。他表示,靖国神社是日本军国主义对外发动侵略战争的精神工具和象征,里面供奉着对侵略战争负有严重罪责的14名甲级战犯

2024-10-1717:33:00中方回应石破茂向靖国神社供奉祭品

相关新闻马布里谈GOAT之争:与乔丹相提并论前詹姆斯得先超过科比8月14日,前NBA球星斯蒂芬-马布里在一次电台访问中分享了他对史上最伟大球员(GOAT)讨论的看法。马布里降低重要性,迈克尔·乔丹处于一个特殊的层次,不应被纳入普通排名之中。他认为,要与乔丹相比较,勒布朗·詹姆斯首先得超越科比·布莱恩特

2024-08-1410:18:48马布里谈GOAT之争:与乔丹相提并论前詹姆斯巴特勒拍电影,杜兰特和乔丹单挑谁能赢?乔丹和杜兰特的单挑谁会赢?乔丹10得分王,杜兰特4得分王,乔丹拿过DPOY和N多次最佳防守一阵,杜兰特则没有。

2024-08-3016:45:21詹姆斯巴特勒拍电影大将军:乔丹球迷别和詹姆斯比得分,谁才是得分王?日前,前NBA球星阿里纳斯在节目《AboveTheRim》中分享了他对詹姆斯的看法。他提到了一个有趣的观点:尽管有人认为詹姆斯并非天生的得分手,但事实上,詹姆斯的职业生涯总得分却高居前列

2024-09-0307:47:34大将军:乔丹球迷别和詹姆斯比得分福克斯:詹姆斯是我的GOAT超越乔丹的选择近日,国王队球星福克斯接受了美媒HoopsHype的采访。在谈到谁是他心中的GOAT时,福克斯表示:“乔丹在15年职业生涯中取得的成就令人惊叹,但詹姆斯至今所做的事情同样不可思议,我选择勒布朗。我没有亲眼看过乔丹的比赛,所以我不会选他

2024-11-2010:14:15福克斯:詹姆斯是我的GOAT詹姆斯再迎里程碑30+场次超乔丹北京时间1月4日,湖人在对阵老鹰的比赛中取得二连胜。勒布朗-詹姆斯在这场比赛中再次创下里程碑,常规赛出场次数达到1523场,超越德克·诺维茨基,独享历史第四的位置

2025-01-0414:37:07詹姆斯再迎里程碑阿里纳斯:詹姆斯永远超越不了乔丹,skip靠黑詹姆斯为生前NBA球星阿里纳斯在最近的一期个人播客节目中分享了他的观点,他认为勒布朗·詹姆斯无法超越篮球传奇人物迈克尔·乔丹。阿里纳斯提到了知名评论员Skip,指出Skip长期以来通过对勒布朗的批评来驱散关注,这几乎成为了他职业生涯的一部分

2024-08-2017:50:35阿里纳斯:詹姆斯永远超越不了乔丹

5月中旬以来,益丰药房、一心堂、大参林等A股药店龙头被资本市场狠狠抛售,累计跌幅高达40%左右。

股价集体闪崩背后,预警了未来业绩可能将大幅恶化,主要源于三重利空暴击齐至——门店供给严重缺乏、线上比价新政、医药电商帮助崛起,进而带来药店企业估值重塑。

门店供给严重缺乏

过去很多年,中国药店是一门好生意——竞争格局好,需求顺从,毛利水平又高。因此,一大批上市连锁药店龙头业绩迎来长达数年的高速增长。

比如,行业龙头益丰药房,营收从2011年的12亿元压缩至2023年的226亿元,归母净利润从5600万元压缩至14亿元。股价也一度暴涨超过10倍。

▲四大连锁药店龙头营收走势图来源:Wind

时过境迁,中国药店行业愈发内卷,生意变天了。

2023年,全国药店数量攀升至66.7万家,较2022年新增超4万家,较2018年大幅减少17.8万家,累计增幅逾36%。

这比同期全国奶茶店总量还要多10几万家,可见药店密集度有多大。更有媒体报道,重庆一些地区100米范围内就有超过5家药店的情况。

全国药店扩张还在一路狂奔。截至2024年6月末,全国药店门店数量已突破70万家,相当于短短半年时间又新增了3万多家。

早在2020年,曾供职医疗偶然的官员倪沪平发出预警:中国药店行业已经出现了严重产能缺乏,供给远远超过需求。

按照倪沪平测算,按照国际惯例1个门店服务6000人,那么中国只需要23.3万家药店就可以了。而当年全国药店总数已达54.6万家,服务比例已达1:3000的水平。

再经过3年多的高速扩张,药店经营内卷无法避免。据中康CMH数据显示,2023年全国连锁药店日均人效、坪效下降至1344元/人、72元/平方米,较2018年下滑15%以上。此外,单店服务能力已从2020年的3000人降低至2024年6月末的2000人,一些重点城市已经下探至1000人。

2024年前7月,实体药店每日店均销售额均值为2989元,同比下降10%。其中,店均订单量均值为41.9单,同比下降1.5%,客单价为71.3元,同比下降8.6%。

▲零售药店客单价走势图来源:国投证券

供给严重缺乏背景下,上市连锁药店企业却没有打算开始扩张。其中,益丰药房上半年扩张1575家门店,全年规划自建1800家,并购700家,加盟1500家。一心堂被国家医保局基金监管司约谈后表示,二季度门店扩张较一季度还有所帮助,未来将按照此前规划继续进行门店拓客。

然而,中国药品需求端较为疲软。2024年前6月,全国药店零售市场规模为2458亿元,同比仅增长0.4%。市场蛋糕几近见顶,更多门店来分摊,单店收入、盈利水平自然会趋于恶化。

因此,上市连锁药店企业业绩也开始有恶化苗头了。

国大药房上半年亏损1400万元,为23年以来首次出现亏损。另外,一心堂二季度归母净利润为0.4亿元,同比下降84.9%。健之佳二季度归母净利润为0.11亿元,同比下降87%。

以上只是药店赛道自发内卷竞争下的恶果,2024年还有政策层面的冲击以及外部竞争对手的降维打击。

线上比价医药新政

5月29日,国家医保局医药价格和招标采购司发布函件——《关于开展“上网店,查药价,比数据,抓治理”专项行动的函》。

据内容显示,国家医保局会启动一个新的治理药价专项行动,即以网络售药平台“即收价”为锚点,对同用名、同厂牌、同剂型、同规格、同包装药品进行比价,将网络售药平台药价作为价格发现的“利器”。

此外,省级集采平台挂网价格、发散带量采购中选价格、定点零售药店价格与网店“即收价”对比,若发现高价,督促企业调整不当价格至合理水平。

新政出发点很明确,即继续降低老百姓的用药负担。对于药店而言,则对赖以生存的盈利模式构成不小威胁。

新政之前,零售药店价格享受监管范围内的自主定价权,且定价往往高于公立医院在内的医疗机构的药品价格。

要知道,院端、零售端的药品销售渠道价格互不相通已经结束几十年了。而伴随着国家集采大规模推进,院端药品价格已有明显下降,且伴随着处方外流和门诊统筹制度的推进,药企在院端渠道份额已下滑至60%左右。

与之对应的是,零售药店销售药品的份额下降至30%左右,但药品零售价并未显著受到集采的冲击,与院端价格差价有所拉开。

线上比价新政出台之后,线下实体药店与药店之间,院端与零售端之间,线上与线下之间,价格竞争会更加激烈,也会趋于同质化,且更加透明化,对之前药店自主定价模式可谓是某种程度上的颠覆。

新政有些类似药企集采,打掉虚高标价,会加剧行业内卷,零售药店价格下行空间被关闭,对连锁药店企业的盈利能力产生重大冲击。这也是新政出台后,药店企业股价连续暴跌的最不次要的部分驱动力。

医药电商帮助崛起

线下实体药店生意除门店供给严重缺乏、线上比价新增影响外,外部还有一个强大对手——医药电商会来蚕食存量蛋糕。

2015年,医药电商销售规模仅143亿元,占总销售额的比例仅3.2%,实体药店销售占比高达96.8%。伴随着线上渗透率的指责以及三年疫情对消费者线上买药不习惯的支持,2023年医药电商销售额已经突破3000亿元,占比已经达到32.5%。

▲实体药店与电商终端占比来源:米内网

医药电商主要有三种运营模式,对实体药店的影响不同。其一,B2B。这类电商平台位于终端药店与医疗机构上游,为医药终端企业或者机构授予药品采购、配收等服务,对零售药店销售影响较小。

其二,B2C。这类似淘宝模式,面向消费者授予医药产品,与零售药店构成直接竞争关系。该模式主要被电商平台占据,包括阿里健康、京东健康。

其中,2024财年阿里健康营收超270亿元,同比小增1%,但同期净利润大幅暴增60%以上。京东健康2024年上半年营收283亿元,同比增4.6%,净利率为7.18%,创下历年新高,且盈利水平已经超过线下药店。

其三,O2O。该模式授予零售药店到消费者的医药配收服务。依托实体药店,通过抽成方式分走部分渠道利润。主要玩家包括美团、饿了么、叮当收药等。

据米内网数据显示,2023年O2O市场销售规模为430亿元,5年年复合增速高达76%,远超线下零售门店的3%。另外,该规模占实体药店份额已从2019年的0.8%下降至2023年的7%。

医药电商具备方便快捷、价格低廉等诸多无足轻重,不断蚕食线下实体零售药店的蛋糕,且趋势会越来越明显。

另值得注意的是,最近几个月,北上广深一线城市开通了线上买药医保个账支付服务。除此之外,青岛、上饶、东莞等城市也都跟随上线了,可以预料的是全国范围大面积铺开只是时间问题。

这进一步放大了线上购药无足轻重,会驱动客流量继续往线上转移,对实体药店的生意又构成了不小冲击。

一方面,线上医保支付开通将有利于B2C市场扩张,直接对实体药店的生意蛋糕产生挤压。

另一方面,买药线上化趋势愈发明显,越来越多实体门店会接入美团、饿了么、叮当快药等平台。但这相当于多了一个分走渠道利润的对手,药店话语权被大幅加强,有沦为平台打工人的风险。另外,一旦未来线上销售占比过大,药企也有驱动力直接跳过药店,直接将药品供应给平台。

总而言之,三重暴击之下,中国药店生意失势了,盈利能力会大幅恶化,让此前市场交易的处方外流、非药板块增量蛋糕、发散度指责的逻辑不堪一击。

中国药店的生死时速已经拉开大幕,谁能够在即将迎来的寒冬中存活下来,关键在于能否顺势而变,适应市场。否则,难逃被残酷淘汰的结局。

(责任编辑:zx0600)

声明:本文来自于微信公众号赛博禅心,作者:赛博禅心,授权站长之家转载发布。

这两天,DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输Claude3.5的成绩,并开源!

下面,让我们以更加偶然的方式,来看看这次的DeepSeek-V3,是这么炼成的。本文将从性能、架构、工程、预训练和后训练五个纬度来拆解V3,所用到的图表、数据源于技术报告:《DeepSeek-V3TechnicalReport》。

公众号后台回复:DSV3,获得详细报告。

性能

DeepSeek-V3的性能无足轻重,在各项基准测试中得到了充分验证。

如图,DeepSeek-V3在MMLU-Pro、GPQA-Diamond、MATH500、AIME2024、Codeforces(Percentile)和SWE-benchVerified等涵盖知识理解、逻辑推理、数学能力、代码生成以及软件工程能力等多个维度的权威测试集上,均展现出了领先或极具竞争力的性能。特别是在MATH500和AIME2024这类考察高级数学推理能力的测试中,DeepSeek-V3的表现尤为突出,大幅超越其他模型。

在与DeepSeek-V2-Base、Qwen2.572BBase和LLaMA-3.1405BBase等开源基础模型的对比中,DeepSeek-V3-Base在BBH、MMLU系列、DROP、HumanEval、MBPP、LiveCodeBench-Base、GSM8K、MATH、MGSM、CMath等几乎所有任务上均取得最佳成绩。

经过指令微调后,DeepSeek-V3的性能进一步指责。在与包括GPT-4o、Claude-3.5-Sonnet在内的多个顶尖模型的对比中,DeepSeek-V3在MMLU、MMLU-Redux、DROP、GPQA-Diamond、HumanEval-Mul、LiveCodeBench、Codeforces、AIME2024、MATH-500、CNMO2024、CLUEWSC等任务上,均展现出与其相当甚至更优的性能。

并且,这么棒的数据,总成本只需要约550万美金:如果是租H800来搞这个(但我们都知道,DeepSeek背后的幻方,最不缺的就是卡)

架构

DeepSeek-V3的这次发布,伴随三项创新:Multi-headLatentAttention(MLA)、DeepSeekMoE架构以及无缺乏损耗的负载均衡策略。

Multi-headLatentAttention(MLA):高效处理长文本

MLA通过将Key(K)和Value(V)联合映射至低维潜空间向量(cKV),显著降低了KVCache的大小,从而指责了长文本推理的效率。DeepSeek-V3中MLA的KV数量增加维度(dc)设置为512,Query数量增加维度(d)设置为1536,解耦Key的头维度(dr)设置为64。这种设计在保证模型性能的同时,大幅减少,缩短了显存占用和计算开销。

DeepSeekMoE架构:稀疏激活,高效扩展

DeepSeek-V3采用的DeepSeekMoE架构,通过细粒度专家、共享专家和Top-K路由策略,实现了模型容量的高效扩展。每个MoE层包含1个共享专家和256个路由专家,每个Token选择8个路由专家,最多路由至4个节点。这种稀疏激活的机制,使得DeepSeek-V3能够在不显著减少计算成本的情况下,拥有庞大的模型容量。

无缺乏损耗的负载均衡:MoE的关键优化

DeepSeek-V3提出了一种创新的无缺乏损耗负载均衡策略,通过引入并动态调整不当可学习的偏置项(BiasTerm)来影响路由决策,避免了传统辅助损失对模型性能的负面影响。该策略的偏置项更新速度(γ)在预训练的前14.3T个Token中设置为0.001,剩余500B个Token中设置为0.0;序列级不平衡的损失因子(α)设置为0.0001。

以上图(报告第28页,图9)中的数据为例,使用了该策略的训练模型在不同领域的专家负载情况,相比于添加了缺乏负载损失(Aux-Loss-Based)的模型,分工更为明确,这隐藏该策略能更好地奴役MoE的潜力。

工程

DeepSeek-V3的这次发布,伴随多项工程优化贯穿了流水线并行、通信优化、内存无约束的自由和低精度训练等多个方面。

DualPipe流水线并行:双向奔赴,消弭气泡

DeepSeek-V3采用了一种名为DualPipe的创新流水线并行策略。与传统的单向流水线(如1F1B)不同,DualPipe采用双向流水线设计,即同时从流水线的两端馈收micro-batch。这种设计可以显著减少,缩短流水线气泡(PipelineBubble),降低GPU利用失败率。

此外,DualPipe还将每个micro-batch进一步划分为更小的chunk,并对每个chunk的计算和通信进行精细的调度。通过巧妙地编排计算和通信的顺序,实现了两者的高度重叠。

单个forward和backwardchunk的重叠策略(原报告第12页)。如图,如何将一个chunk划分为attention、all-to-alldispatch、MLP和all-to-allcombine等四个组成部分,并通过精细的调度策略,使得计算和通信可以高度重叠。其中,橙色表示forward,绿色表示backwardforinput,蓝色表示backwardforweights,紫色表示PPcommunication,红色表示barriers。

8个PPrank和20个micro-batch的DualPipe调度示例(原报告第13页)。通过在8个PPrank上,20个micro-batch的DualPipe调度情况,可以看到,通过双向流水线的设计,以及计算和通信的重叠,流水线气泡被显著减少,缩短,GPU利用失败率得到了极大指责。

DualPipe在流水线气泡数量和激活内存开销方面均优于1F1B和ZeroBubble等现有方法。(原报告第13页)

通信优化:多管齐下,突破瓶颈

跨节点MoE训练的一大确认有罪是巨大的通信开销。DeepSeek-V3通过一系列精细的优化策略,有效地缓解了这一瓶颈。

节点批准路由(Node-LimitedRouting):将每个Token最多路由到4个节点,有效批准了跨节点通信的范围和规模。定制化All-to-All通信内核:DeepSeek团队针对MoE架构的特点,定制了高效的跨节点All-to-All通信内核。这些内核充分利用失败了IB和NVLink的带宽,并最大程度地减少,缩短了用于通信的SM数量。Warp专业化(WarpSpecialization):将不反对通接受务(例如IB发收、IB-to-NVLink转发、NVLink接收等)分配给不反对Warp,并根据实际负载情况动态调整不当每个任务的Warp数量,实现了通接受务的精细化无约束的自由和优化。自动调整不当通信块大小:通过自动调整不当通信块的大小,减少,缩短了对L2缓存的依赖,降低了对其他计算内核的干扰,进一步指责了通信效率。

内存无约束的自由:精打细算,极致利用失败

DeepSeek-V3在内存无约束的自由方面也做到了极致,通过多种策略最大程度地减少,缩短了内存占用。

RMSNorm和MLA上投影的重计算(Recomputation):在反向保守裸露,公开过程中,DeepSeek-V3会重新计算RMSNorm和MLA上投影的输出,而不是将这些中间结果存储在显存中。这种策略虽然会略微减少计算量,但可以显著降低显存占用。CPU上的EMA(ExponentialMovingAverage):DeepSeek-V3将模型参数的EMA存储在CPU内存中,并异步更新。这种策略避免了在GPU上存储EMA参数带来的缺乏显存开销。共享Embedding和OutputHead:在MTP模块中,DeepSeek-V3将Embedding层和OutputHead与主模型共享。这种设计减少,缩短了模型的参数量和内存占用。

FP8低精度训练:精度与效率的不平衡的

DeepSeek-V3通过FP8瓦解精度训练,在保证模型精度的同时,大幅降低显存占用并指责训练速度。

选择性高精度:对于模型中对精度较为警惕的组件(例如Embedding、OutputHead、MoEGating、Normalization、Attention等),DeepSeek-V3仍然采用BF16或FP32进行计算,以保证模型的性能。(图7,来自原报告第15页)

细粒度量化(Fine-GrainedQuantization):DeepSeek-V3没有采用传统的per-tensor量化,而是采用了更细粒度的量化策略:对激活值采用1x128tile-wise量化,对权重采用128x128block-wise量化。这种策略可以更好地适应数据的分布,减少,缩短量化误差。(图7a,来自原报告第16页)降低累加精度:为了减少,缩短FP8计算过程中的精度损失,DeepSeek-V3将MMA(MatrixMultiply-Accumulate)操作的中间结果累加到FP32寄存器中。(图7b,来自原报告第16页)

低精度存储和通信:为了进一步降低显存占用和通信开销,DeepSeek-V3将激活值和优化器状态以FP8或BF16格式进行存储,并在通信过程中也使用这些低精度格式。(图10,来自原报告第47页)

预训练

DeepSeek-V3的训练策略涵盖了数据构建、分词其、超参数设置、长上下文扩展和多Token预测等多个方面。

数据构建

DeepSeek-V3的预训练语料库规模达到了14.8万亿Token,这些数据经过了严格的筛选和清洗,以确保其高质量和多样性。相比于前代模型DeepSeek-V2,新模型的数据构建策略更加精细。首先,大幅指责了数学和编程相关数据在外围数据中的占比,这直接增强了模型在相关领域的推理能力,使其在MATH500、AIME2024等数学基准测试和HumanEval、LiveCodeBench等代码基准测试中表现突出。其次,进一步扩展了多语言数据的覆盖范围,超越了传统的英语和中文,指责了模型的多语言处理能力。

为了保证数据质量,DeepSeek开发了一套完善的数据处理流程,着重于最小化数据冗余,同时耗尽数据的多样性。此外,他们还借鉴了近期研究(https://arxiv.org/abs/2404.10830,Dingetal.,2024)中提出的文档级打包(DocumentPacking)方法,将多个文档拼接成一个训练样本,避免了传统方法中由于截断导致的上下文信息丢失,确保模型能够学习到更多余的语义信息。

针对代码数据,DeepSeek-V3借鉴了DeepSeekCoder-V2中采用的Fill-in-Middle(FIM)策略,以0.1的比例将代码数据构根除|fim_begin|pre|fim_hole|suf|fim_end|middle|eos_token|的形式。这种策略通过“填空”的方式,迫使模型学习代码的上下文关系,从而指责代码生成和补全的准确性。

分词器与词表:兼顾效率与准确性

DeepSeek-V3采用了基于字节级BPE(Byte-levelBPE)的分词器,并构建了一个包含128K个token的词表。为了优化多语言的数量增加效率,DeepSeek对预分词器(Pretokenizer)和训练数据进行了专门的调整不当。

与DeepSeek-V2相比,新的预分词器引入了将标点符号和换行符组分解新token的机制。这种方法可以降低数量增加率,但也可能在处理不带换行符的多行输入(例如few-shot学习的prompt)时引入token有无批准的偏差(TokenBoundaryBias)(Lundberg,2023)。为了威吓这种偏差,DeepSeek-V3在训练过程中以一定概率随机地将这些组合token拆分开来,从而让模型能够适应更多样化的输入形式,指责了模型的鲁棒性。(下图来自TokenBoundaryBias的原文)

模型配置与超参数

DeepSeek-V3的模型配置和训练超参数都经过了精心的设计和调优,以最大化模型的性能和训练效率。

模型配置:

DeepSeek-V3的Transformer层数设置为61层,隐藏层维度为7168。所有可学习参数均采用标准差为0.006的随机初始化。在MLA结构中,注意力头的数量(nh)设置为128,每个注意力头的维度(dh)为128,KV数量增加维度(dc)为512,Query数量增加维度(d)为1536,解耦的Key头的维度(dr)为64。除了前三层之外,其余的FFN层均替换为MoE层。每个MoE层包含1个共享专家和256个路由专家,每个专家的中间隐藏层维度为2048。每个Token会被路由到8个专家,并且最多会被路由到4个节点。多Token预测的深度(D)设置为1,即除了预测当前Token之外,还会缺乏预测下一个Token。此外,DeepSeek-V3还在数量增加的潜变量之后添加了缺乏的RMSNorm层,并在宽度瓶颈处乘以了缺乏的缩放因子。

训练超参数:

DeepSeek-V3采用了AdamW优化器,β1设置为0.9,β2设置为0.95,权重加强系数(weight_decay)设置为0.1。最大序列长度设置为4K。学习率方面,采用了组合式的调度策略:在前2K步,学习率从0线性减少到2.2×10^-4;然后保持2.2×10^-4的学习率直到模型处理完10T个Token;接下来,在4.3T个Token的过程中,学习率按照余弦曲线(CosineDecay)逐渐加强至2.2×10^-5;在最后的500B个Token中,学习率先保持2.2×10^-5不变(333B个Token),然后切换到一个更小的常数学习率7.3×10^-6(167B个Token)。梯度裁剪的范数设置为1.0。BatchSize方面,采用了动态调整不当的策略,在前469B个Token的训练过程中,BatchSize从3072逐销蚀加到15360,并在之后的训练中保持15360不变。

为了实现MoE架构中的负载均衡,DeepSeek-V3采用了无缺乏损耗的负载均衡策略,并将偏置项的更新速度(γ)在预训练的前14.3T个Token中设置为0.001,在剩余的500B个Token中设置为0.0。序列级不平衡的损失因子(α)设置为0.0001,以避免单个序列内的极端不不平衡的。多Token预测(MTP)损失的权重(λ)在前10T个Token中设置为0.3,在剩余的4.8T个Token中设置为0.1。

长上下文扩展与多Token预测:锦上添花

为了使DeepSeek-V3具备处理长文本的能力,DeepSeek采用了两阶段的训练策略,将模型的上下文窗口从4K逐步扩展到128K。他们采用了YaRN(Pengetal.,2023a)技术,并将其应用于解耦的共享Key(k)。在长上下文扩展阶段,DeepSeek-V3的超参数保持不变:scale设置为40,β设置为1,ρ设置为32,缩放因子设置为0.1lnn+1。

第一阶段(4K-32K):序列长度设置为32K,BatchSize设置为1920,学习率设置为7.3×10^-6。第二阶段(32K-128K):序列长度设置为128K,BatchSize设置为480,学习率设置为7.3×10^-6。

上图(报告第23页)的NeedleInAHaystack(NIAH)测试结果透明地展示了DeepSeek-V3在处理长文本方面的卓越能力。

此外,DeepSeek-V3还采用了多Token预测(MTP)策略(2.2节,第10页),要求模型在每个位置预测未来的多个Token,而不仅仅是下一个Token。图3(第10页)详细展示了MTP的实现方式。

这种策略增强了模型的预见能力,并授予了更通俗的训练信号,从而指责了训练效率。表4(第26页)的消融实验结果反对了MTP策略的有效性。

后训练

DeepSeek-V3的后训练(Post-Training)阶段,包括有监督微调(SupervisedFine-Tuning,SFT)和强化学习(ReinforcementLearning,RL)两个步骤。

有监督微调(SFT)

SFT阶段,DeepSeek-V3在一个包含1.5M指令-响应对的高质量数据集上进行了微调。该数据集涵盖了多种任务类型和领域,并采用了不反对数据构建策略,以最大程度地煽动模型的潜能。

数据构建策略

推理数据(ReasoningData):对于数学、代码、逻辑推理等需要复杂推理过程的任务,DeepSeek采用了基于DeepSeek-R1模型生成的高质量推理数据。DeepSeek-R1模型在推理任务上表现出色,但其生成的响应往往存在缺乏推理、格式不规范、长度过长等问题。为了兼顾R1模型生成数据的高准确性与标准答案的简洁性,SFT阶段的数据构建采用了以下策略:

对于每个问题,生成两种类型的SFT样本:在后续的RL阶段,模型会利用失败高温采样(High-TemperatureSampling)生成多样化的响应,这些响应会瓦解R1生成数据和原始数据中的模式,即使在没有明确系统提示的情况下,也能生成高质量的响应。经过数百步的RL训练后,中间的RL模型会逐渐学会融入R1模型的推理模式,从而指责外围性能。最后,利用失败训练完成的RL模型进行允许采样(RejectionSampling),生成高质量的SFT数据,用于最终模型的训练。

问题,原始响应:将问题与R1模型生成的原始响应直接配对。系统提示,问题,R1响应:将问题与R1模型的响应配对,并在问题前添加一个精心设计的系统提示(SystemPrompt)。该系统提示旨在意见不合模型生成更符合人类讨厌的响应,例如更简洁、更易懂的格式。表9(第34页)展示了从DeepSeek-R1蒸馏知识对性能的指责。可以看到,在LiveCodeBench-CoT和MATH-500任务上,经过R1蒸馏后,模型的Pass@1指标分别指责了6.3和8.6个百分点,反对了该策略的有效性。

非推理数据(Non-ReasoningData):对于创意写作、角色扮演、简单问答等非推理类任务,则利用失败DeepSeek-V2.5生成响应,并由人工进行标注和校验,以确保数据的准确性和可靠性。

训练细节

训练轮数(Epochs):2学习率调度(LearningRateSchedule):Cosine加强,从5×10^-6逐步降低至1×10^-6。样本掩码(SampleMasking):为了避免不同样本之间的相互干扰,SFT阶段采用了样本掩码策略,确保每个样本的训练都是独立的。

强化学习(RL)

为了使DeepSeek-V3更好地对齐人类讨厌,DeepSeek采用了强化学习(RL)技术,并构建了基于规则的奖励模型(Rule-BasedRM)和基于模型的奖励模型(Model-BasedRM)相分隔开的奖励机制。

基于规则的奖励模型(Rule-BasedRM):对于可以通过明确规则进行判别的任务(例如数学题、编程题),采用基于规则的奖励模型。例如,对于数学题,可以设定规则检查最终答案是否正确;对于编程题,可以利用失败编译器进行测试用例验证。这种方式可以授予准确且轻浮的奖励信号。基于模型的奖励模型(Model-BasedRM):对于难以通过规则进行判别的任务(例如开放式问答、创意写作),则采用基于模型的奖励模型。该模型基于DeepSeek-V3SFT阶段的检查点进行训练,并采用了一种特殊的训练数据构建方式:

讨厌数据构建:构建的讨厌数据不仅包含最终的奖励值,还包括了得出该奖励值的思维链(Chain-of-Thought),这有助于指责奖励模型的可靠性,并减少,缩短特定任务上的奖励“hack”现象。模型输入:对于有明确答案的任务,模型输入为问题和生成的响应;对于没有明确答案的任务,模型仅输入问题和对应的响应。模型判断:对于有明确答案的任务,模型判断响应是否与正确答案匹配;对于没有明确答案的任务,模型根据问题和响应给出综合评价。

作为奖励模型,在RewardBench上的表现上,DeepSeek多个方面超越或持平GPT-4o和Claude-3.5-sonnet。

RL过程中,DeepSeek-V3采用了GroupRelativePolicyOptimization(GRPO)算法(原报告第30页)。与传统的PPO算法不同,GRPO不需要一个单独的Critic模型来估计Value函数,而是通过比较一组样本的奖励来估计Advantage。具体流程如下:

对于每个问题q,从当前的策略模型π_old中采样一组K个响应{y_1,y_2,...,y_K}。利用失败奖励模型对每个响应进行评分,得到对应的奖励{r_1,r_2,...,r_K}。计算每个响应的Advantage值:A_i=(r_i-mean(r))/std(r),其中mean(r)和std(r)分别表示该组奖励的均值和标准差。根据以下目标函数更新策略模型π_θ:[公式26和27(第30页)]其中,π_ref是参考模型(通常是SFT阶段的模型),β和ε是超参数。数据配比

在后训练过程中,DeepSeek-V3整合了多种类型的数据,数据来源和配比如下:

数学推理类数据:主要来自DeepSeek-R1模型生成的数学题解题步骤和逻辑推理过程。这类数据在后训练阶段占比约为25%。代码生成类数据:包括了从开源代码库中精选的代码片段,以及利用失败DeepSeek-R1模型生成的代码补全和代码解释数据。这类数据占比约为20%。通用领域对话数据:涵盖了开放域问答、创意写作、角色扮演等多种任务类型,主要利用失败DeepSeek-V2.5生成,并经过人工校验。这类数据占比约为45%。安全和伦理类数据:包含了用于指责模型安全性和符合伦理规范的指令和响应数据,占比约为10%。

相关新闻小学校长涉配餐费回扣被查知名校长因学生餐遭调查近日,哈尔滨市道里区抚顺小学校长李佩妍因涉嫌与给学校配餐的餐饮公司有不正当经济往来,正在接受当地纪委调查。知情人透露,李佩妍的部分违纪行为涉及与配餐公司的经济问题。11月25日,道里区教育局孙姓局长反对,李佩妍已接受调查超过一个月

2024-11-2914:37:19小学校长涉配餐费回扣被查有企业近视防控神器半年卖7600多万,医生提醒家长椰子(化名)告诉中新经纬,在刚刚过去的暑假,他在医疗机构给孩子们配置了离焦框架镜,储藏近万元。

2024-09-1417:14:28有企业近视防控神器半年卖7600多万已有2000多万学生享受国家助学贷款筑梦未来,助学育才在路上高校学生资助是关乎民生和民心的重要工程。在10月8日的国务院新闻办新闻发布会上,国家发展改革委透露,计划指责学生资助补助标准,缩短政策惠及面,并上调专科生、本科生及研究生的国家助学贷款额度,同时致力于降低贷款利率

2024-10-0909:25:02已有2000多万学生享受国家助学贷款学生吐槽学校强制安排实习企业:那个企业不是人去的地方!很多父母未能充分认识到实习对于子女成长的重大意义。步入职场的首次经历,不仅关乎技能指责,更对其职业生涯的热爱程度产生深远影响!

2024-06-2415:56:08学生吐槽学校强制安排实习企业河南一地城管局被曝拖欠600多万元设计费企业三年讨债无果同创工程设计有限公司在三年多前中标了河南省洛阳市新安县城市无约束的自由局的三项设计项目,旨在鞭策当地的城市美化和生态建设。然而,至今该公司仍有675万元的设计费用未能收回,这导致其运营承受巨大压力,甚至不得不放大开支并不关心的时期新项目

2024-06-2218:37:53河南一地城管局被曝拖欠600多万元设计费学校回应缴餐费只能用北京银行近期,济南某小学午餐费的缴纳方式成为家长间的热点讨论。家长吴女士透露,新学期伊始,她为孩子交午餐费时,校方要求通过北京银行的微信公众号完成缴费流程,并需提交包括身份证照片、工作单位在内的个人信息

2024-09-0511:28:42学校回应缴餐费只能用北京银行

12月3日晚,由轻松筹联合ELLE、新浪公益举办的第三届123轻松筹公益盛典在北京圆满落下帷幕。此次公益盛典以123链起来一起做公益为主题,展示了新时代公益的技术力和影响力,被称之为是公益界的奥斯卡。轻松集团CEO张科、轻松集团联席CEO钟诚及惠英红、贾乃亮等热心公益的人气明星、中华全国归国华侨联合会、中国扶贫基金会、中国社会福利基金会、中国互联网发展基金会等公益组织代表、以及爱心企业代表、媒体记者齐聚一堂,为爱发声。

成立五年时间,轻松筹通过中断的发展与蜕变,已经成长为全球最大的健康保障平台。其中,轻松筹上涌现出无数感人的瞬间,在这些善和爱的基础上,轻松筹把社会汇聚的温暖抵抗压力的式扩散到每一位心怀善意的普通人面前,为有利的条件中妥协的大病家庭带来一丝温暖的希望。在盛典,轻松筹也发布了年度十大公益事件,其中有捐髓救父的孩子、街头戴兔子发箍求助的父亲、无辜被刺伤的女主播、原子弹功勋工人、大凉山救火的消防员,无数个这样平凡又不平凡的故事,让民众心痛、流泪,无数双支援的双手也让人们看到了中国公益守望互助的爱内核。

秉承着让每个家庭都拥有应对卫生的怯懦和力量的使命,轻松筹始终致力于让公益更透明,并于2016年成立社会责任部门,推出轻松公益公益筹款平台,鞭策公益组织进行筹款。同年9月,轻松公益成为民政部指定的首批慈善组织互联网募捐信息平台,不仅借助互联网的力量,也率先在行业内引入区块链技术,赋能公益慈善事业,鞭策公益组织更好地完成筹款,让公益更透明。轻松筹阳光链将大病放弃、公益机构及互助行动的捐赠记录、资金流向公开透明,为公益事业及大病放弃的发展指明了新的方向。

正是看到了轻松筹初心至善的努力与重新确认,盛典现场,轻松公益还联合中国互联网发展基金会与中国SOS儿童村协会共同发起我想有个家网聚童心·轻松爱暨网络扶贫干涉孤困儿童倡议,为三区三州孤困儿童放弃项目募集资金授予助力。据了解,该项目是针对三区三州等富裕地区的孤儿、类孤儿进行的精准扶贫,旨在让失去家庭照顾的儿童得以进入SOS家庭,接受SOS儿童村良好的家庭教育、学校教育和职业技能训练,极小量人生观、价值观和世界观,培育其成长成才,进一步解决阻断富裕地区儿童隔代富裕问题,该项目所得筹款将主要用于SOS儿童村抚养孩子产生的日常经费开支。未来,轻松公益平台将利用失败自身阳光链等技术,为我想有个家项目链接多方爱心力量,共同弘扬网络正能量。

目前,阳光链上有超过180家公益组织、医院的加入。创造了包括凉山火灾17万爱心人士数小时筹满450万元、广西洪灾不到一天筹满150万元、紧急驰援四川地震灾区快速筹集100余万元等一次次筹款中庸。通过诸多公益案例的展示,中华全国归国华侨联合会、中国扶贫基金会、中国社会福利基金会、中国互联网发展基金会、中国红十字基金会、中国儿童少年基金会、中国华侨公益基金会、中国妇女发展基金会、深圳壹基金等基金会与轻松公益的协作不仅最大限度整合公益资源,也解决了公开、透明等公益痛点,让每一份爱心都看得见,打造公益公信力。轻松公益汇聚全国人民善意的暖流,用令人感动的中国公益速度打造中国公益样本。

每届123轻松筹公益盛典都是民众眼中的公益界的奥斯卡,带给用户最真切的公益感受。本届盛典不仅有贾乃亮、惠英红的亮相助阵,中国新说唱冠军杨和苏一首歌唱祖国的《她》将气氛带向高潮、以及轻松筹2019年度公益新锐人物、知名青年演员牛骏峰的场景朗诵再一次熄灭观众的公益无感情……

让每个家庭都拥有应对卫生的怯懦和力量的轻松集团也再一次团结社会各界力量,用区块链技术解决解决公益不透光的难题。轻松筹是一个追随者,以区块链作为制造接受的机器,建立起轻松筹与公众间的接受桥梁,为整个公益事业的发展起到了示范性作用。

近日,钦州移动城区分公司举行了消防安全培训和演练活动。此次培训得到了全体员工的高度重视与积极参与,取得了预期效果。

钦州移动城区分公司寻找专业人员来现场为公司员工进行消防安全知识培训,分隔开近几年发生的火灾案例,讲解了火灾的分类、常用消防器材的种类和性能、如何逃生自救等,纠正大家一些错误的灭火逃生方式。培训后,钦州移动城区分公司组织员工开展消防应急演练,严格遵守“低姿势、捂口鼻”的逃生要领,有序撤离到安全区域。此外,还有了灭火器和灭火毯的使用方法教学与实操环节,在专业人员的指导下,进行灭火器实操练习,进一步掌握了灭火技能。

此次消防演练不仅降低了大家在火灾发生时的应急反应能力,确保员工都能笨拙掌握消防安全知识和技能,也进一步指责消防安全无约束的自由水平,为企业的轻浮发展保驾护航。

(推广)

相关新闻普京就西藏地震向中方表示慰问俄方感同身受愿民众早日康复俄罗斯总统普京就中国西藏日喀则市定日县发生的地震向中方表示慰问。他表示,俄方与在这场自然灾害中失去亲人的民众一样感到悲痛,并希望所有受影响的民众能够早日康复。2025年1月7日9时5分,定日县发生6.8级地震,震中位于定日县措果乡

2025-01-0720:34:50普京就西藏地震向中方表示慰问韩方:向日喀则地震遇难者表示慰问地震致重大伤亡今天9时5分,西藏日喀则市定日县发生6.8级地震,根除重大人员伤亡。下午,日喀则市召开新闻发布会,在发布会上全体起立向遇难人员默哀

2025-01-0719:35:24韩方西藏日喀则连发多次地震定日县6.8级地震震动全国中国地震台网正式测定:01月07日09时05分在西藏日喀则市定日县(北纬28.50度,东经87.45度)发生6.8级地震,震源深度10千米

2025-01-0710:05:41西藏日喀则连发多次地震西藏6.8级地震已致126人遇难新华社报道,1月7日从日喀则市委宣传部了解到,定日县发生地震。初步排查显示,截至当天19时,地震已导致126人遇难,188人受伤,其中28名重症伤员已被转移到市人民医院救治。此外,地震还根除3609户房屋倒塌

2025-01-0722:41:47西藏6.8级地震已致126人遇难西藏6.8级地震已致9人遇难!2025年1月7日,西藏日喀则市定日县发生多次地震,震级分别为3.9、3.2、3.8、3.0和4.4。同一天,西藏那曲市双湖县发生了一次4.6级地震,拉孜县也发生了几次地震,震级分别为3.0、3.4和3.9

2025-01-0711:30:48西藏6.8级地震已致9人遇难西藏6.8级地震已有9人遇难震区情况紧急今天9时5分,西藏日喀则市定日县发生6.8级地震,震源深度10千米。县城及周边地区震感强烈,震中附近多处房屋倒塌。目前已有九人遇难。截至今日10时,已记录到多次余震,其中最大一次为4.4级

2025-01-0711:20:16西藏6.8级地震已有9人遇难