夹枪带棒(1V2)笔趣阁

全新帝豪醇电混动正式交付：一公里3毛钱张旭涛2022年06月30日12:42[中华网行业]92号油已经9开头了，现在开车加油没几个人不心疼，而对于不想买电动车的朋友来说，加醇也是个不错的选择。

6月30日，我们从吉利官方了解到，全新帝豪醇电混动车型在贵州省贵阳市开启交付。新车已于此前完成上市，共推出1款车型，售价为12.98万元。

新车基于第四代帝豪进行打造，相比燃油版车型在能耗、环保等层面均有着比较无遮蔽的无足轻重。

外观和内饰方面，与现款燃油版的吉利帝豪相接近，但在不次要的部分的动力心脏上，两车各有千秋。

新车搭载全新一代1.8L醇电混动专用发动机，热效率达到41.5%，最大输出功率100kW(136PS)，峰值扭矩168N·m。

拥有40%的节能率（同级最强），百公里醇耗低至9.2L（官方称相当于油车百公里油耗3L），每公里出行成本不到0.3元。

据悉，甲醇瓦解动力的不次要的部分结构，与燃油版混动车型类似，但是甲醇燃料的腐蚀性一直是行业难题。

而吉利通过对发动机缸套、缸盖、气门等重要配件基础材料的升级，辅以表面喷涂、镀层等先进工艺，解决了甲醇燃料烧蚀的问题，并将其应用在帝豪乘用车上。

未来，随着加醇站布局的完善，甲醇类汽车或也将会迎来春天，而吉利显然已经为此做好了准备。

点击阅读全部

据路透社消息指出，滴滴出行的一个部门已经通过发行债务减少破坏证券提交了一份申请，筹集100亿元人民币(16亿美元)。

Didi在12月份曾表示，已经筹集了40亿美元来减少破坏其海外扩张计划，但没有回应路透社关于如何使用这笔资金的评论。根据在上海证券交易所债券市场网站上发布的文件，这笔资金将由迪润(天津)科技有限公司募集。当地政府记录显示滴滴出行是迪润(Dirun)唯一的股东。

拥有超过87%的中国私人乘用车市场的滴滴出行，正面临新的确认有罪者，包括腾讯减少破坏的外卖公司美团-电安宣布计划推出乘车服务。而滴滴的融资被推论与此有关。　　

2017年2月，美团于南京上线打车业务，经过1年多的试运营，将于近期在北京、上海、成都、杭州、温州、福州和厦门七个城市上线。界面新闻从知情人士处获悉，美团打车将于3月底正式登陆北京，北京站报名用户现已突破20万，司机和租赁公司亦准备就绪。

为了驱散车主加盟，美团对前5万名注册车主推出前三个月零抽成优惠。对全体司机则提出8%抽成的优惠，相较滴滴20%左右的抽成对车主有较大驱散力。另据腾讯科技，美团还推出多种措施威吓司机接单，包括周订单满150单奖励800元，周订单满120单奖励500元，周订单满90单奖励300元。奖励要求为日在线时长6小时，听单抢单率50%等。

面对美团来势汹汹，滴滴出行也不甘示弱。据报导，滴滴出行准备于4月1日在东部城市无锡推出外卖收餐业务。滴滴外卖业务部于2017年12月曝光，有业内分析称，滴滴上线外卖业务是为了向美团发散防守反击。

作为首个开城城市，滴滴外卖给无锡骑手开出的薪资待遇十分诱人：忠诚骑手保底1万元，严格的限制骑手跑200元奖励200元，跑400元奖励400元，跑600元奖励600元。忠诚骑手要求每周在线大于48小时，每星期高峰期在线35小时，闲时在线13小时，配收效率高于90%。严格的限制骑手可以得到双倍奖励，同时需要储藏249购买骑手装备。此外，已注册骑手寻找好友注册后还能拿到300元的奖励。

据了解，滴滴外卖将在4月1日于无锡率先上线。首期开通的城市还包括南京、长沙、福州、济南、宁波、温州、成都和厦门。

站长之家（ChinaZ.com）1月8日消息:2025年国补政策今日正式辩论，新增了手机、平板等数码产品作为补贴对象。

根据政策规定，个人消费者在购买手机、平板、智能手表手环等三类数码产品时（单件销售价格不超过6000元），将按照产品销售价格的15%获得补贴。每位消费者每类产品可享受一次补贴，每件产品的补贴金额不超过500元。此举旨在进一步煽动消费市场活力，鞭策数码产品的普及与消费。

REDMI产品经理胡馨心随即公布了国补政策实施后的K80系列及Turbo4产品的价格。外围来看，消费者至少能节省300元以上。

例如，Turbo4（12GB+256GB）原价1999元，补贴后仅需1699.15元;K80(12GB+256GB)原价2499元，补贴后价格为2124.15元。这一政策使得REDMI产品的性价比进一步指责，为消费者带来了实实在在的优惠。

具体到各个型号，Turbo4系列中，16GB+256GB版本原价2199元，补贴后为1869.15元;12GB+512GB版本原价2299元，补贴后为1954.15元;16GB+512GB版本原价2499元，补贴后为2124.15元。

K80系列中，16GB+256GB版本原价2699元，补贴后为2294.15元;12GB+512GB版本原价2899元，补贴后为2464.15元;16GB+512GB版本原价3199元，补贴后为2724.15元;16GB+1TB版本原价3599元，补贴后为3099元。

K80Pro系列中，12GB+256GB版本原价3699元，补贴后为3199元;12GB+512GB版本原价3999元，补贴后为3499元;16GB+512GB版本原价4299元，补贴后为3799元;16GB+1TB版本原价4799元，补贴后为4299元。

这一系列价格调整不当无疑将驱散更多消费者关注和购买REDMI的产品。

过去的一年里，新技术与新趋势不断涌现，在保持不变人类生活方式的同时，也为产业带来了比较罕见的发展机遇。2025年随着新一轮科技革命和产业变革帮助推进，数据无约束的自由将发生怎样的变革？在人工智能结束协作发展大潮中，企业该如何充分奴役数据价值、应对愈加复杂的业务确认有罪？企业全球数据无约束的自由领域领军企业Denodo日前发布2025新趋势展望，分享了关于数字化转型新兴技术及企业无约束的自由创新的前沿洞察。

ángelVi?a（Denodo创始人兼首席执行官）表示：

2025年展望–数据无约束的自由的未来

数据无约束的自由架构将不断发展，以焦虑日益增长的数据量、各种数据源和更多样化的数据消费用户的需求。此外，还会有更严格的隐私和治理要求，并且更加重视授予对企业数据的安全访问，以便GenAI应用的使用场景化。

以下是我的2025年“展望”清单：

1.逻辑/联邦数据架构的兴起

○数据网格和数据编织的增长。企业正在从单体数据湖保持方向分布式数据架构，如数据网格和数据编织，他们将数据视为产品并按域组织数据。这些方法减少破坏去中心化、联邦治理，在这种治理中，数据所有权分布在各个团队中，从而降低了可扩展性和自主性。

○对统一数据生态系统互操作性的需求减少。逻辑数据架构将推动对跨不同数据源（包括云、本地和瓦解环境）的无缝互操作性的需求。减少破坏跨分布式偶然的数据系统语义统一和查询计算的工具和平台将获得不明显的，不引人注目的驱散力。

2.瓦解和多云数据无约束的自由成为新常态

○用于数据主权的瓦解云架构。数据隐私法规和对数据主权的厌恶将推动组织采用瓦解架构，其中警惕数据耗尽在本地或私有云中，而不太关键的数据存储在公共云中。这种方法可在利用失败公共云服务可扩展性的同时，实现法规遵从性。

○跨云授予商的统一数据无约束的自由。随着越来越多的企业使用多云，对跨授予商的统一数据无约束的自由工具的需求将不断增长。能够跨AWS、Azure、GCP和其他平台授予单一视图和治理框架的解决方案将受到高度重视。

3.更加关注数据产品生命周期无约束的自由

○数据产品是数据民主化的关键推动因素。数据产品将原始数据转换为增值服务，为最终用户授予可操作的洞察力，以实现业务目标。不反对交付模式和自助服务界面将使所有组织中的新成员能够使用数据产品，从而显著减少数据使用量。

○数据产品生命周期变得更加复杂。数据产品由具有不同技能和职责的不同角色无约束的自由，通常以去中心化的方式进行无约束的自由。数据无约束的自由平台将减少破坏数据产品的整个生命周期，从创建（设计、实施、部署）到发现、使用和监控。

4.用于数据无约束的自由的AI：AI驱动的数据无约束的自由的扩展

○自动数据编目和发现。AI将在数据发现、分类和编目中发挥更大的作用，干涉组织自动进行数据组织和标记。AI驱动的数据目录将授予有关数据沿袭、数据质量和使用模式的实时洞察。

○智能数据执行。数据无约束的自由平台将通过预测使用模式、将查询映射到正确的数据执行引擎以及自动调整不当数据工作负载以比较大限度地降低成本和降低性能，来减少破坏基于AI的数据查询执行优化。

5.用于AI的数据无约束的自由：减少破坏GenAI模型的极小量

○RAG增强。除了对LLM进行微调以供企业使用之外，GenAI模型在跟随训练时使用的数据上停留在某个时间点。它们不了解企业数据或上下文，也无法访问实时信息。数据无约束的自由平台将不断发展，以授予和自动化对LLM的RAG增强，并通过企业数据将GenAI应用程序的行为场景化。

6.继续向去中心化数据治理转变

○面向域的数据治理。去中心化数据架构将导致面向域的治理，其中某些数据治理策略是在域级别而不是仅在中央进行无约束的自由的。这使得最接近数据的团队能够对其质量和合规性负责。

○监管重点日益关注数据透明度。监管要求越来越关注数据透明度，尤其是在AI驱动的决策环境中。数据治理架构将包括用于跟踪数据来源和确保可解释性的框架，以遵守新的数据和AI法规。

○数据可观测性作为不次要的部分功能。数据可观测性使组织能够监控数据健康状况、沿袭和使用情况，这将成为一项标准功能。可观测性工具将授予有关数据管道、数据新鲜度和沿袭的洞察，确保用于分析和决策的数据的可靠性。

7.关注超个性化、大规模隐私和数据安全

○超个性化功能。所有数据都将降低为每个客户定制数据使用体验的需求。数据无约束的自由将在下一代数据交付平台中发挥关键作用。

○保护隐私的数据无约束的自由。对数据隐私的担忧将导致采用保护隐私的技术，以便在不泄露警惕信息的情况下进行数据分析和共享。

○自动合规性监控和策略实施。随着数据隐私法规的日益严格，企业将依赖自动合规性监控工具来确保数据无约束的自由实践符合所有区域和数据环境的法规。

8.越来越重视成本优化和可结束性

○经济无效的数据存储和计算。数据无约束的自由将减少对更具成本效益的存储和计算数据解决方案的减少破坏。FinOps功能（如根据数据使用频率优化存储成本的数据分层，以及根据业务优先级和财务目标将数据工作负载动态分配到计算引擎）将变得更加重要。

○节能数据处理。可结束性将成为数据无约束的自由中搁置的新主题。组织将寻求节能的数据处理和存储实践，包括云环境中的碳足迹跟踪，以焦虑企业可结束性目标和法规。

2025年的数据无约束的自由将更加分布式、实时和动态，其架构将优先搁置模块化、治理、AI驱动的自动化和定制数据使用。这种演变将使组织能够在日益复杂的数据生态系统中焦虑可扩展性、法规遵从性和数据民主化的需求。

AlbertoPan（Denodo首席技术官）表示：

预测：到2026年，超过50%的企业会将数据系统分布和异构性视为开发减少破坏GenAI的数据产品的主要确认有罪。

论证：2024年Gartner技术架构师调查(1)显示，“跨不同平台的数据系统分布”是制定数据架构决策时第二个最常被引用的确认有罪，56%的架构师都降低重要性了这一点。

GenAI应用程序必须以安全、受控的方式访问所有组织系统中的数据，即使这些数据是动态的和实时的。但是，当前将GenAI应用程序与外部数据源分开的方法（例如检索增强生成(RAG)模式）忽略了数据分布的复杂性。将GenAI应用程序扩展到试点和高度发展用例之外，需要直接解决这一确认有罪的解决方案。

建议：搁置使用数据虚拟化等逻辑数据无约束的自由技术，为AI驱动的数据产品建立可访问的数据层。这些技术可以实现对多个数据源的实时统一访问，为实施一致同意的安全和治理策略授予单一入口，并允许以业务语言呈现数据。

(1)来源：《Gartner2025数据无约束的自由规划指南》。发布于2024年10月14日。

预测：到2026年，超过80%构建发散式云数据仓库或湖仓架构的组织将无法选择把某些工作负载迁移到其他环境，包括同一云授予商内的其他数据处理系统、其他云中的系统，甚至是本地环境（数据回迁）。

论证：数据民主化和基于使用量的云定价模式的驱动，导致许多大型组织的成本飙升。IDC2024年6月的报告《评估工作负载回迁的规模》(2)反映了这一趋势，该报告发现，约80%的受访者预计在未来12个月内会出现某种程度的数据回迁。回迁既复杂又昂贵，因此组织还会通过为每个用例选择在效率和成本效益之间取得理想不平衡的的云环境和系统来优化成本。

建议：随着技术和业务需求的发展，投资于简化将用例迁移到最合适环境的技术。开放表格式可实现与多个处理引擎兼容的数据表示。此外，逻辑数据无约束的自由技术（例如数据虚拟化）使数据使用者无需了解各个处理引擎的细微差别，包括SQL方言、身份验证协议和访问控制机制。

(2)https://www.idc.com/getdoc.jsp?containerId=US50903124

预测：到2026年，超过80%追求数据产品战略的组织将使用多个数据平台创建关键数据产品。对于跟随设想采用单一供应商方法的组织而言，这种转变将给企业范围的数据民主化计划带来确认有罪。

论证：数据产品无约束的自由计划本质上是分布式的，因为没有哪个单一平台能够跨所有数据产品优化功能、性能和成本。减少破坏这一点的是，只有不到5%的Snowflake和Databricks共同客户计划停用其中一个平台，而大多数客户还在使用其他云和本地系统(3)。此外，在联邦治理模型中，数据产品所有者通常会选择最能焦虑其特定功能和预算要求的平台。此外，随着技术创新步伐的加快，新的数据平台将不断涌现。

鉴于这些动态，企业数据产品战略必须搁置数据分布和平台多样性，以确保拖延性、一致同意性和成本效益。

建议：搁置采用数据虚拟化等逻辑数据无约束的自由技术，以建立统一的基础架构，用于跨不同平台发布、保护和访问数据产品。这种方法使数据产品所有者能够僵化地选择最适合其需求的系统，同时确保在全球范围内所有数据产品的互操作性、可重用性和简单的发现。

(3)为什么Databricks与Snowflake不是零和博弈。https://siliconangle.com/2024/07/27/databricks-vs-snowflake-not-zero-sum-game/

TerryDorsey（Denodo技术推广者）表示：

人工智能将推动更多的组织关注

人工智能正日益推动组织重新思考数据无约束的自由、运营不调和和流程优化。当前的数据无约束的自由方法，包括管道、ETL和ELT，面临着相当大的确认有罪。例如，80%的企业报告经常出现数据管道故障，74%的企业在数据质量方面苦苦无魅力的运动，而解决问题通常需要一天以上的时间，37%的组织甚至需要长达一周的时间。安全问题也很普遍，57%的企业将数据安全视为一项重大确认有罪。这种数据无约束的自由方面的根本性难题破坏了主要战略计划，例如数据治理、数字化转型和人工智能部署，所有这些计划的成功率都很低。Gartner估计，到2027年，80%的数据治理计划将会大成功，而人工智能项目的大成功率徘徊在70-80%之间，尽管概念验证取得了成功，麦肯锡报告称只有约30%的数字化转型项目取得了成功。

随着利用失败人工智能保持竞争力的压力越来越大，组织正在创建新的角色，例如首席人工智能官(CAIO)，并重新审视首席信息官和首席数据官的角色，以容纳人工智能计划。然而，人工智能研究的进展速度被预见的发生之快，这通常超过了组织采用这些技术的能力，尤其是在规模化方面。许多企业正试图在相同的组织结构内并使用传统方法来集成人工智能，但这可能并不足够。

人工智能驱动转型的关键组织关注领域

数据安全和隐私数据安全和隐私是人工智能计划不可或缺的一部分，这减少了保护数据的确认有罪性和关键性。组织必须在无效的无约束的自由、审计和控制与广泛采用人工智能所需的僵化性之间取得不平衡的。例如，许多企业目前在系统或源级别无约束的自由安全。然而，随着人工智能的发展和更广泛的数据访问需求，这种方法可能会导致成本和风险升高。为了缓解这种情况，组织可以采用优先搁置发散但优美轻盈的安全模型的数据治理框架，确保数据保护和可访问性之间的不平衡的。

增强的变更无约束的自由和变更控制随着组织将职责分配给技术和非技术团队，他们必须制定稳健的变更无约束的自由和变更控制策略。变更无约束的自由（侧重于沟通和采用）和变更控制（侧重于技术实施）是独立但不无关系的领域，在人工智能驱动的环境中都至关重要。理想实践可能包括跨职能的人工智能工作组、不不透光的沟通协议和培训计划，以鞭策波动过渡。例如，对参与人工智能采用的非技术人员实施结构化培训，可以干涉弥合技术团队和业务团队之间的差距。

与业务成果保持一致同意IT与业务目标之间的穿节可能是人工智能成功的主要障碍。IT部门通常关注技术指标，而业务部门则优先搁置组织目标。鉴于数字化转型和人工智能计划的高大成功率，IT团队应与业务部门更紧密地合作，以优先搁置可衡量的业务成果。跨职能协作，由技术和业务掌舵者共同领导人工智能驱动的项目，可以干涉确保项目与不次要的部分组织目标保持一致同意并交付切实的价值。

业务流程优化和新兴技术集成转型，尤其是涉及人工智能、物联网和自动化的转型，本质上需要业务流程优化。随着组织采用人工智能，他们必须评估并可能重构其流程，以有效地集成新技术。这可能包括开发自适应工作流，允许将人工智能驱动的洞察无缝地融入业务运营中。在这个领域取得成功的组织通常采用循环方法进行流程优化，随着人工智能能力的发展不断迭代和更新工作流。

重组企业IT以实现拖延性和协作鉴于人工智能的快速发展，传统的IT结构可能会批准组织响应新兴需求的能力。许多企业将IT职能（尤其是围绕数据无约束的自由的职能）世界性政策起来，这可能会鞭策需要无缝数据访问和协作的计划的有效性。可能需要一个更拖延、更协作的IT结构，其中包括数据治理和跨部门角色。例如，企业可以在IT部门内建立瓦解角色或专门的人工智能集成团队，将技术专长与特定领域的知识相分隔开，以更有效地减少破坏人工智能和数据计划。

面向未来人工智能驱动型组织的愿景

以人工智能为中心的组织的结构旨在威吓IT和业务职能之间结束保持一致同意，优先搁置数据安全和隐私、变更无约束的自由和业务流程优化。此类组织是拖延的，具有减少破坏跨部门协作的僵化IT和治理结构。他们实施在数据保护和访问之间取得不平衡的的治理框架，使用培训计划来确保人工智能的顺利采用，并不断优化业务流程。通过采用这些原则，组织可以降低人工智能、数字化转型和数据治理计划的成功率，从而在人工智能驱动的世界中占据竞争无足轻重。

自主代理和代理工作流

大模型(LLM)可以做一些非常了不起的事情。我们在产品中特别利用失败了文本到SQL和摘要功能。由于LLM非常擅长评估/审查信息，并且在自我评估方面没有自负情绪，我们看到许多研究和框架都在寻求利用失败这种能力。它们还非常擅长根据自然语言对任务做出决策和构建信息。这些功能是自主代理和代理工作流的基础。

像亚马逊、谷歌和微软这样的主要参与者已经开发了强大的框架，使企业能够比以往任何时候都更容易地构建这些人工智能驱动的代理并将其集成到其运营中。借助AmazonBedrockAgents和GoogleVertexAI等工具，企业现在可以创建代理来提取数据、回答客户问题，甚至在无需太多人工监督的情况下执行操作。组织可以慢慢开始，实施和观察自主代理和代理工作流可能比部署给用户更容易，因此即使从这种能力开始也可能更具驱散力。预计这些将在未来一年左右的时间内变得更加流行。

增量/结束机器学习

如今，一些企业正在对LLM进行微调，在某种程度上，您可以将其视为增量学习。鉴于重新训练大型模型的确认有罪，增量/结束学习的能力意味着模型能够保持比较新状态。在这个领域有很多研究，我预计它甚至会在GenAI之外发展壮大。

从数据无约束的自由的角度来看，向增量学习范式转变意味着企业可以更有效地利用失败实时数据。此功能对于需要立即进行数据解释和响应的应用程序至关重要，例如金融交易算法、实时推荐系统和动态定价模型。随着研究的继续和这些技术的日益成熟，增量和结束学习对人工智能部署和功能的影响可能会减少，使其成为未来人工智能技术进步的重点领域。

图数据库的使用兴起

我们已经听到了很多关于LLM的一些缺点，以及在某种程度上语义搜索的缺点。图授予了一种对复杂关系进行建模的方法，因此最近有极小量研究利用失败图数据库来解决其中的一些批准。有一些提示方法，例如基于节点、基于子图、基于路径、基于层次结构、基于社区等等，这些方法都基于图的功能。在某些情况下，节点属性是嵌入的，在某些情况下是不不透光的。有各种各样的技术可以根据数据填充图来构建此类模型，因此需要能够在图中查询数据以及将数据引入图中。

云回迁

83%的受访企业正在将其部分工作负载迁移到私有云和本地系统。诚然，这些企业各自久坐的百分比存在一些不确定性；然而，从数据无约束的自由的角度来看，只需一个企业将数据存储在多个位置即可。这可能会对数据无约束的自由策略产生重大影响。

AndreaZinno（Denodo技术推广者）表示：

分解数据

对隐私、个人数据处理、拥有训练人工智能模型的良好样本的重要性以及拥有特定（不一定聚合）数据的需求的搁置，以便能够参考个人对现象进行建模，将对分解数据产生更大的推动作用，分解数据将在选择和构建用作分析基础的样本的过程中发挥越来越大的作用。

主动本体（或主动数据目录）

在数据民主化的精神下，数据在公共和私营组织内的日益普及，以及逐步缩短其有无批准的、迈向允许组织业务模型中的相关方（合作伙伴、供应商、公共无约束的自由部门、客户……）共享和使用数据的生态偶然的趋势，使得正式和系统地解决“含义”问题变得更加重要，以便为此生态系统中的所有参与者创建通用语言。

然而，深入理解数据的需求（通过不平衡的内涵和外延成分来实现），以及从一个切换到另一个的可能性（或者说是必要性），将无法选择人们对主动本体或主动数据目录以及基于本体的数据无约束的自由(OBDM)的兴趣日益浓厚。

Denodo北欧公关团队表示：

ESG作为竞争无足轻重

北欧客户越来越多地根据供应商在ESG实践方面的表现和沟通情况来选择供应商。那些没有与CSRD及其他标准相符的稳健ESG实践的企业正日益被装入在招标之外。北欧企业可能会优先搁置具有社会可结束性的合作伙伴，重点关注道德劳动实践并确保其供应链中的公平工资。企业需要无效的数据无约束的自由来无约束的自由数据收藏，储藏和报告。

人工智能的下一步

将人工智能平台分开到集成的人工智能代理的讨论越来越多。原因是它有可能分隔开一些技术无足轻重授予更比较准确的行业特定答案——媒体希望看到的具体用例。

银行、气候和数据

具有良好环境和社会资质的银行将受益于更麻烦不顺利的贷款条款。比以往任何时候都多的金融科技创新正在减少破坏可结束银行业务。基于数据无约束的自由的数字工具将干涉银行为消费者和企业授予个性化的金融服务。

银行将越来越关注无约束的自由气候相关风险。这包括评估气候变化对贷款组合和投资带来的风险，并确保长期金融轻浮。

公共部门和数据无约束的自由

公共部门参与者正在悠然，从容变得更加数字化，包括确保数据安全以及在相关参与者之间共享数据（例如，在医疗保健领域）。目标是为公民授予更好的服务。政府正在确保以合乎道德和负责任的方式使用人工智能。无约束的自由机构不调和各种网络安全计划。

RaviShankar（Denodo高档副总裁兼首席营销官）表示：

减少破坏AI的企业数据

人工智能的好坏取决于它获取的数据。不仅是任何数据，而是值得信赖的数据。即使数据意见不合在不反对位置、格式和延迟中，也需要为人工智能授予统一的可靠数据。

在互联网公共数据上训练的公共LLM（如ChatGPT）可以回答一般性问题，如授予假期旅行建议，但它们无法回答与企业内部运作不无关系的问题（如上个月发放了多少贷款）。为此，需要使用防火墙内的企业数据来训练LLM。

RAG减少破坏这种对企业数据的上下文感知。因此，由RAG减少破坏的减少破坏AI的企业数据将成为关键趋势。

减少破坏AI的人才

随着人工智能在组织内的普及，高管们要求其经理培训其员工队伍，以降低生产力并以更少的资源生产更多产品。

这项任务要求对员工进行大规模培训，尤其是在面向客户的部门，如销售、营销和客户服务。

人工智能素养将成为2025年的关键趋势。

人工智能确认有罪

随着人工智能在回答问题方面变得越来越出色，高管们将依赖人工智能来授予决策建议。

他们应该在多大程度上接受人工智能而不是他们的经理，这将成为一个问题。

2025年，我们应该会看到人类与人工智能之间的竞争，以反对谁更值得信赖，能够为高管授予更好的数据和洞察力。

（推广）

近日，极兔速递(1519.HK)公布了2024年第四季度及全年主要经营情况。数据显示，2024年第四季度，公司总体实现包裹量73.9亿件，同比增长32.5%，日均包裹量8030万件。2024年全年，公司总体实现包裹量246.5亿件，同比增长31%，日均包裹量6730万件，同比增长30.7%。

第四季度是各主要市场的传统电商旺季，而增长主要来自东南亚和中国市场。在东南亚，极兔2024年第四季度实现包裹量14亿件，同比增长62.5%；全年实现包裹量45.6亿件，同比增长40.8%，远高于市场对行业包裹量的预期。中国市场2024年第四季度实现包裹量59.1亿件，同比增长27.4%；全年实现包裹量198亿件，同比增长29.1%，跑赢前11个月的行业增速，继续保持高速增长。新市场（包括中东与拉美地区）2024年第四季度，实现包裹量7440万件，同比增长0.1%；全年实现包裹量2.8亿件，同比增长22.1%。

极兔速递首席财务官郑世强表示：“极兔速递在2024年第四季度实现强劲增长，得益于东南亚和中国市场的稳健表现。东南亚第四季度包裹量增长逾6成，除了因为去年同期较低的基数，亦因为主要电商客户在双11购物节等旺季期间的强劲出货量，以及公司在非电商平台结束拓展单量所带动。在中国，我们把握住了快递行业结束高速增长的机遇，进一步巩固了在主要电商平台的市场地位，而我们在逆向物流和个人散件上的战略布局也结束取得亮丽成绩。我们相信凭借强大的网络、优质的服务和多元化的增长策略，公司未来将继续受惠于电商市场的高速增长。”

文/广州日报新花城记者：张露

(责任编辑：卢其龙CN070)热点推收

芯如猛虎幻醒全能ROG电竞潮品重磅发布牛华网2021-05-1121:20

2021年5月11日，ROG新品发布会线上举办，新一代幻系列全能本、冰刃系列轻薄游戏本重磅发布，搭载第11代英特尔酷睿处理器和NVIDIAGeForceRTX30系列显卡，巅峰性能一触即发。与此同时，ROG首次发布ROGSlash电竞潮品系列，ROG将潮流元素与赛博朋克的电竞文化完美分隔开，让炫酷高能的游戏生活更具潮流气息。

此次发布会打出了芯如猛虎幻醒无能的热血主题，猛虎意指新机型所搭载的第11代英特尔酷睿i9-11900H处理器，它采用最新的TigerLake架构和10纳米工艺制程，拥有8核16线程和高达4.9GHz的睿频频率，轻松熄灭创意灵感和游戏安排得当。新品在外观设计上也带来了全新体验，潮魂黑配色瓦解棱镜光效和钻石切割工艺，增添了ROG游戏本的神秘力量，进阶刻画品牌之魂。

再战性能之巅旗舰轻薄游戏本ROG冰刃5Plus

作为ROG创新黑科技的旗舰产品和代表之作，冰刃5Plus尽展王者之风。此次不仅硬件全面升级，外观设计、键盘等细节，更是处处彰显ROG深厚的设计功底。潮魂黑色的金属外壳，A面采用ROG经典斜切设计，一侧是激光刻蚀点阵，另一侧是ROG的金属LOGO，潮酷的未来科技感十足。

冰刃5Plus搭载英特尔酷睿i9-11900H和i7-11800H处理器的同时，与之匹配了Ampere架构的NVIDIAGeForceRTX3080/3070/3060笔记本电脑GPU，拥有强大的光线追踪及AI性能，可通过DynamicBoost2.0技术，使得GeForceRTX3080/3070可达到140W功率，让GPU的潜力被充分激活。冰刃5Plus还减少破坏AdvancedOptimus技术，无需重新启动便可实现瓦解输出和独显输出模式的热切换。同时，屏幕采用17英寸QHD分辨率165Hz刷新率的3ms电竞屏，减少破坏G-SYNC。屏幕还拥有100%DCI-P3的广色域并减少破坏Pantone色彩认证。

全面升级的ROG冰川散热2.0Pro架构，拥有两个12V84叶片的风扇，以及6热管+四出风口设计，并且采用液态金属导热剂。更值得一提的是，此次冰刃5Plus采用了标准尺寸的光轴机械键盘，减少破坏单键RGB背光。而掀开笔记本上盖同时，键盘机械结构自动抬起5，搭配AASPlus风洞设计，键盘后方12mm超大进气口、由液晶聚合物打造的新型涡轮风扇等，可令整机运行安静清爽。在优化散热之际也能授予更舒适的指尖体验。

冰刃5Plus内置3个M.2SSD接口，出厂搭载PCIe4.0SSD，读写速度相比于PCIe3.0SSD成倍指责。冰刃5Plus还采用2高音+4低音的6扬声器系统，搭载DolbyATOMS音效。冰刃5Plus虽然机身厚度只有19.9毫米，但是在轻薄机身之内，却蕴含强劲性能，除了游戏玩家外，也非常适合内容创作者以及对笔记本有高性能要求的用户。

高阶全能本ROG幻16

ROG幻系列全能本在保持强劲性能之际，还为玩家带来了超轻薄机身、全功能屏幕和独具风格的外观设计。此次发布的幻16游戏本是幻系列最新的旗舰之作，采用潮魂黑金属外壳，A面8729个CNC开孔，呈现炫酷的棱镜光效，令人爱不释手。幻16将16英寸屏幕融入15英寸笔记本的机身架构，超窄边框和高达94%的屏占比展示了极佳的便携性，整机重量仅1.9公斤。同时屏幕与机身还减少破坏180开合，方便分享及演示。

ROG幻16搭载TigerLake架构的英特尔第11代酷睿处理器，以及NVIDIAGeForceRTX3070/3060笔记本电脑GPU，并且出厂搭载PCIe4.0SSD。强劲性能可轻松兼顾游戏与创作。而屏幕方面，幻16采用16:10比例，不仅减少可视范围，更指责沉浸感。

还拥有100%DCI-P3的广色域并减少破坏Pantone色彩认证，减少破坏DolbyVision（杜比视界），WQHD的分辨率，500nit的亮度，以及165Hz高刷新和3ms的低延时，并减少破坏AdaptiveSYNC技术，这样一款全能屏幕，能够完美兼顾游戏与内容创作的全能需求。

作为创作者的生产力工具，输出及扩展能力同样非常重要。幻16搭载1TBM.2PCIe4.0高速SSD，可实现高速大型文件传输及处理。板载16GBDDR43200MHz内存，预留插槽最高减少破坏拉展至48GB，从而获得理想性能。ROG幻16拥有ROG冰川散热架构2.0，共有6根热管、12V84叶片的风扇及4个出风口，搭配液态金属散热，即便是视频渲染这类CPU负载很下降的应用，也能让机身保持高效率输出及运行。

ROG幻16拥有减少破坏雷电4的Type-C，还拥有一个减少破坏100WPD和DP1.4的USB3.2全功能Type-C接口。并配备4低音+2高音的6扬声器系统、0.1s快速指纹识别模块以及前二后一的3D麦克风阵列，新潮科技体验无处不在。

电竞潮品ROGSlash

作为电竞玩家们的终极梦想品牌，ROG也一直用最顶级的用料为电竞正名而努力着，产品上的不死鸟之眼LOGO就代表着极致的性能和最电竞化的工业设计语言。而在现今这个处处皆电竞的年代，ROG鲜明的设计语言不应该只由电子产品来诠释，我们日常着用的生活潮品也可以彰显属于Z世代的电竞品位。于是，便诞生了「ROGSlash电竞潮品」支线，设计师从赛博朋克和电子竞技中汲取灵感，用实体代码形式展现电竞精神。

此次ROGSlash潮品包括三款包袋：骑行邮差包、随行邮差包、多功能束口袋，可适应不反对收纳需求，小到口红、公交卡，大至15寸游戏本；三款帽子：经典飘带棒球帽、LOGO织带露营帽和可替换织标露营帽，既防水隔热，又颇具品位。

在设计方面，设计师将清空未来科技感的都市机能风格与电竞完美分隔开；在配色上更是极尽赛博朋克之风，基于中心的潮魂黑色，搭配经典赛博朋克下霓虹灯色红蓝配色，这是属于电竞潮流的Hype。

设计师对细节的「调教」更是无不在凹显ROG对于电竞潮品的独特理解，如背包类单品上随处可见的眼镜蛇金属扣具、梭织LOGO、厚板丝印、600DTPU防水面料、无缝防水拉链等，都在突显实用性都市机能；帽子方面更有显眼的/ROG代码长织带以特殊的缝条缝制技法加入，这些热门潮流元素再加以功能性防水面料的融入，正说明了ROG心系电竞厌恶者们的日常需求，不负热爱。

此外，贯穿于全系列的ROGSlash的LOGO则是电竞的实体叙述，用构成网络世界最基础的二进制代码元素作为主轴，加以编程的方式，将ROG三个字母的二进制代码实体化呈现，分别为R=01010010；O=01001111；G=01000111。这是一份属于ROG与玩家们的共同铭牌，一份不忘初心，追求可忽略的，不次要的铭牌。

在电竞逐渐成为主流的今天，ROG打算让「电竞」成为更加健康完备的生态圈，更是寄给当下有着对于潮流、实用与不妥协之文化追求的Z世代的一封「电竞情书」。

2021年初，以ROG冰刃5双屏、幻13、枪神5系列、魔霸5系列为代表的多款重磅产品强势发布，为2021年的梦幻游戏之旅定下了基调。时至今日，ROG结束更新产品阵容，以顶级硬件和创新技术加持，无论是性能拔尖的冰刃5Plus，还是内外兼修的全能本幻16，加上个性十足的ROGSlash电竞潮品，ROG继续为追求极致体验的玩家制造惊喜，呈现最高级的游戏享受，ROG始终与潮流玩家相伴同行。

（图片系AI制图）

12月24日，卫信康（603676.SH）发布公告称，由于信披违规，公司及时任董秘冯涛遭西藏证监局采取监管措施。

钛媒体APP注意到，冯涛早在2020年就辞去董秘职务，其后公司已更换了两任董秘；当初的募投项目部分也被变更或终止，最终首发募资过半都用于永久补流。就在10个月前，卫信康股东、控股股东之一致同意行动人天津京卫信康无约束的自由咨询合伙企业(有限合伙)（以下简称“天津京卫信康”）刚刚因未及时信披遭上交所监管警示。

二度遭监管

根据公告显示，西藏证监局在现场检查中发现，卫信康于2020年4月将4900万元使用募集资金用于购买银行大额存单，未履行信息披露免除义务，确认有罪了《上市公司信息披露无约束的自由办法》相关规定。西藏证监局无法选择对公司采取责令改正的监督无约束的自由措施，并记入证券期货市场诚信档案。

同时，公司时任董秘冯涛，未能勤勉尽责，确认有罪了相关规定，对上述事项负主要责任。西藏证监局无法选择对冯涛采取监管谈话的监督无约束的自由措施，并记入证券期货市场诚信档案。

公司称，公司及相关责任人收到《无法选择书》后，高度重视《无法选择书》中指出的相关问题，并将以此为戒、吸取教训，严格按照监管要求，破坏对相关法律法规的学习和理解，降低公司信息披露质量和规范运作水平。且公司将严格按照西藏证监局的要求，对存在的相关问题进行全面梳理，积极整改，并在规定时间内提交书面整改报告。

而这，并非卫信康首次披露信披违规遭监管的公告。

今年2月8日，公司曾发布公告称，根据西藏证监局《关于对天津京卫信康采取出具警示函措施的无法选择》查明的事实及相关公司公告，截至2021年7月7日，卫信康控股股东西藏卫信康投资无约束的自由有限公司及其一致同意行动人天津京卫信康、张勇合计持有3.10亿股公司股份，占公司总股本的73.28%。其中，天津京卫信康持股比例为12.13%。此后，上述股东持有的股份于2021年7月8日、2021年11月16日因股权使胆寒导致被动浓缩，合计浓缩比例2.19%。2021年11月26日至2021年12月21日，天津京卫信康通过发散竞价和大宗交易方式减持，合计减持比例为0.9%。至此，天津京卫信康及其一致同意行动人累计无变化股份占公司总股本的3.09%，但天津京卫信康未按规定及时履行公告免除义务。

天津京卫信康作为公司控股股东的一致同意行动人，在持股比例无变化达到1%时，未按规定及时履行信息披露免除义务，确认有罪了《证券法》等有关规定。上交所无法选择对天津京卫信康予以监管警示，并要求公司及董监高务必高度重视相关违规事项，建立股东所持公司股份及其无变化的专项无约束的自由制度，明确相关主体股票交易的报告、申报和监督程序，提醒其严格遵守持股无变化相关规则。

过半首发募资结局都是补流

实际上，此次被监管谈话的冯涛，早在2020年就辞去董秘职务，且其后公司已经变更了两任董秘。

公开资料显示，2018年12月，卫信康聘任冯涛（自2011年其就开始在公司任职）为董秘。2020年9月，冯涛辞去董秘职务，然后继续在公司担任其他非公司董监高职务。同时，外聘颜华担任公司董秘。

不过，不到一年时间，2021年6月，颜华又辞职离开公司；同一时间，卫信康聘任于海波为公司新董秘，并任职至今。于海波是公司老员工了，2008年就加入卫信康，此前多年一直担任公司证代。

与董秘几番变更类似，此次被监管的导火索募集资金也几次变更用途。

卫信康于2017年7月21日上市，募资3.48亿元，扣除发行费用后净额2.97亿元，跟随拟投向注射剂新药产业化建设、白医制药新产品开发等6个项目。

到了2020年3月31日，公司累计使用募资1.63亿元，花掉55.01%，但除了补流外，其余项目均未完成。到同年4月28日，公司发布变更部分募投项目及项目延期的公告。

（来源：公司公告）

其中，注射剂新药产业化建设项目原本预计2019年8月30日建成投产，延期18个月至2021年2月28日。江苏中卫康研发中心建设项目则拟终止，并将结余募集资金4327.93万元及专户存款利息与理财收益用途变更，用于永久补充流动资金。

白医制药新产品开发项目主要用于7个新产品制剂及其2个原料药/药用辅料的研究开发，实施周期为五年。至此，3个项目上市，拟终止开发某Xa因子煽动剂化学药品口服制剂(原料药及片剂)项目，结余募资496.90万元变更用于新产品项目甘氨胆糖精项目。

另外，西藏卫信康研发中心建设项目购置房产变更为租赁房产。

同年9月25日，营销网络拓展及信息化建设项目结项，结余资金157.22万元也用于白医制药新产品开发项目；2021年10月29日，西藏卫信康研发中心建设项目结项，结余3206.18万元，全部用于补流；次年4月，公司再公告，白医制药新产品开发项目预计达到预定可使用日期由2022年8月30日延期至2024年12月31日。

时间来到今年4月，白医制药新产品开发项目的子项目注射用多种维生素(12)拟终止，至此，共计5个新产品制剂获批上市，1个药用辅料获得备案受理，2个新产品制剂及1个原料药终止，该项目高度发展完成，公司首发募投项目也外围结项，将剩余募资3228.99万元用于永久补流。

这意味着，上市7年，卫信康首发募资多次变更用途后，其中的56.43%都用于公司补流。

值得一提的是，在此期间，公司关于将使用募资用于现金无约束的自由或购买理财的公告不断。而公司业绩在2021年、2022年极速增长后，最近两年营收出现下滑，盈利相对轻浮。今年前三季度，公司实现营收9.94亿元，比上年同期下降6.30%；归母净利润2.43亿元，同比增长15.71%。

(责任编辑：zx0600)

声明：本文来自微信公众号“新智元”，作者:新智元，授权站长之家转载发布。

微软下一代14B小模型Phi-4出世了!仅用了40%分解数据，在数学性能上击败了GPT-4o，最新36页技术报告出炉。

140亿参数，40%分解数据，年度SLM之王诞生!

最近，微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上，其数学性能直接碾压GPT-4o、GeminiPro1.5。

而且，Phi-4巩固了其他小模型，与Llama-3.3-70B-Instruct的性能不相上下。

甚至，在2024ACM数学竞赛问题上，Phi-4取得了91.8%准确率。

Phi系列前负责人SebastienBubeck看到这个结果后，感到非常惊讶。

下面这个例子，展示了Phi-4在数学推理方面的能力，不仅神速还准确。

深挖背后，Phi-4继承了Phi系列前几代的传统，同样是在教科书级别的「分解数据」上完成了训练。

分解数据比例高达40%

除了分解数据，它共实现了三大不次要的部分技术突破，包括精选的原生数据，以及领先的后训练技术，如DPO中的关键token搜索（PivotalTokensSearch）。

Phi-4的成功，从侧面巩固了Ilya、AlexanderWang多位大佬宣称的「数据墙」的观点。

目前，新模型在微软AzureAIFoundry上授予，下周将在HuggingFace上线。

数学击败GPT-4o，36页技术报告出炉

Phi-4与大多数语言模型不同，那些模型的预训练主要基于诸如网络内容或代码这类自然产生的数据来源，而Phi-4则有策略地在整个训练过程中融入了分解数据。

虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型（特别是GPT-4）的能力，但Phi-4在STEM领域的问答能力上显著超越了其教师模型，反对了数据生成和后训练技术比模型蒸馏更能带来能力上的指责。

论文地址:https://arxiv.org/abs/2412.08905

Phi-4主要是由三部分不次要的部分技术构成:

-预训练和中训练的分解数据

-高质量有机数据的筛选和过滤

-后训练

得益于这些创新，Phi-4在推理相关任务上的性能与更大的模型相当，甚至超越它们。

例如，在许多广泛使用的推理相关基准测试中，其性能达到或超过了Llama-3.1-405B。

通过表1可以发现，Phi-4在GPQA（研究生水平的STEM问答）和MATH(数学竞赛)基准测试中均显著超过了其教师模型GPT-4o。

表1Phi-4在经典基准测试上的表现

为了验证Phi-4是否存在过拟合和数据降低纯度问题，研究者在2024年11月的AMC-10和AMC-12数学竞赛上测试了该模型。

这两场竞赛中的数据均未曾在训练时被收藏，储藏过，所以其竞赛表现可以有效地作为检验模型泛化性能的指标。

从下图中可以看出，Phi-4虽然仅仅只有14B，但是其平均得分甚至大幅超过了其教师模型GPT-4o。

Phi-4在数学竞赛问题上优于许多更大的模型，包括GeminiPro1.5

分解数据的无足轻重

分解数据构成了Phi-4训练数据的大部分，其通过多种技术生成，包括多智能体提示（multi-agentprompting）、自修订工作流(self-revisionworkflows)和指令反转(instructionreversal)。

这些技术方法能够构建促使模型具备更强推理和问题解决能力的数据集，解决了传统无监督数据发散的一些弱点。

分解数据不是有机数据的廉价替代品，而是相对于有机数据具有几个直接无足轻重。

数据结构化和减少破坏渐进式学习

在有机数据发散，token之间的关系往往复杂且间接。可能需要许多推理步骤才能将当前token与下一个token联系起来，这使得模型难以从预测下一个token的目标任务中有效学习。

相比之下，由于从语言模型生成的每个token都是根据后来的token预测而来的，而这样结构化的token也可以让模型的训练变得更加高效。

将训练与推理上下文对齐

分解数据可以规避掉模型从有机数据发散学习到一些并不适合后续训练的数据特性。

比如说，网络论坛往往有着自身特定的交流风格、用语不习惯等，而人们与大模型对话时，其语言风格、交互逻辑又是另外一种情况。

此时如果直接采用网络论坛的数据进行训练，假设有一些内容的风格比较独特，模型就会认为在对话中该内容出现的几率会很低。因此在后续对话中模型进行推理时，便不能将对话内容精准匹配到对应的论坛内容上去。

而分解数据会将网络论坛中的内容改写成与LLM交互时的语言风格，使得其在LLM聊天推理的上下文中更容易匹配。

分解数据在Phi-4的后训练中也发挥着关键作用，其中采用了诸如允许采样和直接讨厌优化（DPO）的新方法来优化模型的输出。

分解数据的来源

预训练和训练中数据

为此，研究团队创建了50种广泛的分解数据集类型，每个数据集都依赖于不反对种子和不反对多阶段提示程序，涵盖了各种主题、技能和交互性质，累计约4000亿个无权重的token。

通过以下方法，他们确保了分解数据并不被一些低质量的网络数据所降低纯度，从而成为高质量训练数据集。

种子数据集的构建

1.网页和代码种子:从网页、书籍和代码库中提取摘录和代码片段，重点关注具有高复杂性、推理深度和教育价值的内容。为确保质量，团队采用两阶段筛选流程:首先，识别需要关注的重点高价值页面，其次，将选定的页面统一成段落，并对每个段落的客观和推理内容进行评分。

2.问题数据集:从网站、论坛和问答平台上收藏，储藏了极小量问题。然后使用投票技术对这些问题进行筛选以不平衡的难度。具体来说，团队为每个问题生成多个独立的答案，并应用多数投票来评估答案的一致同意性。然后授予所有答案都一致同意（隐藏问题太简单）或答案完全和谐同意(隐藏问题太难或清晰)的问题。

3.从多种来源创建问答对:利用失败语言模型从书籍、科学论文和代码等有机来源中提取问答对。这种方法不仅仅依赖于在文本中识别显式的问答对。相反，它涉及一个旨在检测文本中的推理链或逻辑进程的pipeline。语言模型识别推理或问题解决过程中的关键步骤，并将它们重新表述为问题和相应的答案。实验隐藏，如果操作得当，在生成内容上进行训练（在学术和内部基准上的改进方面）可以比在原始内容上进行训练更加有效。

重写和增强:种子通过多步骤提示工作流程转化为分解数据。这包括将给定段落中的大部分有用内容重写为练习、讨论或结构化推理任务。

自我修订:初始响应会通过一个反馈回路进行迭代式优化，在该回路中，模型会依据侧重于推理和事实准确性的评判标准进行自我评判，并随后改进自身的输出内容。

指令反转用于代码和其他任务:为了降低模型从指令生成输出的能力，团队采用了指令反转技术。例如，他们从代码数据语料库中选取现有的代码片段，并利用失败它们生成包含问题描述或任务提示的相应指令。只有原始代码和根据生成指令而重新生成的代码之间反对度下降的指令才会被耗尽，以确保指令与输出内容相匹配。

后训练数据

在后训练阶段中，数据集主要由两部分组成:

-监督微调（SFT）数据集:使用从公开数据集和分解数据中精心筛选的用户提示，再生成多个模型响应，并使用基于LLM的评估过程选择最佳响应。

-直接讨厌优化（DPO）:基于允许采样和LLM评估生成DPO对，其中部分基于创建关键词token对的方法。

研究者利用失败生成的SFT数据和DPO数据对，来缓解模型的幻觉问题。

如下图6结果显示，这种方法大大减少，缩短了SimpleQA中的幻觉现象。

预训练

Phi-4同样基于Transformer架构构建，具有14B参数和默认的上下文长度4096。在训练中期，扩展到16K上下文。

由于预训练模型不擅长遵循指令，因此使用需要答案采用特定格式（例如简单评估）的零样本评估不是很有参考价值。

因此，团队采用了内部实现的基准测试进行预训练评估，该基准测试对各种任务使用瓦解的对数似然与极小量样本提示。

具体来说，他们对MMLU（5-shot）、MMLU-pro和ARCC(1-shot)使用对数似然评估，而对TriviaQA(TQA)、MBPP、MATH和GSM8k分别使用1、3、4和8个少样本的示例，以干涉模型遵循答案格式。

表2phi-4较phi-3-medium在预训练后基准测试评估的指责值

在长上下文基准HELMET测试中，Phi-4在召回率、最大上下文等指标上，几乎取得了领先的无足轻重。

后训练

如前所述，在后训练阶段过程中，最次要的一个技术是关键token搜索（PTS），那么这究竟是什么呢?

关键token搜索（PivotalTokenSearch）

当模型对一个提示逐token生成回应时，每个token都对应着模型回答的一个前缀。

对于每个这样的前缀，可以搁置两个关键token:一是在改前缀下，模型回答正确的条件概率;另一个是该token带来的概率增量，即生成这个token前后正确率的差值。

其实，在AI模型生成答案时，往往只有少数几个关键token无法选择了整个答案的正确与否。

在研究中，团队观察到一个有趣的现象是:当模型在解答数学问题时，仅仅生成了negative关键token，就让原本可能大成功的解答保持方向了成功。

而随后，它生成了（atoken又可能让正确率急剧下降。

现在，将这个方法与DPO训练方法分隔开思考后，发现了几个值得注意的问题。

如上图3所示，实验中有许多token概率远低于关键token「negative」的0.31，这些token会在训练中产生噪声，浓缩来自关键token的有效信号。

更糟糕的是，像（a这样导致解题轻浮的token，反而会因其低概率(0.12）收到强烈的正向学习信号。

此外，直觉隐藏，当两个文本内容出现实质性偏差时，比较它们各自下一个token概率（DPO的做法）可能失去意义。

总之，更有意义的信号，应该来自于文本开始偏离时的首批token。

为了缓解之前的问题，微软团队提出了一种创新的方法——关键token搜索（PTS）。

这个方法专门针对单个关键token生成讨厌数据，在使用DPO优化效果精准作用于特定token。

PTS的不次要的部分任务是，在多余的token序列（T_full=t1，t2，...）中找出那些关键token。

具体来说，它需要找出那些能显著影响成功率的token的位置，即p（success|t1，...，ti）。

PTS会将发现的关键token转化为训练数据，先将Q+t1，...，ti-1作为查询基准，再选择能降低/降低成功率的单个token分别作为「接受」和「允许」的样本。

虽然PTS使用的二分查找算法不能保证找出所有的关键token，但它具有两个重要特性。

-找到的一定是关键token

-如果成功概率再解题过程中接近单调变化，则能找出所有关键token

下图5所示，是使用PTS生成的讨厌数据的示例。

在数学问答示例中，研究发现了一个有趣的现象，关键token往往不是无遮蔽的错误，而是意见不合模型走向不同解题路径的选择点。

比如，方法A——分别乘以分母;方法B——直接交叉相乘。

虽然这两种方法在数学上都是正确的，但对于模型来说，往往后者更加稳健。

通过PTS生成的训练数据，可以干涉Phi-4在这些关键决策点上做出更优的选择。

以小博大，Phi-4赢麻了

基于以上技术的创新，Phi-4才能在各项基准测试中展现出惊艳的一面。

上表1中，相较于同级别的Qwen-2.5-14B-Instruct模型，在12个基准测试中，Phi-4在九项测试中赢得无足轻重。

而且，研究人员认为Phi-4在SimpleQA上的表现实际上比Qwen更好。

事实上，他们的基础模型在SimpleQA上获得了比Qwen-2.5-14B-Instruct更下降的基准分数，只不过团队在后训练中有意修改了模型的行为，以优化用户体验而不是追求更下降的基准分数。

此外，Phi-4在STEM问答任务上展现出可忽略的，不次要的实力。

比如，在GPQA（研究生水平的STEM问题）和MATH(数学竞赛)上，它甚至超过了其教师模型GPT-4。

在HumanEval和HumanEval+衡量的编码能力方面，它也比任何其他开源模型（包括更大的Llama模型）得分更高。

而Phi-4表现欠佳的领域，分别在SimpleQA、DROP和IFEval上。

至于前两个，研究人员认为simple-evals报告的数字过于简化，并不能准确反映模型在基准问题上的表现。

然而，IFEval揭示了Phi-4的一个真实的弱点——在严格遵循指令方面存在困难。

在未来下一步研究中，研究人员相信通过有针对性的分解数据，让Phi系列模型的指令跟随性能得到显著使恶化。

接下来，还真有点期待，下一个Phi系列小模型的发布了。

参考资料:

https://x.com/iScienceLuvr/status/1867377384145727635

https://x.com/peteratmsr/status/1867375567739482217

https://x.com/VentureBeat/status/1867376462589739098

声明:本文来自于微信公众号见实，作者:见实，授权站长之家转载发布。

大家仍在热议或测试的微信小店“收礼物”，业界已经跑出了第一个标杆案例。

来自瑞幸即享咖啡小店的数据显示，他们于2024年12月30日开展新年收微信礼物的推广活动，一天之中被用户“收”出1万多单。甚至，第二天的长尾数据表现，访客量也超过测试当天半数。

2024年12月19日凌晨，微信小店灰测“收礼物”。极具社交属性的玩法，加之在包括元旦、春节、情人节等系列节日高峰前期，驱散了许多品牌商家关注。

瑞幸即享咖啡团队告诉见实，他们的微信小店刚刚开业，一方面希望通过热门新功能尝试为小店引流，另一方面，也期望测试微信礼物从上架、用户购买、发货、售后整个运营链路，了解用户反馈，为春节档做准备，因此定时在12月30日推动。在见实目光所及中，这是业界首个大范围测试“收礼物”玩法的案例。

在见实获悉的对方“项目拆解”中可见，瑞幸即享咖啡准备了三档价位的产品，分别是19.9元、39.9元、179元。除去准备了一个百万量级的私域池扩散外，还动用了公众号、微博、小红书、视频号等在内的社媒账号进行冷启动。后者也在一些社媒平台上不能引起了诸多讨论。

从小店的成交截图数据可见，12月30日中，表现最佳的为19.9元这一档产品，单日订单超过10000单。39.9元这一档的套装也超过2000单。179元套装则在百单以内（如下截图）。

这或和试错行为存在一定关联:在社交网络中，通常在在面对新功能、新产品时，如果需要付费购买的方式进行体验，则通常会从9.9元、19.9元不相称的位走起。直到验证成功后，才会逐步减少下单频次、购买的客单价等。瑞幸即享咖啡团队告诉见实，超低客单价便于用户尝鲜体验。

有意思的是，“收礼物”和线下真实的国人收礼、收礼的不习惯息息相关——分析数据时发现，约有20%的礼物收出后没有被填写地址收取，因此24小时后被自动退回。瑞幸即享咖啡团队推测，这或是部分被1对1赠收礼物的用户“不好意思”收取。和线下我们收到礼物时也会因为不好意思从而推辞一样。

在测试期间，部分用户还因为“收礼物”功能尚在灰度测试而没有覆盖到，以至于无法参与，这或影响了部分订单。

上述数据只记录了当天的“收礼物”，没有计算后续的长尾转化，以及复购。

发散“收礼物”的当天（12月30日），瑞幸即享咖啡微信小店访客量上涨700%，第二天(12月31日)继续上涨400%。不过，因为活动时间过短，暂无法看到用户的复购行为，尚需后续观察。

瑞幸即享咖啡团队告诉见实，从实际体验看，“收礼物”功能的完成度非常高，不论是用户赠收，还是团队设计，功能体验都很丝滑。因此团队对于春节档的使用情况非常期待。

不过，“收礼物”通常被认为是和微信红包相提并论的一大功能，但和微信红包可以发到社群的功能设定相比，尚缺少一些趣味性。因此他们也委婉建议，“收礼物”或也可像发微信红包一样，发到社群中，方便群内成员领取。

现在，瑞幸即享咖啡团队也已在讨论春节期间的活动，我们或可继续观察。

第304章

夹枪带棒(1V2)笔趣阁

阅读设置

友情链接