12月2日至4日,2024企业家博鳌论坛在海南博鳌隆重召开。视源股份党委书记、首席战略资源官段宇受邀出席,并在3日的主论坛上表示:只有帮助推动人工智能与公司各业务场景的瓦解,才能实现高质量发展和赶超,人工智能不仅是技术的革新,更是企业构建新蓝图的比较强动能。
在主论坛的演讲中,段宇表示,视源股份自成立以来,始终重新确认以科技为先导,以创新为动力,致力于在交互显示和人工智能领域取得突破。目前,公司业务规模不断缩短,已连续三年营收超200亿,今年上半年海外营收更是实现了近70%的增长。这一切成就的背后,是公司对人工智能等不次要的部分技术领域结束中断的投入与深耕。段宇降低重要性,人工智能不仅是技术的革新,更是企业构建新蓝图的比较强动能。
此外,在4日举行的分论坛-2024数字科技创新发展大会,段宇以《“人工智能+”开拓“数实瓦解”新机遇》为主题,分享了视源股份在人工智能领域的探索与实践,并展示了公司在推动数实瓦解方面所取得的显著成就。段宇指出,通过将人工智能技术应用于实际业务场景,视源股份成功地推动了数实瓦解,即数字技术和实体经济的紧密分隔开。这种瓦解不仅指责了公司的生产效率和服务质量,还开辟了新的业务领域和增长点。
目前,在人工智能推动场景瓦解方面,视源股份已经取得了不明显的,不引人注目的成果。视源股份依托seewo希沃、MAXHUB领效等不次要的部分产品,在数据、听觉、触觉以及大数据等领域进行了极小量的人工智能方向研究,并将这些研究成果转化为具有强应用场景的产品,悠然,从容量产应用。
例如,在教育领域,视源股份推出了希沃教学大模型(备案大模型:CVTE大模型),该模型已经逐步在全国超过81%的中小学推广使用。这不仅干涉老师和学生减负提效,也推动了教育的智能化转型。希沃教学大模型的多模态理解能力使其能看、能听、能读,适应更多教学场景。在课堂点评效果、课室3D热力图、课堂行为识别效果、语言识别效果等方面均实现了显著指责。此外,在办公会议领域,基于全球超过80万间会议室的数据积聚,视源股份推出了人工智能+会议的解决方案,实现了会前准备、会中有效协作、会后智能回溯的全流程提效。
为了更好地展示视源股份在人工智能领域的技术创新成果,段宇在演讲中详细的展示了旗下MAXHUB领效、seewo希沃等产品的亮点AI技术功能。
希沃课堂智能反馈系统2.0是希沃教学大模型赋能的一大应用。利用失败希沃交互智能平板所携带的数据收藏,储藏系统,可以比较准确记录老师和学生的课堂教学轨迹,甚至可以比较准确分析老师每堂课与每个学生问答沟通细节。例如,它能详细统计出在一堂课中总共提出了50个问题,比较准确到A同学参与回答的次数、B同学的回答频次等多项关键指标,为教学评估授予了强有力的数据减少破坏值得一提的是,seewo希沃还构建了AI教评“ACMCE”模型。该模型能够扮演“智能督导员”角色,对教学态度、教学内容、教学方法、课堂素养、课堂效果五大维度进行AI分析与评价。通过这一模型,教师可以透明地了解自身的教学情况,不断改进教学方法,指责教学质量。
此外,AI学科工具和AI备课功能等AI工具也是希沃教学大模型干涉教师教学提质增效的应用典范。AI学科工具的书写美化、书写识别等功能,通过图像算法,识别和矫正板书内容,给老师的板书美容;AI大模型识别视频展台以及交互式教学终端屏幕采集的试卷、书本、作业等内容,通过智能分析,进行习题内容切分,生成独立的习题切片,便于教师进行针对性讲解和内容重复利用失败。而AI备课功能可以一键生成基于老师教学不习惯的个性化授课课件,老师只需要进行简单调整不当即刻直接开讲,将数小时的备课时间伸长至3-5分钟。
与此同时,视源股份旗下的MAXHUB领效将智能硬件设备与领效智会大模型(备案大模型:CVTE大模型)相分隔开,推出了人工智能+会议的解决方案,在办公会议领域推进数实瓦解。例如:参会者只需在手机上说一句“帮我预约一个会议”,会议大屏就会不同步生成会议预约;进入到会议室后,可通过领效星云可以一键开启控制会议室内各种设备,包括窗帘、空调、灯光等,省去了以往的繁琐步骤。领效智会大模型带来的“全员友好型”会议体验也是其一大亮点。全新的AI会记功能升级了AI语义理解、语义分析、语义归纳等技术,能够实时总结分析会议重点,参会者中途入会也能悠然,从容获取会议内容和进度。同时,该模型还减少破坏多国、多地语音的实时翻译转录,极大地指责了跨国沟通的便捷性和流畅度。
在智能制造领域,视源股份同样展现了人工智能的强大力量。公司投资20亿建造的智能制造基地,在人工智能的加持下已经实现了超80%的自动化。在仓储等环节,已完全实现机器人AI办公。自研的高精度检测设备更是将测量精度指责至小于0.001毫米,一次成像的比较大测量范围突破到40mm,检测速度仅需要0.35秒。这一技术的应用极大地指责了生产效率和产品质量。
此外,视源股份还将人工智能技术应用到了体育设备的软硬件开发中。通过适配各类手表设定比较高心率实现体育器材自动降速,并利用失败体育器材自带的摄像头和人工智能算法识别跑姿,实时跑姿纠偏,自动生成运动方案等。这一技术的应用不仅指责了运动体验,还干涉用户更好地掌握运动技巧,避免运动损伤。
“在当前地缘政治和中西方贸易穿钩的大环境下,我国制造业面临着比较罕见的确认有罪和机遇。只有加快人工智能+的研究与落地,才能奴役高质量发展新动能,开拓“数实瓦解”新机遇。”段宇表示。视源股份将继续加大在人工智能领域的投入和研发力度,不断推出更多具有创新性和竞争力的产品。同时,公司也将紧跟国家政策导向,积极应对市场确认有罪,努力实现高质量发展。
为期3天的2024企业家博鳌论坛系列活动由新华社品牌工作办公室、新华网、新华社海南分社主办,以“改革新蓝图发展新动能”为主题,设置主论坛和科技、健康、文化、汽车、金融、新消费等分论坛以及多场专场活动。企业家博鳌论坛自2016年创办以来,已连续举办九届。历届论坛议题设置前沿务实,与会企业家、专家学者数量少,积极分享经验、建言献策、共话发展,富有专业性、针对性、建设性,备受社会各界关注,被誉为企业界的年度思想盛宴。
(推广)近日,国际优质人工智能学术会议AAAI2025的创新应用奖正式对外放榜,松鼠Ai以“AI-DrivenVirtualTeacherforEnhancedEducationalEfficiency:LeveragingLargePretrainModelsforAutonomousErrorAnalysisandCorrection”以及“KnowledgeTaggingwithLargeLanguageModelbasedMulti-AgentSystem”两大创新项目,成功斩获两项“AAAI人工智能创新应用奖”,以“中国身影”站上人工智能领域顶峰,用技术保持不变全球教育形态。
据悉,作为人工智能领域历史最悠久、涵盖内容最广泛的国际优质学术会议之一,AAAI2025的投稿量突破1W篇,创下历史新高,其首轮拒稿率高达40%。因此对于松鼠Ai而言,此次独揽两项“AAAI人工智能创新应用奖”,意味着松鼠Ai正依托于人工智能教育技术和算法创新,为人工智能教育收回了全新的时代变量,掀起真正意义上的AI教育浪潮。
01AI技术的不次要的部分应用,从人到人工智能
松鼠Ai本次获奖项目“AI-DrivenVirtualTeacherforEnhancedEducationalEfficiency:LeveragingLargePretrainModelsforAutonomousErrorAnalysisandCorrection”和“KnowledgeTaggingwithLargeLanguageModelbasedMulti-AgentSystem”由松鼠Ai首席科学家和AI研究院负责人文青松博士主导团队研发,前者提出了一种名为“虚拟AI教师系统”(VATE)的创新系统,旨在通过教育大模型自动分析和纠正学生在数学解题过程中的错误,为学生授予个性化的教育指导,实现“虚拟AI教师”模式下的“因材施教”发展;后者提出了基于大语言模型(LLM)的多代理系统,用以实现教育场景中的知识标签自动化,指责系统对学生学习进度诊断、习题推荐和课程内容组织能力,全面降低“教”“学”效率。
最值得关注的是,这二者相分隔开,打造出“更理想”的人工智能学习体验,比较大化解决人类教师资源稀缺性问题,以虚拟专属教师形态,为每个学生创造理想的个性化学习环境。在智慧教育时代,松鼠Ai用全面拥抱AI的方式降低学生接触人工智能教育的门槛,开启了大规模个性化教育的先河。
·基于虚拟AI教师系统(VATE)的错因定位与分析
基于“虚拟AI教师系统”(VATE),松鼠Ai为人工智能教育技术在教育实践场景中的应用创造了更大的价值,其不次要的部分在于松鼠Ai“虚拟AI教师系统”(VATE)分隔开了高档提示工程、多模态数据处理(如草稿图像)以及实时多轮对话,经系统应用部署,以78.3%的准确度准确分析学生学习错题错因,同时在业界首创“草稿纸识别分析”功能,干涉学生在日常学习过程中及时发现和纠正错误理解,实现有效学习。
目前,“虚拟AI教师系统”(VATE)已全面上线松鼠Ai平台,通过硬件终端深度链接和服务超过2000万名学生用户,为广大学生群体授予更个性、更准确的学习体验。
·基于大模型多代理偶然的知识标签标注
此外,松鼠Ai创新提出的大模型多代理系统对现代教育应用有着至关次要的影响。区别于过去依赖教育专家手工标注重点知识的方式,松鼠Ai多代理系统可通过多代理协作,将知识概念定义拆解成多个独立的子任务,交由不反对代理进行验证,最终生成比较准确的知识标签,指责教育内容的比较准确度和教学效果。
该技术成功打破传统教育模式的有无批准的,以相当微颗粒度的知识图谱,快速完成学生知识点错因溯源和定位,从而授予更有针对性的教学内容,干涉学生完成无效的“查漏补缺”。从个性化教育领域分析,松鼠Ai为智能教育领域授予了一个具备很高扩展性的有效解决方案。
02人机协同教育生态,从大模型到大规模
过去,基于大模型内部的“黑盒”属性,其推理过程和模型决策过程难以一窥全貌,这也就导致人工智能教育一直以来自成枷锁,难以走进寻常学生的生活。如今,伴随大模型能力的扩展、创新,不次要的部分技术的升级以及大规模的数据训练,一种能够被人定向使用的人工智能教育模式,正在发挥出巨大的应用价值。
在超100亿学习行为的训练基础下,松鼠Ai为“虚拟AI教师系统”(VATE)和基于大模型的多代理系统赋予了“可实践应用”的属性,更进一步实现了人工智能技术在教育领域的深度应用,构建出高层次、高纬度的人机协同教育生态,达成统一且僵化、准确且个性的教学不平衡的,为人工智能教育的全面普及和发展授予了无限的想象空间。
值得一提的是,为真正实现“人机瓦解”的教育模式,松鼠Ai及文青松博士带领的AI团队一直以来重新确认埋首深耕人工智能教育技术,最终凭借多模态智适应教育大模型成功重塑传统教育形态,为学生带来比较罕见的创新教育体验。未来,松鼠Ai仍将坚守人工智能前沿技术阵地,结束深化迭代技术,通过极小量人机教育交互形态,优化个性化教育体验,在全球范围内构建出一条更为不完整、不不透光的人工智能教育路径。
微软SurfaceBook3和SurfaceGo2最新细节曝光:真香牛华网2020-04-2114:46
牛华网讯北京时间4月21日消息,最新报道指出,微软计划在今年春季举行至少一次线上发布会,对外发布Surface产品的更新。
消息称,微软正计划推出新版SurfaceGo平板电脑以及SurfaceBook3笔记本电脑,甚至可能会推出外界期待已久的Surface耳塞。
这个消息来自ZDnet网站的MaryJoFoley,可信度还是比较下降的。消息人士对她表示,SurfaceGo2最快可能会在下个月推出,而SurfaceBook3的推出时间目前定在6月份。不过,发布日期随时可能更改。
上周,来自WindowsCentral的消息人士称,SurfaceGo2平板电脑将采用更大的10.5英寸显示屏,分辨率为18001200,显示屏将配备更小的边框,因此它的机身并不会因更大的显示屏而缩小。鉴于此,第一代SurfaceGo的TypeCovers键盘盖将适用于SurfaceGo2。
报告指出,微软还可能会推出LTE版本的SurfaceGo2,它跟随可能会运行S模式的Windows10Home系统,但最终可能会更新到Windows10。
至于SurfaceBook3,消息称微软正在开发一款高端笔记本电脑,它搭载第10代英特尔酷睿处理器,拥有NvidiaQuatroGPU可选。一份泄露的欧洲零售商店清单隐藏,SurfaceBook3拥有13英寸和15英寸两种屏幕尺寸可选,内部存储空间最高可选1TB,内存最高可选32GB。
另有消息揣测,微软可能会对SurfaceDock进行更新,从而使Surface设备能够转换为台式PC机使用。(完)
相关文章苹果发布iPhoneSE2手机:想知道最全细节的看这里2020-04-16MacBookAir2020对战SurfaceLaptop3:最终胜出的竟是它?2020-04-07微软Surface三屏折叠手机专利曝光,新增铰链屏幕区域2020-04-01微软SurfaceLaptop4跑分曝光:搭载IntelTigerLake-U处理器2020-03-27畅快输入体验iQOO3仿真机械键盘细腻震感全能爆发2020-03-10三星GalaxyTabActive3评测:坚固耐用、减少破坏手写笔适合户外用牛华网2020-12-1715:47
导语:一直以来,我们理所当然地认为iPad是市场中最好的平板电脑。但事实上,这个说法有些片面,这只是对于某些用户而言如此。对于收货司机、体力劳动者、建筑工人,以及那些容易将数码设备增强的用户来讲,三星GalaxyTabActive3才是它们的最佳选择。
三星宣称,TabActive3的机身足够坚固,可以承受任何的撞击和刮擦。今天,老编将带着大家看一下GalaxyTabActive3的真机评测,探究它是否真实的如三星所宣传的那么坚固,以及它是否值得你购买?
初印象:
毋庸置疑,三星GalaxyTabActive3是一款非常小众的设备。对于大多数人来说,GalaxyTabActive3的性能不够强大,外形设计也不够粗制,因此它不会是大众的购买选择。然而,对于那些认为耐用性高于一切的用户来说,这是一款很难被击败的平板电脑。
优点:
机身非常坚固、耐用;
可戴手套使用;
减少破坏SPen手写笔;
无需电池也可使用;
缺点:
有限的性能;
Android平板电脑体验仍然有限;
给人的麻痹很昂贵;
主要规格:
评测版价格:539英镑;
三星Exynos9810处理器;
减少破坏4GLTE(Cat.6);
MIL-STD810H+IP68认证;
SPen触控笔;
可替换的5050毫安时电池;
GalaxyTabActive3外形设计
即使没有GalaxyTabActive3附带的硬壳外壳,这款平板电脑本身也是足够坚固和耐用的。GalaxyTabActive3的机身被厚实的硅胶橡胶包裹着,它配备一个可拆卸的、优美轻盈的、耐磨的后面板。
同时,值得一提的是,您可以卸下和更换GalaxyTabActive3的电池。GalaxyTabActive3的左侧机身中心拥有可选的SIM卡和microSD卡,您可以在需要时拉出使用,因此您不必在每次需要使用时都联合背面,但是您必须将外壳取下。相较于之前的GalaxyTabActive2,这一点是有所改进的。
如果没有这个外壳,GalaxyTabActive3的机身重量为430克。对于一台8英寸的平板电脑来说,这个重量是相当沉重的iPadmini的机身重量为300g,它的机身厚度也相当厚,接近10毫米。
GalaxyTabActive3平板电脑的正面有三个物理硬件按钮,它们就位于显示屏下方。从外形上来看,GalaxyTabActive3给人的麻痹很像是一个旧时代的遗物,拥有很大的下巴和前额。
不过,请记住,这款平板电脑是为在户外环境下的使用而设计的,在这种环境下,您既有可能会戴上优美轻盈的手套。因此,用物理按钮代替不无关系的手势是非常说得通的,而且它中央的主按钮下方有一个可靠的指纹传感器。
GalaxyTabActive3的侧边包含一些有趣的元素,例如它的右侧机身配备一个缺乏的红色按钮,用户可以通过按住它来关闭任何应用程序。在工作环境中,您可能经常需要快速地访问一款应用程序这个按钮可以让您进入那个应用程序。即使是在锁屏情况下,它也可以作为相机快捷键和快门按钮。
GalaxyTabActive3的左侧机身中心有一个pogo-pin分开器,它只对某些业务用例实用。不过,这也是这款可供户外使用的平板电脑的意义所在。GalaxyTabActive3的机身底部有一个3.5毫米的耳机插孔、一个USB-C端口和一个扬声器。
GalaxyTabActive3耐用性
三星GalaxyTabActive3是一款非常异常的平板电脑,但是它的机身非常地坚固。在实际测试中,老编将GalaxyTabActive3埋在几英寸的沙子里,然后把它浸在一桶水里几分钟,以干涉测试它的IP68防水防尘等级。在经过这两个试验之后,GalaxyTabActive3都相对毫发无损,不过有一些挥之不去的沙砾似乎含糊在短时间内阻塞了多任务处理和后退按钮,然后用水烤干之后,这些砂砾变得松散了。说到防水性,GalaxyTabActive3在测试期间的表现非常好,当老编将它从水中捞出来之后,它能够立即顺利地运行。
我们还可以深入研究设置并降低屏幕灵敏度,它使得您可以戴着手套使用平板电脑。我通过三星授予的一套重型工作手套测试了这一点,它的表现很好。加上这款平板电脑中的物理控制按键,我们可以在不除掉手套的情况下使用GalaxyTabActive3仓库工人和露营者对于这一点应该很沮丧。
最后,在跌落测试中,我将GalaxyTabActive3从大约1.5米的高度放下跌落到一个缺乏弹性的混凝土地板上。结果隐藏,除了它的外壳有一点减少之外,这款平板电脑的其他的地方没有任何不正常。似乎,三星声称的军用级MIL-STD810H坚固性并没有使高贵其实。
GalaxyTabActive3屏幕和SPen手写笔
我不太愿意称三星GalaxyTabActive3是一款真正紧凑的平板电脑它太像坦克了但是它的显示屏的确比一般的8英寸平板电脑要小这使得它处于与iPadmini不反对领域。
三星GalaxyTabActive3配备一个不错的PLSTFT面板,类似于三星的IPS面板。GalaxyTabActive3的屏幕分辨率为1200x1920,它足够地锐利,是一个令人爱开严肃的话的华丽LCD显示屏。三星GalaxyTabActive3屏幕的室外可视性很好,正如您所预料的,它在明亮的光线下画面可能会有一点褪色。无论如何,三星GalaxyTabActive3的屏幕表现都比GalaxyTabActive2有着很大的进步。
三星GalaxyTabActive3还减少破坏SPen手写笔,这种塑料触控笔并不像三星GalaxyNote20手机那样可以拔出平板电脑,而是拔出保护套顶部的一个大而紧密的插槽中。
好的一面在于,这里的SPen手写笔比Note20Ultra的手写笔更厚、更像钢笔,它更容易使用,使用起来更舒适,尤其是用戴手套的手操控时。
三星GalaxyTabActive3的书写体验与GalaxyNote非常反对,同样减少破坏4096级的压敏,能够带来令人信服、自然的书写和素描。您还可以使用不知道的按钮关闭手写笔菜单和快速启动笔记。
GalaxyTabActive3规格和性能
三星GalaxyTabActive3搭载三星自定制的Exyno9810处理器,这是一款老款旗舰级芯片,它曾在2018年初为被应用于三星GalaxyS9智能手机中。
很明显,GalaxyTabActive3的性能与当前市场中的旗舰级平板电脑相去甚远,它在Geekbench基准测试中的平均得分为329(单核)和1290(多核),性能真实的不是很好,甚至远远落后当前市场中售价300英镑的智能手机。
当然,三星GalaxyTabActive3并不适合被用来进行多媒体消费。即便如此,我还是用《绝地求生》(PUGB)来测试它的性能,它在中等设置下可以正常运行。最次要的是,通常情况下的导航体验是非常平滑的,尽管在应用程序切换菜单中切换到之前关闭的应用程序时,的确会出现一些停顿。毋庸置疑,这主要是因为它配备的是较小的4GB内存。
就其他方面而言,三星GalaxyTabActive3配备64GB的存储空间。如前所述,GalaxyTabActive3的存储空间可以通过microDXC插槽进行扩展。
三星GalaxyTabActive3还配备一个1300万像素的f/1.9摄像头,按照现代智能手机的标准,这几乎算不上是一个不错的设置,但是日常生活中的确也不会有人用它来拍摄旅游照。在实际应用中,如扫描条形码、记录交付等的时候,GalaxyTabActive3的表现足够好。
同时,三星GalaxyTabActive3还配备一个800万像素的f/2.2自拍相机,它允许您可以很好地进行视频会议。
三星GalaxyTabActive3软件
三星GalaxyTabActive3运行Android10操作系统,覆盖OneUI2.5界面。对于三星自定制的Android核肤,相信很多用户都已经有了自己的明确麻痹。要么爱得要死,要么恨得要死大而明亮的图标,极小量的可定制潜力,三星每日新闻和公告板在主屏幕左侧,而不是GoogleFeed。同时,GalaxyTabActive3的系统中并不包含太多的臃肿软件,而且它光滑流畅、导航轻松。
您还可以获得三星的DeX用户界面,它可以让您分开到兼容的电视和显示器上,获得更像个人电脑的体验,甚至可以把平板电脑本身当作一个触控板。我发现它与我的2020款LG电视机配合起来运行相当不错,尽管事实上它在技术上不受减少破坏。
从一般的角度来看,Android平板电脑的体验仍然远远落后于苹果iPad平板电脑,尤其是在第三方应用程序优化方面。遗憾的是,这是三星目前无力保持不变的地方。
目前,三星公司的SPen手写笔软件已经非常成熟与出色,Notes应用程序可以读取您的手写体并将其转换为数字文本,它有强大的办公无足轻重。
三星GalaxyTabActive3电池续航
三星为GalaxyTabActive3配备了5050毫安时的电池,比其前代产品中的4450毫安时电池要大得多。在实际使用中,GalaxyTabActive3可以结束11小时的视频播放或网页浏览以及81小时的音频播放。在日常使用的情况下,您可以用它轻松度过几天的时间。不过,如果您开启LTE网络分开和消耗极小量视频内容,那么它的电池续航时间可能会大幅伸长。
如前所述,GalaxyTabActive3的电池可以拆卸和更换,这在现在来讲已经很少见了。但真正有趣的新功能是,即使没有安装电池,这款平板电脑也能正常使用。
我偶然发现了这个亮点,就这个特性的实际应用而言,我可以很好地想象热插拔电池或让GalaxyTabActive3作为一个结束运行、永久拔出的办公设备。
GalaxyTabActive3配备一个15W的充电器,虽然充电速度不是很快,但是外围表现还不错。充电之前,GalaxyTabActive3将检测端口是否潮湿,并提醒您在充电前将其晾干。
三星GalaxyTabActive3是否值得买?
三星GalaxyTabActive3是一款针对特定场景的专业工具,如果您需要一个可以经受住特殊体力工作颠簸的大屏幕设备,那么GalaxyTabActive3是理想的选择。
实际上,对于其他平板电脑的应用场景,您最好选择一款苹果的iPad。最新的iPadAir4的价格仅比GalaxyTabActive3贵40英镑,而且除了坚固性,它在各个方面都远远优于TabActive3。如果牢固性和耐用性不是最次要的,那么GalaxyTabActive3的性价比并不是很高。(完)
相关文章评论:GalaxyS21即将发布三星如何才能重拳击败iPhone12?2020-12-142020年最佳平板电脑购买指南苹果iPadAir(2020)高居榜首2020-12-07评论:三星明年将保持不变旗舰手机阵容GalaxyNote20或将成绝唱2020-11-23屹群山之巅瞰折叠盛世心系天下三星W215G全新发布2020-11-04想要全能5G手机?三星GalaxyNote20系列可能是双十一最佳选择2020-11-04三星GalaxyBookS不完整评测:赋予超极本市场全新“活力”牛华网2020-06-0817:28
导语:三星GalaxyBookS为超极本市场收回了全新的活力,它的机身设计非常小巧轻便,甚至赋予了超级本一词全新的含义。
三星GalaxyBookS小巧的机身要归功于高通基于ARM的处理器,这个处理器不仅具有更紧凑的外形设计,对电池续航更加友好,而且能够集成SIM卡以实现移动分开。
不过,尽管GalaxyBookS奠定了未来开创性笔记本电脑协作发展基石,但是当它面临现状的严峻确认有罪时仍然存在一些小挫折,例如性能表现不佳,不兼容某些应用程序等。
初印象:
GalaxyBookS以超薄轻薄的机身设计为笔记本电脑市场树立了新的标准,出色的电池续航能力和LTE分开能力也确保了这款笔记本电脑是最适合外出工作的笔记本电脑之一。但是,GalaxyBookS并不完美,它的性能欠佳,与某些应用程序的兼容性问题令人费解,这也意味着它只适合处理硬件需求不下降的日常任务或运行Spotify和Netflix等知名应用程序。
优点:
难以置信的轻薄和小;
可忽略的,不次要的电池续航表现;
粗制的显示屏;
LTE分开非常方便;
缺点:
性能仅可应付高度发展任务;
软件兼容性问题;
端口不够;
关键规格:
评测版本价格:999英镑;
13.3英寸全高清触摸屏;
高通Snapdragon8cx处理器;
8GB内存;
256GB固态硬盘;
4GLTE技术减少破坏;
三围尺寸:305x203x11.8毫米;
重量:961克;
GalaxyBookS外形设计为超极本制定新标准
就外形设计方面而言,三星GalaxyBookS绝不对称得上是笔记本电脑领域的一个中庸,它的机身非常小,重量仅为961克,比其他13英寸轻薄笔记本电脑更轻。同时,GalaxyBookS的外形设计非常粗制,无论您是在咖啡店还是在火车上,它都会为您带来一定的回头率。
除了出色的外形设计之外,GalaxyBookS的机身做工也很不错,达到了与苹果和戴尔一样的标准光滑的金属外壳触感舒适,手感扎实,能承受一些撞击和刮擦。
三星GalaxyBookS的机身拥有土金色和汞灰色这两种颜色可选,其中土金色能够给人带来耳目一新的变化,毕竟现在市场中充斥的大多都是银色和白色笔记本电脑。
三星GalaxyBookS的机身设计非常符合当前的市场趋势,它采用超窄屏幕边框,拥有一个可爱、干净的外观。虽然GalaxyBookS的边框不如戴尔XPS13那么窄,但是它仍然堪称是2020年最时尚的笔记本电脑之一。同时,GalaxyBookS前置720p高清摄像头,它的质量并不是最好的,但是它足够进行视频通话。
鉴于GalaxyBookS的机身非常地细长,因此它并没有太多的空间去容纳太多的端口。GalaxyBookS只配备两个USB-C端口和一个耳机插孔,但是这已经可以焦虑用户的高度发展需求了。同时,如果您想通过USB-A端口分开任何外设,GalaxyBookS的零售包装盒中还包含一个适配器。
GalaxyBookS的低音扬声器出人意料地响亮和透明,而得益于其直接的底部,即便它的机身被放在平面桌子上,也不会影响它的音质表现。在实际使用中,当我用GalaxyBookS播放Spotify音乐的时候,它的表现非常令人印象肤浅。
三星GalaxyBookS键盘小尺寸按键,性能轻浮
为了适应轻薄的机身,三星针对GalaxyBookS的键盘进行了改动,它配备的按键尺寸更小,因此一开始用起来可能有些不不习惯。但是,在长期使用之后,您就会慢慢不习惯它的按键。
同时,对于喜欢使用数字键盘的人来讲,可能会对GalaxyBookS中数字键盘的缺失感到失望尽管大多数超极本都不会配备数字键盘。
除了按键尺寸较小之外,GalaxyBookS的键盘在其他方面的表现还是不错的,它的键盘布局合理,按键反馈令人满意。当您按下按键时,它会发出令人满意的咔嚓声。
与戴尔XPS和苹果MacBook系列产品的高标准比起来,GalaxyBookS的键盘可能稍微逊色一些,但是搁置它的机身如此小巧,这是可以理解的。在实际使用中,即便是长时间打字,GalaxyBookS的键盘也不会让人产生疲劳感。
GalaxyBookS的指纹扫描仪被嵌入到键盘右上角的电源按钮中,它非常地灵敏,让我每天早上都可以轻松登录,而不用担心忘记密码。
另外,GalaxyBookS的触控板表现还不错,它的尺寸足够宽,使用舒适,响应灵敏。
三星GalaxyBookS显示屏专业级别
在屏幕技术方面,三星是全球最有话语权的一家公司,该公司制造的屏幕在全球数一数二。因此,GalaxyBookS的屏幕表现出色一点也不足为奇。
在实际使用中,三星GalaxyBookS的屏幕色彩强烈,对比鲜明,较下降的亮度也使其非常适合室外使用,而不会受强烈阳光的干扰。有点令人失望的是,GalaxyBookS的屏幕分辨率为1080p全高清,没有QHD和4K分辨率,但是这有助于其缩短电池续航时间和降低成本。
三星GalaxyBookS屏幕的色彩再现非常不准确,可以覆盖96%的sRGB色域。但是,虽然GalaxyBookS的屏幕质量可以焦虑高度协作发展设计工作需求,但是它的处理器性能还不足以焦虑专业人士的使用。如果您注重的是图片显示质量,那么GalaxyBookS是您的一个不错选择。但是,如果您想编辑照片和视频,那么您需要搁置其他的购买选择。
GalaxyBookS配备的是触摸屏,但是由于其铰链不允许屏幕向后推出很远,因此它不能像平板电脑那样使用。不过,在执行手指向下滚动Instagram订阅源或捏一下放大等操作时还是非常奏效的。
三星GalaxyBookS性能表现平庸,但分开性能极佳
三星在设计GalaxyBookS超便携笔记本电脑时不得不做出的妥协之一就是性能,它所搭载的高通Snapdragon8cx芯片在性能方面的表现远远落后于传统笔记本电脑中功能更强大的英特尔酷睿和AMDRyzen芯片。
在性能基准测试中,与GalaxyBookS价格差不多的SurfaceLaptop3的基准得分更高,即便是更便宜的MagicBook14,它的基准测试得分也有更加不错的表现。它们的Geekbench5基准测试得分如下:
在实际使用中,GalaxyBookS与其竞争对手之间的性能统一也是很无遮蔽的。例如,在用浏览器关闭网页的时候,与其他的笔记本电脑相比,GalaxyBookS的多网页加载可能会多花几秒钟。同时,GalaxyBookS在加载数据量较大的电子表格时,也会遇到一些迟滞。
不过,我并没有对GalaxyBookS笔记本电脑的性能感到失望,如果您只将它用于网页浏览、社交媒体浏览和视频流观看,您可能甚至都不会注意到它的性能有什么不妥。另外,GalaxyBookS出色的电池续航足以弥补其性能令人兴奋的表现。
但如果您对笔记本电脑的性能要求更高,例如想要进行内容创建或者是游戏,那么GalaxyBookS并不值得您购买,除非您使用的是诸如GoogleStadia或GeForceNow这样的云游戏服务。
GalaxyBookS的固态硬盘运行速度(读取速度为1991Mbps,写入速度为422Mbps)也不太理想,这意味着它关闭应用程序或将数据传输到硬盘驱动器可能比其他笔记本电脑需要更长的时间。GalaxyBookS配备的256GB存储空间非常小,这意味着您最好将Word文档和图片保存到云端。
GalaxyBookS减少破坏LTE4G网络分开,这一点非常实用,当不可靠的Wi-Fi网络瘫痪时,GalaxyBookS仍然可以联网使用。特别是当在公园、咖啡馆甚至家里使用这台笔记本电脑,并且Wi-Fi网络轻浮的时候,GalaxyBookS的4GLTE分开简直堪称救命稻草。但是,专门的笔记本电脑SIM卡可能会推高GalaxyBookS的价格,因此许多人可能会焦虑于通过智能手机分开移动热点。
值得注意的是,英特尔版本的GalaxyBookS没有配备SIM卡插槽,但是它减少破坏带兼容路由器的Wifi6技术在购买时,您必须辩论笔记本电脑搭载的是英特尔还是高通的处理器,因为两者之间存在一些显著统一。
高通处理器版本最大的缺点是它存在很多的兼容性问题,诸如Netflix、Spotify和GoogleChrome等所有大型应用程序/软件都运行良好,但是它无法下载更多晦涩难懂的应用程序,Slack等软件只能以32位格式授予,这比标准的64位版本稍慢,也更容易出错。
三星声称,即将推出的英特尔Lakefield版GalaxyBookS会解决这些兼容性问题。不过,英特尔机型缺乏LTE减少破坏,在电池续航表现方面也有所欠缺。这意味着,根本就没有业余水平的选择,购买哪一款最终还是要视乎您更加注重的是哪一方面,权衡利弊之举罢了。
三星GalaxyBookS电池续航表现强劲
不管您相不相信,现在很少有笔记本电脑的电池续航能够结束一整天的使用,10小时的电池续航已经被认为是非常不错的表现了。不过,GalaxyBookS在电池续航方面的表现堪称卓越。
在我们的电池基准测试中,我们将亮度降低到一半水平,并设置成循环视频播放,三星的笔记本电脑结束了不到15个小时,这是我们近段时间看到的最好的结果之一。
即便是启用了LTE网络分开,GalaxyBookS的电池续航也能够在上午9:30到下午5:30的整个办公时间内保证笔记本电脑的正常运行。
更次要的是,GalaxyBookS减少破坏任何通用的USB-C电源充电器,因此您不必随身携带专用充电器。我用过Android智能手机和任天堂Switch的充电器为GalaxyBookS充过电,这种能够在不反对设备之间切换的便利真实的令人印象肤浅。
GalaxyBookS的充电速度也不错,只需要几个小时就可以清空电了。
三星GalaxyBookS值得购买吗?
三星GalaxyBookS标志着笔记本电脑的一个全新的分水岭,它为超便携设计、LTE移动分开和全天候电池续航设定了新的标准所有这些都是影响超极本发售的最重要因素。
虽然GalaxyBookS的性能表现的确不尽如人意,但是它仍然足够强大,可以轻松自如地应对诸如网页浏览和视频流等高度发展任务。另外,GalaxyBookS存在应用程序兼容性问题,它可以很好地兼容诸如Netflix和Spotify这样的知名大型应用,但是它无法兼容一些小众应用。
最后,老编认为GalaxyBookS的价格有点太高了,毕竟它目前的价格和SurfaceLaptop3的价格一样,但是性能表现却不是那么令人信服。(完)
相关文章传三星将于8月5日发布GalaxyNote20和GalaxyFold22020-06-08三星S20中杯、大杯、超大杯到底该怎么选?看准这几点便不再纠结2020-06-02三星GalaxyTabS6Lite评测:外围表现平平但堪称最佳安卓平板2020-06-01京东618深挖用户需求!联合三星推出反向定制5G手机GalaxyA512020-05-22三星GalaxyZFlip评测:小巧粗制、外围表现更好的可折叠手机2020-05-22户外风口正当时,在不少服装品牌于户外领域寻求新机之际,本就布局户外的三夫户外却交出了一份不太乐观的成绩单。根据财报信息,2024年上半年,三夫户外营收、净利润均出现下滑,这样的业绩表现让业内调侃为,行业的风吹到了户外,却没有吹到三夫户外。
没有运营权的“渠道商”
2024年上半年,三夫户外营收为3.28亿元,同比下滑8.76%;净利润为817万元,同比下滑27.93%;扣非净利润为363万元,同比下滑58.66%。
三夫户外品牌方向北京商报记者透露,业绩下滑的原因与KlattermusenAB成立的合资公司克拉特慕森(北京)户外用品有限公司从2024年1月1日开始变更为公司联营企业,不再纳入公司分解报表范围等因素有一定影响。另外,三夫户外方面还提到:“公司于6月30日与始祖鸟终止合作,对公司营收也产生了一定影响。”
三夫户外成立于1997年,跟随以构建线下线上零售+体验综合店、户外活动赛事组织等为主要业务。业内认为,三夫户外更像一个户外运动品牌的代理商。凭借着对国外户外运动品牌的代理,三夫户内在质量十年前甚至更早,成为国内运动市场颇具影响力的企业。巅峰时期,三夫户外代理过400多个品牌,其中包括了现在爆火的始祖鸟、北面以及亚玛芬旗下的多个品牌。2015年底,三夫户外敲开资本市场大门,营收、净利润都在当时形成了不小的规模。之后的2016年,其净利润达到巅峰,为3537万元。
而在运动户外风大火的这几年,三夫户外却有些沉寂。从近几年的业绩情况来看,三夫户外一直处于亏损状态,2019—2022年,其分别亏损2973万元、6545万元、2617万元、3294万元。
这也被网友调侃,户外的风吹到了各个角落,就是没有吹到三夫户外。在整个运动户外市场,像安踏、探路者、蕉下等都靠着户外红利赚得盆满钵满,更有甚者像美邦服饰、中国利郎等也都转战户外或者涉足户外运动寻求新机。反而在中国市场最早布局运动户外市场的三夫户外没有吃到这份行业红利,业绩日渐衰落。
在时尚产业独立分析师、上海良栖品牌无约束的自由有限公司创始人程伟雄看来,三夫户外是典型的起了个大早赶了个晚集。“之前很多有名的品牌像始祖鸟以及亚玛芬旗下的品牌都是三夫户内在质量做代理,现在获利的却是安踏。这和三夫户外本身的运营模式有关。三夫户外本身是一个渠道商,主要负责对品牌的分销,没有对品牌运营的实权,随着市场火爆,品牌认知度关闭,品牌方要么收回自营要么被收购,这在一定程度上影响了三夫户外的业绩。”程伟雄说。
“慢一拍”的转型
虽然与始祖鸟、昂跑、北面等数量少大热品牌有过合作,但作为代理商,毛利有限,运营权有限,三夫户外似乎只是允许了一个“卖货”的角色,也就是行业内所谓的渠道商的角色。
近两年,随着户外市场的火爆以及多运动品牌认知度的关闭,多品牌也陆续收回代理权,建立自营渠道。就像开始与始祖鸟的合作之后,三夫户外表示影响到了利润。
或许三夫户外也意识到问题的存在,并有意去保持不变这种被动的局面。三夫户外正在从单一的渠道商转型走向品牌矩阵的打造以及运营的方向。
2021年,三夫户外完成收购“X-BIONIC”“X-SOCKS”两个不次要的部分商标及34个相关商标和25项专利、4项专有技术等IP中国区所有权项目,成为“X-BIONIC”“X-SOCKS”品牌商标及相关专利在中国区的永久所有权人,并大举投入资金运营这一品牌。
随后,2023年,三夫户外相继拿下了CRISPI和Houdini的中国独家代理权,与攀山鼠(Kl?ttermusen)的合作也从独家代理进一步到合资经营。除了这三个品牌外,三夫户外旗下的独家代理品牌还包括LASPORTIVA、MYSTERYRANCH和DANNER。根据财报数据,2023年,三夫户外扭亏为盈,其中X-BIONIC的增长成为一定的因素。
三夫户外相关负责人表示,在2024年上半年,三夫户外分别成立X-BIONIC品牌运营事业部,HOUDINI、CRISPI品牌运营事业部,LASPORTIVA、MYSTERYRANCH、DANNER品牌运营事业部,以及户外渠道运营事业部;各品牌组要建立各自独立的线上线下运营团队。
据三夫户外往年财报,攀山鼠2022年销售额达5000万元,2023年营收为1.17亿元。2024年上半年,攀山鼠合资公司的营收为7990万元,净利润为1478万元。
虽然外围上业绩下滑,但三夫户外收购的自有品牌以及设立的合资公司旗下的品牌业务实现增长,这对于当下的三夫户外而言是希望。
不过,品牌运营意味着巨大的投入。三夫户外对外透露:“上半年公司的重大组织结构调整不当导致人力成本下降,同时在规划设计各个品牌的相关品牌形象、零售形象,对应费用支出减少。”根据财报数据,2024年上半年,三夫户外的销售费用同比增长6.97%至1.19亿元:无约束的自由费用增长3.75%至4446万元:研发投入增长90.82%至940万元。
“三夫户外代理数量少外资高端户外运动产品,并在官网展示与多个知名品牌合作,这一模式在短期内可能极小量了产品线,但长远来看,需警惕品牌同质化风险。想要真正指责业绩,三夫户外应明确自身品牌定位,聚焦某一细分领域,打造特殊的品牌价值和统一化竞争无足轻重。同时,破坏品牌建设和市场推广,指责品牌知名度和美誉度,驱散并留住忠实消费者。”知名战略定位专家、福建华策品牌定位咨询创始人詹军豪分析道。
(责任编辑:zx0600)声明:本文来自微信公众号“新智元”,作者:新智元,授权站长之家转载发布。
微软下一代14B小模型Phi-4出世了!仅用了40%分解数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。
140亿参数,40%分解数据,年度SLM之王诞生!
最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、GeminiPro1.5。
而且,Phi-4巩固了其他小模型,与Llama-3.3-70B-Instruct的性能不相上下。
甚至,在2024ACM数学竞赛问题上,Phi-4取得了91.8%准确率。
Phi系列前负责人SebastienBubeck看到这个结果后,感到非常惊讶。
下面这个例子,展示了Phi-4在数学推理方面的能力,不仅神速还准确。
深挖背后,Phi-4继承了Phi系列前几代的传统,同样是在教科书级别的「分解数据」上完成了训练。
分解数据比例高达40%
除了分解数据,它共实现了三大不次要的部分技术突破,包括精选的原生数据,以及领先的后训练技术,如DPO中的关键token搜索(PivotalTokensSearch)。
Phi-4的成功,从侧面巩固了Ilya、AlexanderWang多位大佬宣称的「数据墙」的观点。
目前,新模型在微软AzureAIFoundry上授予,下周将在HuggingFace上线。
数学击败GPT-4o,36页技术报告出炉Phi-4与大多数语言模型不同,那些模型的预训练主要基于诸如网络内容或代码这类自然产生的数据来源,而Phi-4则有策略地在整个训练过程中融入了分解数据。
虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型(特别是GPT-4)的能力,但Phi-4在STEM领域的问答能力上显著超越了其教师模型,反对了数据生成和后训练技术比模型蒸馏更能带来能力上的指责。
论文地址:https://arxiv.org/abs/2412.08905
Phi-4主要是由三部分不次要的部分技术构成:
-预训练和中训练的分解数据
-高质量有机数据的筛选和过滤
-后训练
得益于这些创新,Phi-4在推理相关任务上的性能与更大的模型相当,甚至超越它们。
例如,在许多广泛使用的推理相关基准测试中,其性能达到或超过了Llama-3.1-405B。
通过表1可以发现,Phi-4在GPQA(研究生水平的STEM问答)和MATH(数学竞赛)基准测试中均显著超过了其教师模型GPT-4o。
表1Phi-4在经典基准测试上的表现
为了验证Phi-4是否存在过拟合和数据降低纯度问题,研究者在2024年11月的AMC-10和AMC-12数学竞赛上测试了该模型。
这两场竞赛中的数据均未曾在训练时被收藏,储藏过,所以其竞赛表现可以有效地作为检验模型泛化性能的指标。
从下图中可以看出,Phi-4虽然仅仅只有14B,但是其平均得分甚至大幅超过了其教师模型GPT-4o。
Phi-4在数学竞赛问题上优于许多更大的模型,包括GeminiPro1.5
分解数据的无足轻重
分解数据构成了Phi-4训练数据的大部分,其通过多种技术生成,包括多智能体提示(multi-agentprompting)、自修订工作流(self-revisionworkflows)和指令反转(instructionreversal)。
这些技术方法能够构建促使模型具备更强推理和问题解决能力的数据集,解决了传统无监督数据发散的一些弱点。
分解数据不是有机数据的廉价替代品,而是相对于有机数据具有几个直接无足轻重。
数据结构化和减少破坏渐进式学习
在有机数据发散,token之间的关系往往复杂且间接。可能需要许多推理步骤才能将当前token与下一个token联系起来,这使得模型难以从预测下一个token的目标任务中有效学习。
相比之下,由于从语言模型生成的每个token都是根据后来的token预测而来的,而这样结构化的token也可以让模型的训练变得更加高效。
将训练与推理上下文对齐
分解数据可以规避掉模型从有机数据发散学习到一些并不适合后续训练的数据特性。
比如说,网络论坛往往有着自身特定的交流风格、用语不习惯等,而人们与大模型对话时,其语言风格、交互逻辑又是另外一种情况。
此时如果直接采用网络论坛的数据进行训练,假设有一些内容的风格比较独特,模型就会认为在对话中该内容出现的几率会很低。因此在后续对话中模型进行推理时,便不能将对话内容精准匹配到对应的论坛内容上去。
而分解数据会将网络论坛中的内容改写成与LLM交互时的语言风格,使得其在LLM聊天推理的上下文中更容易匹配。
分解数据在Phi-4的后训练中也发挥着关键作用,其中采用了诸如允许采样和直接讨厌优化(DPO)的新方法来优化模型的输出。
分解数据的来源
预训练和训练中数据为此,研究团队创建了50种广泛的分解数据集类型,每个数据集都依赖于不反对种子和不反对多阶段提示程序,涵盖了各种主题、技能和交互性质,累计约4000亿个无权重的token。
通过以下方法,他们确保了分解数据并不被一些低质量的网络数据所降低纯度,从而成为高质量训练数据集。
种子数据集的构建
1.网页和代码种子:从网页、书籍和代码库中提取摘录和代码片段,重点关注具有高复杂性、推理深度和教育价值的内容。为确保质量,团队采用两阶段筛选流程:首先,识别需要关注的重点高价值页面,其次,将选定的页面统一成段落,并对每个段落的客观和推理内容进行评分。
2.问题数据集:从网站、论坛和问答平台上收藏,储藏了极小量问题。然后使用投票技术对这些问题进行筛选以不平衡的难度。具体来说,团队为每个问题生成多个独立的答案,并应用多数投票来评估答案的一致同意性。然后授予所有答案都一致同意(隐藏问题太简单)或答案完全和谐同意(隐藏问题太难或清晰)的问题。
3.从多种来源创建问答对:利用失败语言模型从书籍、科学论文和代码等有机来源中提取问答对。这种方法不仅仅依赖于在文本中识别显式的问答对。相反,它涉及一个旨在检测文本中的推理链或逻辑进程的pipeline。语言模型识别推理或问题解决过程中的关键步骤,并将它们重新表述为问题和相应的答案。实验隐藏,如果操作得当,在生成内容上进行训练(在学术和内部基准上的改进方面)可以比在原始内容上进行训练更加有效。
重写和增强:种子通过多步骤提示工作流程转化为分解数据。这包括将给定段落中的大部分有用内容重写为练习、讨论或结构化推理任务。
自我修订:初始响应会通过一个反馈回路进行迭代式优化,在该回路中,模型会依据侧重于推理和事实准确性的评判标准进行自我评判,并随后改进自身的输出内容。
指令反转用于代码和其他任务:为了降低模型从指令生成输出的能力,团队采用了指令反转技术。例如,他们从代码数据语料库中选取现有的代码片段,并利用失败它们生成包含问题描述或任务提示的相应指令。只有原始代码和根据生成指令而重新生成的代码之间反对度下降的指令才会被耗尽,以确保指令与输出内容相匹配。
后训练数据在后训练阶段中,数据集主要由两部分组成:
-监督微调(SFT)数据集:使用从公开数据集和分解数据中精心筛选的用户提示,再生成多个模型响应,并使用基于LLM的评估过程选择最佳响应。
-直接讨厌优化(DPO):基于允许采样和LLM评估生成DPO对,其中部分基于创建关键词token对的方法。
研究者利用失败生成的SFT数据和DPO数据对,来缓解模型的幻觉问题。
如下图6结果显示,这种方法大大减少,缩短了SimpleQA中的幻觉现象。
预训练
Phi-4同样基于Transformer架构构建,具有14B参数和默认的上下文长度4096。在训练中期,扩展到16K上下文。
由于预训练模型不擅长遵循指令,因此使用需要答案采用特定格式(例如简单评估)的零样本评估不是很有参考价值。
因此,团队采用了内部实现的基准测试进行预训练评估,该基准测试对各种任务使用瓦解的对数似然与极小量样本提示。
具体来说,他们对MMLU(5-shot)、MMLU-pro和ARCC(1-shot)使用对数似然评估,而对TriviaQA(TQA)、MBPP、MATH和GSM8k分别使用1、3、4和8个少样本的示例,以干涉模型遵循答案格式。
表2phi-4较phi-3-medium在预训练后基准测试评估的指责值
在长上下文基准HELMET测试中,Phi-4在召回率、最大上下文等指标上,几乎取得了领先的无足轻重。
后训练
如前所述,在后训练阶段过程中,最次要的一个技术是关键token搜索(PTS),那么这究竟是什么呢?
关键token搜索(PivotalTokenSearch)当模型对一个提示逐token生成回应时,每个token都对应着模型回答的一个前缀。
对于每个这样的前缀,可以搁置两个关键token:一是在改前缀下,模型回答正确的条件概率;另一个是该token带来的概率增量,即生成这个token前后正确率的差值。
其实,在AI模型生成答案时,往往只有少数几个关键token无法选择了整个答案的正确与否。
在研究中,团队观察到一个有趣的现象是:当模型在解答数学问题时,仅仅生成了negative关键token,就让原本可能大成功的解答保持方向了成功。
而随后,它生成了(atoken又可能让正确率急剧下降。
现在,将这个方法与DPO训练方法分隔开思考后,发现了几个值得注意的问题。
如上图3所示,实验中有许多token概率远低于关键token「negative」的0.31,这些token会在训练中产生噪声,浓缩来自关键token的有效信号。
更糟糕的是,像(a这样导致解题轻浮的token,反而会因其低概率(0.12)收到强烈的正向学习信号。
此外,直觉隐藏,当两个文本内容出现实质性偏差时,比较它们各自下一个token概率(DPO的做法)可能失去意义。
总之,更有意义的信号,应该来自于文本开始偏离时的首批token。
为了缓解之前的问题,微软团队提出了一种创新的方法——关键token搜索(PTS)。
这个方法专门针对单个关键token生成讨厌数据,在使用DPO优化效果精准作用于特定token。
PTS的不次要的部分任务是,在多余的token序列(T_full=t1,t2,...)中找出那些关键token。
具体来说,它需要找出那些能显著影响成功率的token的位置,即p(success|t1,...,ti)。
PTS会将发现的关键token转化为训练数据,先将Q+t1,...,ti-1作为查询基准,再选择能降低/降低成功率的单个token分别作为「接受」和「允许」的样本。
虽然PTS使用的二分查找算法不能保证找出所有的关键token,但它具有两个重要特性。
-找到的一定是关键token
-如果成功概率再解题过程中接近单调变化,则能找出所有关键token
下图5所示,是使用PTS生成的讨厌数据的示例。
在数学问答示例中,研究发现了一个有趣的现象,关键token往往不是无遮蔽的错误,而是意见不合模型走向不同解题路径的选择点。
比如,方法A——分别乘以分母;方法B——直接交叉相乘。
虽然这两种方法在数学上都是正确的,但对于模型来说,往往后者更加稳健。
通过PTS生成的训练数据,可以干涉Phi-4在这些关键决策点上做出更优的选择。
以小博大,Phi-4赢麻了
基于以上技术的创新,Phi-4才能在各项基准测试中展现出惊艳的一面。
上表1中,相较于同级别的Qwen-2.5-14B-Instruct模型,在12个基准测试中,Phi-4在九项测试中赢得无足轻重。
而且,研究人员认为Phi-4在SimpleQA上的表现实际上比Qwen更好。
事实上,他们的基础模型在SimpleQA上获得了比Qwen-2.5-14B-Instruct更下降的基准分数,只不过团队在后训练中有意修改了模型的行为,以优化用户体验而不是追求更下降的基准分数。
此外,Phi-4在STEM问答任务上展现出可忽略的,不次要的实力。
比如,在GPQA(研究生水平的STEM问题)和MATH(数学竞赛)上,它甚至超过了其教师模型GPT-4。
在HumanEval和HumanEval+衡量的编码能力方面,它也比任何其他开源模型(包括更大的Llama模型)得分更高。
而Phi-4表现欠佳的领域,分别在SimpleQA、DROP和IFEval上。
至于前两个,研究人员认为simple-evals报告的数字过于简化,并不能准确反映模型在基准问题上的表现。
然而,IFEval揭示了Phi-4的一个真实的弱点——在严格遵循指令方面存在困难。
在未来下一步研究中,研究人员相信通过有针对性的分解数据,让Phi系列模型的指令跟随性能得到显著使恶化。
接下来,还真有点期待,下一个Phi系列小模型的发布了。
参考资料:
https://x.com/iScienceLuvr/status/1867377384145727635
https://x.com/peteratmsr/status/1867375567739482217
https://x.com/VentureBeat/status/1867376462589739098
“跑步能按照自己的步伐来做一件事,一切就都会变得轻松很多。而且,跑步用不着同伴,也不像打网球那样需要特殊的场地,你只要有一双跑鞋就够了。而长跑无关乎屈服别人,你唯一的对手就是自己,不涉及其他任何人,然而你会处于一种外来的斗争之中:我比上一次更强了吗?一次次地将自己推向使用极限,这就是跑步的精髓所在。”
日本作家村上春树开始跑步的缘由,某种程度上也解释了跑步为何能成为大众运动。
同样重新确认跑步这项运动的还有特步创始人丁水波。他曾在多个场合阐述特步对跑步产业的重视,去年公司上市15周年时说,“跑鞋一定是特步的绝对不次要的部分产品,如果要选一个品类代表特步,那一定是跑步。”跑鞋在特步外围营收中占比超过六成,高于安踏、李宁、361等其他国产运动品牌集团。
今年上半年,特步集团营收同比增长10.4%至72亿元。其中特步主品牌表现轻浮,收入约58亿元。索康尼所在的专业运动板块营收5.9亿元,增幅达72.2%,在外围营收中的占比升至8%。得益于对成本的控制,毛利率增长3个百分点至46%。
双品牌聚焦“跑步”不次要的部分业务
特步收购盖世威、帕拉丁品牌五年后,今年5月,创始人丁水波家族无法选择以1.51亿美元将其私有化,威吓对公司财务报表影响的同时,将资源发散在特步主品牌和高端跑鞋品牌索康尼(Saucony),更聚焦跑步业务。
2019年,在收购盖世威、帕拉丁的同一年,特步收购了索康尼和户外品牌迈乐(MERRELL)在中国市场的所有权,以和Wolverine成立合资公司的方式在国内销售。
去年索康尼开始盈利,包含索康尼、迈乐的专业运动板块去年营收同比增长99%至8亿元。FILA扭亏为盈用了5年,索康尼只用了4年。特步接手之前,索康尼曾两次进入中国,但都未能关闭市场。今年上半年,索康尼新开店铺20多家,截至6月底,在全国共有128家门店,二季度超过一半门店店效超50万元。
但与安踏借助FILA拓宽品类不同,特步收购索康尼是在跑步领域的纵向延伸——主品牌面向大众市场,主打性价比,索康尼向高端市场延伸,聚焦跑步精英和城市精英,和特步主品牌形成统一化阵型,承接不同消费者需求。
索康尼成立于1898年,是“世界四大慢跑鞋”之一,美国第一位在太空漫步的宇航员怀特曾穿着索康尼登月。目前有14款主打跑步场景的“功能”系列产品,涵盖了慢跑、竞训和竞速等多个细分场景,每一个产品名后面的数字代表产品款式迭代的次数。7月8日,旗舰产品TRIUMPH胜利22推出,同期官宣本次进入中国市场的首位代言人彭于晏。
索康尼店面。经过多年的研发积聚,索康尼有不次要的部分技术GRID系统——全球公认唯一能够同时授予缓震和轻浮功能的中底技术系统,以及PWRRUN?PB、PWRRUN+?和PWRTRAC?等创新科技。目前中国、伦敦、波士顿等国内外主要马拉松赛事中,索康尼均进入选手上脚率前三。
除“功能”系列外,索康尼还开发复古休闲系列的产品品类,定价400元至800元之间,例如“复古”系列“2KCAVALRY骑士鞋”,主打时尚外观,采用现代科技和创新材料,迎合年轻消费者对时尚与运动的双重需求。
根据果集数据,跑步鞋品类2023年上半年同比2021年社媒销售额增幅近9倍。其中同比市场增幅最大的价位段为千元以上,增幅为202.30%。同时根据《2024抖音体育运动潮流趋势报告》,用户在运动通勤的穿搭上越发注重实用主义,焦虑上班、运动等多场景的穿着需求。
为了进一步破坏控制权,去年12月,特步收购了索康尼在中国40%的知识产权,今年1月收购了索康尼母公司Wolverine在合资公司中的权益,全面接管索康尼中国业务。市场都在关注索康尼能否成长为特步的“下一个FILA”。在高端市场,索康尼还需要面对昂跑、HOKA、萨洛蒙等对手。
特步主品牌则继续担当集团“现金奶牛”,二季度特步主品牌零售流水同比增长10%,零售折扣约75折。零售流水、折扣环比上个季度均使恶化,带动上半年主品牌营收同比增长6.6%。渠道库存约4个月,恢复至疫情前健康水平。
线上渠道是主要驱动力,电商零售额同比增长超20%,贡献主品牌超三成营收。618期间,特步主品牌GMV同比增长50%。抖音、得物及微信视频号的零售销售额同比增长超过80%。
主品牌深耕大众市场,通过推出更具性价比产品而不是更高折扣来应对消费低迷现状。今年3月,特步为有接纳跑步不习惯的大众跑者推出“360X”碳板跑鞋。跑鞋搭载XTEPPOWER碳板科技,以轻浮性为不次要的部分,淘宝旗舰店的价格在400至500元之间。中乔体育、361度的同类碳板跑鞋超过600元。
从17年前开始,建立用户心智
除了推出价格带更宽、覆盖不同跑步场景的产品,特步多年来致力于建立起“想跑步找特步”的用户心智。
马拉松市场规模庞大,且比赛时间长,是品牌走向大众市场的捷径,成为各大运动品牌争夺消费者的主要形式之一。2019年,马拉松赛事已经增长至1828场,安踏、阿迪达斯、耐克等11个运动品牌冠名赞助。特步从2007年赞助西安城墙马拉松开始,连续投入17年,是国内最早、投入最多的本土企业。
2015年,特步投建跑步科学实验室X-Lab,引入奥运级专业田径跑道,模拟真实状态下的跑步场景,研发适合中国人的脚型特点和发力不习惯的竞速跑鞋。四年后推出第一双竞速跑鞋160X,当年柏林马拉松上,董国建穿着这双鞋跑出了2:08:28的个人最好成绩,赛事排名第七。
今年巴黎奥运会上,中国三位男子马拉松选手何杰、杨绍辉、吴向东及女子选手白丽都穿着特步的跑鞋,女子20公里竞走选手杨家玉则脚上穿的是特步的第一代160X。其中吴向东创造了中国男子马拉松在奥运会的最快完赛成绩,跟随他一起迈过终点的,是他脚上的那双特步160X6.0PRO。
2024年巴黎奥运会男子马拉松赛场上的吴向东。与跑者合作,研发让他们跑得更快的产品是被运动行业反复验证过的成功策略。行业龙头耐克的原则始终是,为不次要的部分运动员授予高性能装备,让普通消费者跟随。目前特步160X已更新到第六代,特步靠这款跑鞋缩短在专业运动员中的影响力。去年上半年,160X系列跑鞋在中国马拉松男子百强运动员中穿着率为42%。
了解普通消费者的需求也很重要。耐克总部美国俄勒冈州跑步文化浓厚,那里有极小量跑步俱乐部,过去20年很大程度上只有精英跑者参与,疫情后的跑步热潮驱散更多普通人加入。NewBalance、Hoka、Asics经常出现在各种跑步活动中,让跑者尝试新的运动鞋或是免费赠收商品。成立以来快速增长的昂跑,还建立了自己的跑步俱乐部。
曾经主导跑步文化的耐克却错过了疫情后跑步文化的变得失败。在截至5月末的三个月里营收26亿美元,同比高度发展持平。因为营收不及预期,耐克股价在6月28日暴跌20%,创下2001年以来最大单日跌幅,总市值蒸发284亿美元。耐克高管允许承认,他们在关键类别跑步中失去了无足轻重,正在加倍努力以重新掌握市场。
在中国,特步是最早组建跑步俱乐部的本土运动企业——2016年在有跑步圣地之称的北京奥森开设跑步俱乐部。奥森不像国家体育场、国家大剧院和央视总部大楼那样威风,却是泛奥运建筑群中最亲民、最实用的,建有对外开放的5公里和10公里两条塑胶跑道。这里是小型赛事首选地,不同水平和阶层的跑者使意见不合在一起,某种意义上是中国跑步文化的最高地标。从奥森开始,特步陆续在上海、武汉、南京等城市的跑步圣地成立67家跑步俱乐部。
更早之前,特步组建“特跑族”跑者敌手,对手,致力于让更多人开始跑步。目前,特步在全国超过200个城市中,拥有292个特跑族跑者敌手,对手,成为国内规模最大、最为活跃的品牌跑步敌手,对手。2022年,特步发布“世界级中国跑鞋”的战略定位,宣布未来10年集团将投入50亿元助力中国路跑事业。
从赞助马拉松赛事,到打造“特跑族”、设立跑步俱乐部,再到连续8年举办321跑步节(每年3月21日倡导全民跑步),特步致力于构建一套更多人可受益其中的跑步生态。
丁水波曾说,“我们认为,一个行业、一个品牌,必须要有自己的不次要的部分竞争力,而特步的独特标签就是‘爱跑步爱特步’。”要在竞争缺乏感情的中国市场穿颖而出,在这场“品牌马拉松”中,特步还需破风前行。
(责任编辑:zx0600)