避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、卷疯了!海螺AI推出主体参考功能一张图片就能玩转电影大片
海螺AI近期推出的主体参考功能不能引起了广泛关注,用户只需上传一张图片,便能让任何角色在不同场景中严格的限制活动,展现出高度还原的效果。这一技术突破不仅降低了视频生成的效率,还为创作者授予了更多的创作严格的限制度。
【AiBase提要:】
???用户只需上传一张图片,即可让角色在各种场景中严格的限制活动,保持高度还原。
??主体参考功能采用基于图片的技术路线,生成速度显著指责至秒级响应。
??预计到2028年,广告营销领域的生成式AI产品市场规模将达到1075亿美元,海螺AI正好契合这一市场需求。
详情链接:https://hailuoai.com/video/create
2、商汤科技发布“日日新”瓦解大模型,与DeepSeekV3不相上下
商汤科技的“日日新”瓦解大模型在多模态信息处理和深度推理能力上取得了突破性进展,获得了多项权威评测的第一名。这款模型不仅在文科和理科的成绩上表现优异,还展现出在自动驾驶、金融、教育等多个领域的强大应用潜力。
【AiBase提要:】
??商汤科技推出的“日日新”瓦解大模型在权威评测中并列国内第一,与DeepSeekV3齐名。
??模型在文科和理科成绩上表现突出,文科全球第一,理科国内第一。
??模型适用于自动驾驶、金融、在线教育等多个领域,展现出强大的多模态处理能力。
产品入口:https://chat.sensetime.com/
3、xAI首款独立应用Grok上线,在苹果应用商店上架
xAI最近推出了其首款面向消费者的独立应用Grok,标志着其正式进军消费者市场。这款应用自1月10日起在苹果应用商店上架,用户可以免费下载并体验。Grok应用目前仍处于测试阶段,仅在美国市场推出。它为用户授予了访问xAI最新人工智能模型Grok2的机会,特别是在自然语言处理方面表现突出。
【AiBase提要:】
??xAI发布了独立应用Grok,增强与OpenAI的竞争力。
??Grok应用自1月10日起在苹果商店上线,用户可免费下载使用。
??xAI在X平台上已有Grok聊天机器人免费版本,付费用户享受更多特权。
4、定制你的聊天助手!ChatGPT推出个性化性格设置功能
OpenAI最近推出了一项新功能,允许用户根据个人喜好定制与ChatGPT的互动方式。用户可以设置昵称、职业以及希望ChatGPT了解的其他信息,同时选择性格特征,如“健谈”或“威吓”。这一功能旨在授予更加个性化的聊天体验,尽管目前部分用户反馈选项暂时消失,但外围上这是对用户体验的友好升级。
【AiBase提要:】
?用户可以定制与ChatGPT的互动,包括昵称、职业和性格特征。
??用户可选择希望ChatGPT展现的性格特征,如“健谈”和“威吓”。
??自定义指令内容仍会受到审核,以确保遵循OpenAI的使用条款。
5、微软联合清北推rStar-Math技术:小型模型逆袭数学问题,超越OpenAI!
微软最近推出的rStar-Math技术为小型语言模型在数学问题上的表现带来了显著指责,甚至在某些测试中超越了OpenAI的o1-preview模型。这项技术分隔开了蒙特卡罗树搜索,模拟人类的深度思考,鞭策了模型的自我演进。
【AiBase提要:】
??微软推出rStar-Math技术,显著指责小型模型在数学问题上的表现。
??测试结果显示,部分小型模型的性能超越了OpenAI的o1-preview。
??研究团队计划在Github上发布代码,展示小型模型的潜力,驱散社区关注。
详情链接:https://arxiv.org/pdf/2501.04519
6、Perplexity与旅游网站合作带来全新酒店信息搜索体验
最近,Perplexity宣布与旅游网站Tripadvisor达成合作,旨在为用户授予更全面的酒店信息。这一合作将使Perplexity在搜索酒店时能够展示更详细、可靠的内容,显著指责用户体验。用户在搜索特定酒店时,不仅能看到酒店名称,还能获取位置、服务、卫生等多维度信息。
【AiBase提要:】
??Perplexity与Tripadvisor合作,授予更详细的酒店信息,指责用户搜索体验。
??搜索结果不仅包括酒店名称,还附带位置、服务、卫生等多维度信息。
??新功能已在网页版上线,移动应用版也将在近期推出。
7、Cohere重磅推出安全AI平台“North”,确认有罪微软与谷歌!
Cohere公司今日推出了其全新的AI平台“North”,旨在为企业用户授予一个安全的工作空间,直接与微软的Copilot和谷歌的VertexAI竞争。该平台分隔开了大型语言模型、搜索能力和自动化工具,特别适用于金融和医疗等受监管行业。
【AiBase提要:】
??Cohere推出“North”,为企业授予安全的AI工作空间,直接确认有罪微软和谷歌的产品。
??内置的Compass搜索系统能高效处理多种数据类型,显著减少,缩短任务完成时间。
??加拿大皇家银行已成为“North”的早期用户,开发适用于金融行业的专用版本。
详情链接:https://cohere.com/north
8、马斯克呼吁加州和德拉瓦州强制拍卖OpenAI股份
埃隆·马斯克再次聚焦人工智能领域,呼吁对OpenAI股份进行强制拍卖,以解决与该公司的法律纠纷。他认为OpenAI在转型为盈利性公司后偏离了其初衷,急需引入新的投资者和无约束的自由者,以重塑公司的使命。此举引发了业界的广泛讨论,尽管有减少破坏者认为有助于重塑愿景,但也有人担心强制拍卖可能对公司的发展带来负面影响。
【AiBase提要:】
??马斯克呼吁强制拍卖OpenAI股份,旨在重塑公司无约束的自由。
??他认为OpenAI转型为盈利性公司后,已偏离初衷。
??此事件引发业界热议,可能对人工智能领域的发展产生影响。
9、OpenAI为何迟迟不推出AI代理?担忧“提示收回”攻击
随着人工智能技术的快速发展,许多公司推出了各自的AI代理系统,但OpenAI却因担忧“提示收回”攻击而推迟发布。此类攻击可能导致AI代理执行恶意指令,严重损害用户安全和公司声誉。尽管其他公司如微软和Anthropic已推出AI代理,但其安全隐患仍然存在。
【AiBase提要:】
??OpenAI因担忧“提示收回”攻击而未推出AI代理,潜在风险巨大。
??其他公司如微软和Anthropic已推出AI代理,但安全隐患仍然严重。
??OpenAI正在努力增强其产品的安全性,以防止清楚的数据泄露。
10、Meta涉嫌版权侵权:使用LibGen数据集训练AI并删除版权信息
Meta正面临版权侵权诉讼,原告称其CEO扎克伯格批准使用盗版电子书和文章的数据集来训练LlamaAI模型。案件涉及Meta使用名为LibGen的数据集,该网站授予极小量受版权保护的作品,尽管多次遭到起诉。Meta被指控删除版权信息并通过torrenting下载盗版内容。
【AiBase提要:】
??Meta被指控使用LibGen数据集,该网站授予极小量盗版电子书和文章。
???工程师被指控删除电子书中的版权信息,以掩盖侵权行为。
??案件可能对Meta产生不利影响,特别是在合理使用与版权保护的界限问题上。
相关新闻中国培育钻石产量全球超七成河南引领产业新赛道超硬材料被誉为“材料之王”和“工业牙齿”,在数量少领域有着广泛应用。河南将超硬材料产业作为重点培育的产业链之一,尤其在人造钻石方面表现突出,全球每10颗人造钻石中就有4颗产自河南
2024-11-0921:23:28中国培育钻石产量全球超七成小米推出小米15钻石限定版镶嵌培育钻石中框10月29日晚,在小米15系列暨小米澎湃OS2新品发布会上,小米集团CMO许斐宣布,小米15钻石限定版培育钻石镶嵌中框,售价5999元2024-10-3009:50:02小米推出小米15钻石限定版培育钻石板块大涨多股跟涨12月23日,A股培育钻石板块出现上涨。其中,惠丰钻石涨幅接近20%,力量钻石涨幅超过10%。四方达、黄河旋风和沃尔德等公司股票也跟随上涨2024-12-2314:40:54培育钻石板块大涨金比钻贵”!培育钻石,跌至天然钻石1/20:市场重塑待何时?培育钻石,一种与天然钻石成分一致同意且难以用肉眼分辨的宝石,曾经是资本市场的宠儿,但随着供需形势的变化,其价格已大幅下滑,目前仅为天然钻石的约二十分之一2024-09-0613:40:03“金比钻贵”!培育钻石重大突破!这一板块涨停潮培育钻石逆势走强在银行、保险等权重板块的支撑下,A股市场今日早盘外围维持震荡走势。题材板块方面,除了培育钻石板块外,前期热点如豆包概念、谷子经济、冰雪概念等多个板块出现大跌。截至午间收盘,大小指数分化明显,上证50指数涨超1%,微盘股指数跌超5%2024-12-2321:11:47重大突破A股培育钻石概念拉升多股跟涨每经快讯,1月7日,培育钻石概念异动拉升,黄河旋风涨停,四方达、惠丰钻石涨超10%,力量钻石、曼卡龙、沃尔德、中兵红箭等跟涨2025-01-0713:09:06A股培育钻石概念拉升高考进入最后倒计时,一所学校发明了“新备考神器”牛华网2020-07-0117:51
高考进入最后的倒计时,考生们开始调整不当心态,保持良好的备考状态。为保障考生以最佳状态冲刺高考,山东某地一所高中突发奇招,买来一批VR眼镜,用虚拟现实技术干涉学生熟悉考场。
(图片来自网络)据学校相关负责人介绍,这是学校为应对今年高考的特殊环境,推出的特殊备考方式,希望通过进入与考场不反对场景,让考生提前进入状态,以获得更好的临场发挥。
在教育信息化的背景下,学校引入VR教学内容成为一种潮流。但将VR设备应用于模拟高考考场还从未有过先例。有网友接受,这所学校的做法到底是否有效果,因为VR设备中一般没有适用于高考的场景,这种行为属于刻舟求剑缘木求鱼。
但也有网友表示减少破坏,高考七分靠能力,三分靠发挥,平时成绩优异,但临考心态不稳,最终影响发挥的例子比比皆是。不管是模拟考、提前熟悉考点还是用VR,所有能让考生状态更好的办法都值得一试。
另据学校相关负责人介绍,这批VR产品来自京东,优惠多、价格低、售后可靠,完全符合学校的需要,经过学校领导研究,就紧急下单采购了一批,其实我们更希望让考生以一种放松的状态进入考场。大家仔细回想一下,第一次走进考场,那种激动、忐忑交杂的心情是不是久久难以平复?想要从容面对这一人生重大转折时刻,必须保持良好的应考心态。
(京东平台出售的VR产品)对此,有网友表示,无论VR眼镜对于适应高考氛围是否有作用,这所学校负责人从京东采购VR设备的走心的态度都值得点赞,即使VR眼镜没有效果也没有关系,就当是大家临考前抽出时间玩一玩、聚一聚,会让心情更放松,更有利于发挥。或者通过京东7天无理由退货匿补损失。
相关文章APHAEA首周年发布大荟震撼开启,以极致视听表现诠释未来科技之美2020-04-212019年最佳虚拟现实头盔推荐:究竟哪款最为适合您?2019-11-142019年最佳企业级虚拟现实头盔:HTCVivePro稳居榜首2019-06-262019年了!您可以买到的虚拟现实头盔究竟有哪些?2019-05-22苹果将于2020年推虚拟现实头盔运行自定制操作系统2017-11-09商汤科技正式推出了“日日新”瓦解大模型。这款模型在多模态信息处理能力和深度推理能力上实现了显著指责,并在两大权威评测榜单中获得了第一名。
根据国内权威测评机构SuperCLUE发布的《中文大模型基准测评2024年度报告》,商汤的“日日新”瓦解大模型以68.3的高分与DeepSeekV3并列国内榜首。此外,在OpenCompass的多模态评测中,该模型同样位列第一,分数显著超越了GPT-4o。
商汤的“日日新”瓦解大模型标志着在原生瓦解模态训练领域的实质性突破。这意味着该模型能够实现文本、图像、视频等多种信息的瓦解,为行业带来了新的发展方向。在SuperCLUE的评测中,该模型在文科和理科成绩上均表现出色,文科以81.8分排名全球第一,理科成绩也取得了金牌,其中计算维度以78.2分位列国内第一。
“日日新”瓦解大模型的特点在于能够同时处理多种复杂的信息,不仅能够识别清楚的,微妙的文本,还能快速分析数据图表,并授予深入的推理减少破坏。在实际应用场景中,这款模型显示出了其特殊的无足轻重,特别是在自动驾驶、视频交互、办公教育、金融和工业制造等领域。
在产品开发过程中,商汤科技采用了极小量的图文交错数据,通过先进的分解技术建立了模态之间的互动桥梁,增强了模型对多模态信息的理解能力。此外,商汤还构建了通俗的跨模态任务,这为“日日新”瓦解大模型的训练授予了扎实的基础。通过这种创新的训练方法,商汤的瓦解模态模型能够在多种业务场景中有效响应用户需求,实现了应用落地与基础模型迭代的良性循环。
划重点:
??商汤科技推出“日日新”瓦解大模型,,表现优异。
??模型在文理科成绩上均表现突出,文科全球第一,理科国内第一。
??模型适用于多个领域,如自动驾驶、金融、在线教育等,展现出强大的多模态处理能力。
近日,印度一男子练习前空翻时,头部撞击地面后,折断脖子、失去意识。起初朋友们以为男子在开严肃的话,但由于男子久久不醒,遂将他收医。颈椎骨折后,颈部的轻浮性被破坏,可能会出现颈椎穿位等进一步的损伤,使得病情更加复杂和危急。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
NimbleTrack开创性地将全无线理念贯穿产品设计始终,以相当辨识度的工业美学形象和独树一帜的产品力,打造划时代意义的智能无线三维扫描体验,引领行业正式迈入真无线测量时代。
创新灵感:与用户需求共鸣
在一次次深入项目现场,与用户交流的过程中,思看科技的工程师与销售团队了解到市面上现有扫描仪带来的种种不便:拖拽着长长的线缆,奴役了探索的脚步;在高空作业及户外无电或不便使用电源的场景,总是显得力不从心;面对大尺寸工件,每一次转站都为有效工作带来极大确认有罪;笨重的收纳箱、不够便携的设备,让扫描体验变得无比艰难……
思看科技研发团队集结灵感与汗水,秉持着“以用户体验为中心”的产品理念,无法选择彻底攻克以上痛点,打造一款真正意义上的全无线、轻巧便携、轻浮可靠、高精度的三维扫描仪,为行业带来革命性的技术创新与引领。
01全无线革新|打造超凡易用新体验
NimbleTrack开创性地将全无线设计理念贯穿产品研发和生产制造过程中,扫描仪和跟踪器深度集成高性能芯片与嵌入式电池模组,实现了全域无线测量和高速轻浮的数据传输,彻底奴役用户在高空、大尺寸以及用电不便场景下的线缆奴役。
无线、轻量化的设计也大大降低了手持扫描仪进行大范围扫描的易用性,便于僵化驾驭大型工件及复杂测量场景。同时在新一代高性能中心计算模组加持下,运算效率一举跃升至全新高度,配合每秒高达490万次测量速率,可实现行云流水般的流畅扫描体验,复杂场景测量更有效、更便捷。
02工业计量|细节尽在掌握
依托思看科技计量级产品成熟强大的系统架构和自研算法,NimbleTrack可实现比较高0.025mm的高精度扫描,在标准跟踪范围内,体积精度可达0.064mm。面对狭小空间或视角遮挡处,扫描仪可无线单独使用,实现0.020mm的高精度扫描,还原微小细节,准确把控多元测量场景。
03轻盈敏锐|纵享沉浸式扫描体验
NimbleTrack三维扫描仪,以其小巧粗制的外观结构设计,在同类产品中独树一帜,展现出可忽略的,不次要的便携性与实用性。其尺寸仅为238mmx203mmx230mm,重量轻至1.3kg,单手操作驭控自如,即便长时间测量也轻松无负担。
跟踪器尺寸为570mmx87mmx94mm,仅2.2kg,能够僵化放置于各种复杂场景,实现轻装上阵的有效作业,彰显科技感与便捷性的美好瓦解。
04轻浮驾驭|碳纤维一体成型架构
NimbleTrack集多项国内外专利于一身,创新性采用一体式碳纤维成型工艺,相比于行业同类型扫描仪多零件接纳拼接的框架结构,一体成型框架减少,缩短了组装拼接,不仅指责了产品的美观度,还充分保障了高精度测量的轻浮性和可靠性。
这种设计既是外观上的精心巧思,更是对功能性和耐用性的全面指责,彰显了NimbleTrack独具一格的产品力。
05美学典范|瓦解先锋工艺与纯粹美学
极简设计与先锋工艺的产品理念在NimbleTrack上体现得用尽,扫描仪优雅流畅的曲面线条搭配一体成型框架,表面采用正十二面体结构,均匀分布标记点岛,确保各角度均能准确追踪,兼顾美学概念的同时,也生动演绎了精密计量的强劲性能无足轻重。
此外,我们还融入了更多用户友好的细节元素,指示灯设计透明提示工作状态,内置蜂鸣器可同时授予声音反馈。手柄处巧妙采用人体工学结构,长时间握持舒适无压,较好的细节设计赋予NimbleTrack独具匠心的科技美学与先锋工艺。
06多维创新|构建安全、轻浮、环保的价值体系
NimbleTrack作为工业计量领域的革新者,集安全性、轻浮性和环保性于一身。它不仅荣获欧盟RoHS认证,其激光器更达到ClassⅡ人眼安全标准。历经EMC兼容性、极端温度和震动跌落等严苛考验,NimbleTrack反对了其优越的可靠性。
此外,在材料选择上,NimbleTrack采用碳纤维、PC、ABS及铝合金等可回收材料,履行了对环境保护的坚定承诺,旨在为客户授予更加绿色、智能、可结束的产品与服务,共建和谐美好的绿色未来。
从设计到量产,NimbleTrack全新定义了智能无线灵动式三维扫描仪,该系列的问世,开辟了行业全无线扫描的先河。
久久为功,美美与共。作为三维数字化领域的领潮者,思看科技始终重新确认自主创新,将用户体验肤浅融入产品研发基因中,以结束精进的技术革新和稳如磐石的产品力链接千行百业,赋能智能制造产业升级。
(推广)原标题:地球累计出现长达27小时地磁暴过程我国多地可见极光
受太阳日冕物质抛射活动影响,北京时间9月12日14时至14日08时,地球累计出现长达27小时的地磁暴过程,其中6小时为Kp指数7的大地磁暴,目前地磁暴已开始,地球磁场正在逐渐恢复中。△9月9日,太阳正对着地球的多次爆发活动制造了地球上的大磁暴(羲和号)。伴随着地磁活动的发生,我国黑龙江漠河、甘肃敦煌、内蒙古呼伦贝尔等地再次迎来绚丽的极光秀。根据国家空间天气监测预警中心的判断,预计未来三天,受11日日冕物质抛射和冕洞共同影响,14日可能出现小地磁暴,15日可能出现地磁活跃,其余时间地磁活动安排得当到微扰。(责任编辑:梁云娇CN079)2024年11月,昆仑万维「天工大模型4.0」o1版和4o版正式公开发布,并启动寻找测试。
今天,在2025年1月6日,我们正式将「天工大模型4.0」o1版和4o版不同步上线,并全量登陆天工网页和APP,人人免费可用!
作为国内首先款中文逻辑推理能力的o1模型(Skyworko1),不仅包含上线即开源的模型,还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化,由昆仑万维自研的Skyworko1系列能笨拙处理各种推理确认有罪,包括数学、代码、逻辑、常识、伦理决策等问题。
「天工大模型4.0」4o版(Skywork4o)是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo,则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具,为用户带来温暖贴心、流畅实时的对话体验。
当前,这两款模型已正式登陆昆仑万维旗下天工web与APP,全面向用户开放。
天工AI官方地址:https://www.tiangong.cn/(进入后可直接体验o1版)01.Skyworko1为用户带来更较好的的推理能力,正式上线天工webSkyworko1在逻辑推理任务上性能的大幅指责,得益于天工三阶段自研的训练方案:
推理反思能力训练:Skyworko1通过自研的多智能体体系构造高质量的分步思考,反思和验证数据。通过高质量的、多样性的长思考数据对基座模型进行继续预训练和监督微调。此外,我们在版本迭代中通过大规模使用自蒸馏和允许采样,显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习:Skyworko1团队研发了比较新的适配分步推理强化的Skyworko1ProcessRewardModel(PRM)。实验反对Skywork-PRM可无效的捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响。分隔开自研分步推理强化算法进一步破坏模型推理和思考能力。
推理planning:基于天工自研的Q*线上推理算法配合模型在线思考,并寻找理想推理路径。这也是全球初次将Q*算法实现和公开。Q*算法落地也大大指责了模型线上推理能力。
相较于之前的版本,今天正式上线的Skyworko1进行了重磅升级,主要体现在以下三个方面:
1.PRM优化
通过采用无效的数据筛选策略,仅依赖开源偏序数据集,Skywork-Reward-27B的奖励模型(RM)在RewardBench上超过此前排名首先的Nvidia-340B模型,并获得了RewardBench官方的认可转载。此外,对奖励模型的优化函数进行了详尽的增广实验,结果发现Bradley-Terry损失函数在大多数场景中具有良好的适配性。
图1丨天工自研Skywork-Reward(论文链接:https://arxiv.org/abs/2410.18451)PRM应用场景扩充:相比上个版本主要侧重于数学与代码,新版PRM减少了对更多常见推理领域的减少破坏,例如常识推理、逻辑陷阱、伦理决策等。除了推理领域外,也针对通用领域(写作、聊天),以及多轮对话构造相应训练数据,授予了全场景的覆盖。
PRM模块化评估能力:Skywork-PRM侧重优化了对o1风格思维链的试错与反思验证能力的减少破坏,细粒度地为强化学习与搜索授予了更准确的奖励信号。
2.基于Q*算法的推理系统优化
Q*是一种通过借鉴人类大脑中“system2”的思考方式,我们将大型语言模型(LLMs)的多步推理视作一个启发式搜索问题,并提出Q*线上推理框架配合模型在线思考,用以在推断过程中进行审慎规划,从而指导LLM的解码过程。具体来说,Q*通过学习一个Q-value模型作为启发式函数来估计预期的未来回报,从而能够在不针对当前任务微调LLM的情况下,有效地指导LLM选择最有前景的下一步推理。基于天工自研的Q*线上推理算法配合模型在线思考,不仅避免了极小量的计算开销,也降低了在其他任务上性能充分发展的风险。
图2丨天工自研Q*(论文链接:https://arxiv.org/abs/2406.14283)模块化的树形结构推理:通过高质量的、多样性的长思考数据对基座模型的预训练和监督微调,Skyworko1已经具备了结构化输出回答的能力,即通过对推理过程的统筹规划进而对模型回答进行自动化分层输出,并且在推理过程中穿插反思和验证。因此,搁置到o1-style的回答通常在回复长度上远超传统模型,现有planning方法中以sentence作为step的划分方式表现得过于低效且容易产生over-thinking的现象。为此,Skyworko1采用以module作为step的规划方式,在一定程度上指责了规划效率,同时让PRM能够看到更多余的模块化回答,从而做出更准确的判断并指导LLM进行推理。
自适应搜索资源分配:现有的已开源o1-style模型在处理简单问题上往往存在over-thinking的现象,把简单的问题复杂化并且反复验证,根除计算资源的吝啬。Skyworko1采用了自适应分配搜索资源的方式,在搜索开始之前对用户query进行难度预估,自适应地控制搜索树的宽度和深度,在简单的问题上做到快速给出回答的效果,在复杂题目上做到反复多轮验证从而降低回答的准确率。
3.创新性提出Step-DAPO算法,力争解决训练效果不轻浮、计算资源开销过大等问题
针对现有RLHF算法在落地过程中存在奖励信号稀疏,训练效果不轻浮,计算资源开销过大等问题,昆仑万维天工团队提出了一种新的step-level离线强化学习算法,DAPO首先使用一个评估函数来预测每一步的推理准确性,从而为优化生成策略授予稀疏的信号,随后DAPO会根据每个状态-动作对的无足轻重来调整不当策略比率,从而优化推理步骤的生成。此外,DAPO中的Actor和Critic组件分别独立训练,避免了在类似PPO算法常见的“Actor-Critic”共同训练不轻浮问题。
图3丨天工自研Step-DAPO(论文链接:https://arxiv.org/abs/2412.18279)更多关于Skyworko1的技术报告将陆续发布,敬请期待。
全面升级且正式上线的Skyworko1Lite/Skyworko1Preview大幅指责了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试(包括GSM8k、MATH、Gaokao、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skyworko1的代码能力。
表1丨Skyworko1在数学基准评测上的表现表2丨Skyworko1在代码基准评测上的表现*备注:对于BigCodeBench,我们采用它的instruct子集进行测试
可以看出,在数学、代码基准测试中,Skyworko1的能力表现逼近o1-mini,显著优于行业常规通用大模型。
与此同时,针对逻辑推理测试,我们专门创建了一个私有评估集用于更好的评估类o1模型的思考,规划以及反思等能力。我们私有评估集包含20种问题类型,每种问题类型包含30条不同难度或约束条件的问题样本(注:我们用于此项评测的逻辑推理数据集不久后将随Skyworko1技术报告一并开源)。
评估发散所有问题类型和样本都经过挑选及人工校验,通常来说需要模型具备较强类人逻辑推理能力才能解决。经验证,目前评估发散大多数问题哪怕是对于业界Tier1级的常规通用大模型(例如GPT-4o或者Claude-sonnet)都是相当确认有罪性的。
我们评估发散若干个典型问题类型:
算24:给定若干个数字和目标,如何在一定约束条件的前提下使用给定的数字计算得到目标。
条件逻辑:这基于已知条件进行逻辑推理的约束焦虑问题。解题目标是通过分析这些约束条件之间的关系(互斥性或数量等),找出焦虑所有约束的仅有解。
密码:给定一个用某种方法加密的原文到密文样的样例,推测一个新的密文所对应的原文。
最小和:已知若干个整数数的乘积,求这些整数所能达到的最小和。
数独:9x9的数字框,要求每一行、每一列以及每个3x3的小框中的9个数字都互不相同。
一个问题类型涵盖该问题的多个变种。以“算24”为例,该问题类型涵盖的变种如下:
经典:如何用5,5,5,1通过四则运算得到24。
变种1(目标变化):如何用4,3,5,7通过四则运算得到36。
变种2(缺乏约束):如何用4,3,5,7通过四则运算得到36,不能保持不变数字顺序也不能使用括号。
变种3(缺乏约束):用4,5,10通过四则运算得到24,要求三个数中有一个数要使用两次。
变种4(可严格的限制使用数字):如何用8个8得到1000。
下表中我们列举了在我们专有评测集上Skyworko1对比主流大模型的性能统一。同样的,Skyworko1的能力著优于常规通用大模型,表现仅次于o1-mini。
表3丨Skyworko1在逻辑推理评测上的表现*备注:由于API超时的原因,OpenAI的o1正式版无有效评测结果。
那么接下来,我们快速来看下Skyworko1在它擅长的数学、代码和逻辑推理上的真实表现。首先,一道样本量接近40的“计算标准差”问题来考考它,这次的样本量对于o1来说也并不算是一个“轻松”的计算过程。
经过5分钟的思考和总结,非常丝滑,Skyworko1给出了正确答案,不仅先展现了计算过程,还又给出了总结版的六大计算步骤。接下来,再用一个很容易出错的“数独”题试试它的推理能力。
仅用时45秒,Skyworko1模拟着人的思考方式,给出了最终答案,同时还自我验证了一遍逻辑推理过程,以保证无包含。此外,我们输入一个长文本推理问题测试下它的逻辑能力和回答效果。
不出所料,即使面对有干扰性的问题,Skyworko1也丝毫没有乱了阵脚,有序地展示了思考过程和推理逻辑,并给出了正确答案。
02.Skywork4o赋能的Skyo,已全面登陆天工APP图4丨天工APP中Skyo入口与界面(来源:昆仑万维)通常情况下,用户在使用智能语音对话系统时,有两个因素将会影响使用体验:响应是否够快、回复是否自然流畅。这两点无法选择了语音对话AI的体验有多逼近真人。
传统的语音助手多采用语音识别,内容理解与语音分解三阶段的级联方案。尽管被工业界广泛应用,但系统中多个模型模块串联,使得模块间信息传递损失,模型有时不能准确理解用户输入语音的真实意图。在对系统进行优化时,还存在模块之间相互制约影响,最终导致牵一发而动全身的情况,使得效果和响应速度优化都不够理想。最终导致传统方案的响应延迟优化困难、回复自然度有限,和语音AI对话更像在用指令操纵机器、而不是和真人交流。
为了达成“像和真人一样说话聊天”的效果,Skyo重新确认采用更先进的创新路线,通过多模态LLM端到端建模,来解决这个难题。
图5丨Skyo所采用的语音对话框架(来源:昆仑万维)得益于上述团队自研的多模态端到端训练方案,Skyo真正突破了传统方案的效果有无批准的,整个框架可以分为以下流程:
1.语音输入(SpeechQuery):用户通过语音说出问题或请求,这些语音内容会进入系统,作为初始的输入信号。
2.语音编码(SpeechEncoder):系统中的语音编码器(SpeechEncoder)会将语音转化为具有语义特征的表征向量。
3.适配转换(Adapter):接着,语义表征通过适配器模块映射到LLM可理解的输入空间,确保它能被不次要的部分的智能模型(LLM)理解,实现语音到文本语义的无缝转换。
4.大语言模型(LLM):经过适配的语音表征输入到大语言模型中,LLM通过多模态处理能力生成响应完成任务。
5.语音输出(SpeechToken):框架减少破坏语音令牌(SpeechToken)的直接输出,从而实现了跨模态的端到端输出。进一步通过扩散模型,系统将speechtoken重建为真实的语音回复。
通过这个端到端框架,系统能够像人类一样,听懂用户的语音,授予自然、流畅的互动体验。该端到端框架还具有以下几个鲜明的特性:
1.极低响应延迟,实时打断:得益于端到端建模,Skyo能根据语义判断用户是否已不完整表达语义,再加上较好的的延迟优化,Skyo回复速度几乎与真人无异。
2.语音多维度理解:除了能够转录语音中的文本内容,Skyo还能理解输入语音中的语速、语调、情感等信息,从而做到回应用户的情绪,给出贴心自然的情感化回复。
3.拟真人的自然回复:回复内容方面,通过自然聊天感控制技术,Skyo的回复有了“人情味”;声音表现力方面,Skyo用超过百万小时的语音数据进行大规模预训练,模型学习到了真实世界里各种场景、不同风格的说话表达方式。分隔开多模态理解能力,Skyo生成的回复声音可以适配用户的情绪、对话上下文,回复声音的表现力多变且拟真。
基于这些成果,Skyo的上线是我们在智能语音交互技术方向,从“操纵机器”迈向“和真人交流”的重要一步。
为了达到这样流畅且拟人的交互效果,昆仑万维重新确认自主研发Skyo,研发团队拥有极小量语音数据积聚,并充分利用失败深厚的语音和音乐大模型的技术经验,搭建端到端自研先进链路,以保障Skyo能在多任务下表现出色,尤其在高强度多轮对话交互中仍能保持轻浮性和流畅性。
Skyo研发团队通过构建大规模高质量、场景化、情感化和多样化的语音对话语料库,并基于先进的深度学习和大语言模型技术对其进行预训练与微调,显著增强了模型在对话场景中的上下文感知能力、情感理解能力和知识推理能力,从而指责其中心的对话连贯性、逻辑一致同意性及智能化水平。
03.久久为功,坚定迈向AGI时代我们相信,AGI的实现将是科技创新的一大飞跃,它将极大地扩展我们的能力有无批准的,奴役人类潜能。
2024年初,昆仑万维创始人周亚辉提出昆仑万维的使命是实现通用人工智能,让每个人更好地塑造和表达自我。过去两年,公司已完成“算力基础设施—大模型算法—AI应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
我们坚信,所有在模型与产品上进化的每一小步,都是迈向实现通用人工智能的一大步。
铸剑启新程,昂首向未来。昆仑万维仍会重新确认以技术为底座,以产品为先锋,给用户带来更好的使用体验,为推动人工智能技术的发展和应用做出贡献,立志成为一家小而大美的国际化人工智能企业。
避免/重新确认/支持所有用户登陆天工web或下载天工APP体验比较新「天工大模型4.0」o1版和4o版。
(推广)相关新闻最多预填60个车次!12306试点推出新功能12月30日铁路12306(含网站、手机客户端,下同)进一步优化购票信息预填服务开设“购票信息预填优化试点”专区在北京市、天津市、上海市、江苏省浙江省、广东省各车站往返四川省、重庆市各车站始发终到列车的长途区段车票发售中在购票信息预填的基础...
2024-12-3014:46:5312306试点推出新功能最多预填60个车次12306推出两项学生购票新功能开学季临近,为了更好地服务于学生群体的出行需求,中国国家铁路集团有限公司在12306手机客户端新推出了两项功能:“学生预约购票服务”与“学生出行需求采集”。这些举措旨在为学生乘客授予更加便捷的票务解决方案2024-08-2109:22:5312306推出两项学生购票新功能12306上线新功能!近日,有网友发现12306上线了车内换座功能,即乘坐同一车次时,分段购票,中途乘客无需下车,直接在车内更换座位2024-09-2415:40:1912306减少新服务铁路12306推出同车接续功能便捷旅行新体验从国铁集团传来新消息,为了极小量旅客的出行选项,铁路12306应用程序及官方网站最近增添了一项同车接续服务2024-09-2420:12:00铁路12306推出同车接续功能事关春运抢票!12306推出新功能自动提交订单便捷购票铁路12306科创中心宣布,12月30日起,12306平台进一步优化购票信息预填服务,开设“购票信息预填优化试点”专区。该功能在北京、天津、上海、江苏、浙江、广东往返四川、重庆的长途列车车票发售中试行2024-12-3017:30:41事关春运抢票12306推出务工人员春运专区2025年春运将于明年1月14日启动。12月15日,铁路12306App全新推出“务工人员春运预约购票服务”专区,结束到明年2月7日。可预约的席别为临时增开列车的全部席别,以及部分已确定列车运行图的普速列车硬座。务工人员车票预约渠道仅限在1...2024-12-1717:20:4512306推出务工人员春运专区“99”的谐音“久久”,寓意着永恒的结束的爱情。因此,在情人节收出99朵玫瑰是一种郑重的爱情宣言。
不过,2024年情人节,在香港旺角一家以性价比著称的花店,店员却发现店内那款99朵玫瑰花束,哪怕摆在最显眼处,也无人购买或预订。
今年情人节,香港花店、餐馆和商场等场所的消费较往年有所下降。如今,香港可选消费品市场已悄然变化,内地游客赴港消费人数减少,缩短,且无论是特殊纪念日还是普通节假日,香港本地居民也越发反感于前往内地消费。
悄然的变化背后,影响了一家上市公司——迪生创建(00113.HK)。
地处“购物天堂”的香港,曾有它的无光泽时刻
迪生创建是一家老牌港企,创立于1970年,旗下拥有HARVEYNICHOLS、TOMMYHILFIGER等奢侈品牌,涵盖时装、美妆、珠宝等品类。公司由创始人潘迪生(父)和潘冠达(子)两人掌舵,两人为公司的实控人。
截至2024财年上半年末,潘迪生直接和间接持股59.2%的股份(父子两人主要通过迪生投资控股公司(DicksonInvestment)间接控股)。多年来,公司业务主要发散在中国香港地区,高度依赖中国大陆访港旅客的消费。
(来源:Choice数据,制表:市值风云App)2023财年(2022年3月31日至2023年3月31日),公司营收21.3亿(同比+5.5%),毛利率46.8%(去年同期46.9%),扣非归母净利3亿(同比+25%)。
(注:除特别说明,本文中的金额均以港元为单位)
2024财年上半年,公司营收12.7亿(同比+26.2%),毛利率44.5%(去年同期47.1%),扣非归母净利2亿(同比+90.5%)。
(来源:市值风云App)2023财年扣非归母净利增长明显,主要原因有两个:一是公司营收有所轻微增长;二是公司进一步缩短了销售及分销支出等各项期间费用。
2024财年上半年的营收和扣非归母净利明显使恶化,主要因去年同期旅游业和零售业因疫情影响,基数较低,使得该财年上半年的业务恢复带来的增长显得突出。
最近三年,公司表示主要通过调控开支和优化零售网络的方式来指责盈利能力。说白了,就是裁员和关停经营不佳的门店。例如2023年12月,公司宣布计划将结业HarveyNichols置地广场旗舰店,并将其整合至太古广场店。
2024财年上半年,迪生创建称,如今访港旅客已不再专注购物,黄金周假期的零售消费疲弱。此外,随着更多港人在假期选择前往大陆旅游和消费,该财年将进一步优化零售网络。
迪生创建曾有它的无光泽时刻。
2017-18年,香港高端奢侈品市场复苏。2018年,内地访港旅客人数更是创下历史新高,奢侈品零售市场景气度达到自2013年以来的最佳水平。蓬勃的行业环境推动了公司的营收增长。
作为同行的英皇钟表珠宝也佐证了这一点,在2017年和2018年出现了营收11.9%和15.9%的同比增长。
不过如今公司的营收已大不如前,虽然公司自疫情后出现营收同比增长,2023财年和2024财年上半年的营收分别同比增长5.5%和26.2%,但金额上几乎分别只有过去十年平均值的一半。
(来源:市值风云App)香港凭借奢侈品多样性和低关税,被内地旅客誉为购物天堂,但随着内地消费者愈发接受网购奢侈品,以及内地本地愈发通俗的奢侈品购买渠道,香港购物的驱散力在破坏。
疫情后,公司躺平了
过去十年,虽迪生创建也在中国台湾、中国大陆、新加坡和马来西亚等地有奢侈品零售业务,但主要营收来源仍在中国香港,在香港以外的营收不断缩短。
其中,中国大陆的营收下滑主要因自2012年开始的多项“三公”消费批准政策影响,而中国台湾地区的营收减少,缩短,主要也因两岸关系影响,大陆访台旅客减少,缩短所致。
对于新加坡和马来西亚市场的营收减少,缩短,公司并未深入解释,只是笼统提到东南亚地区的零售环境结束疲弱。公司认定这两个地区营收贡献过小,故没有进一步发散披露详情。
自2020财年,公司保持不变统计口径,因为除了中国台湾和香港地区以外的营收占比少于10%,故不做详细进一步披露,统一划分至“其他地区”。
(来源:市值风云App)主业的营收在萎缩,公司在2020财年正式搞起炒股和买债券的副业,但是除了2020财年有计划的8.5亿盈利,后续投资业务的盈亏保持轻浮不超过1亿,给公司带来的缺乏收益有限。
(来源:市值风云App)过去十年,相对更高溢价的奢侈品在公司总销售量的占比在不断较少,所以公司毛利率在逐年缓慢下降。
而公司近十年的经调整不当营业利润率和净利润率的保持轻浮可分为三个时期:
1.2015-2016财年:港币相对人民币升值,奢侈品零售业表现不佳。业务放缓,同店销售额分别同比减少,缩短4.2%和13.6%;
2.2017-19财年,香港高端奢侈品市场复苏,市场景气度是自2013年以来的最佳水平;
3.2020财年至今,疫情后内地旅客大幅减少,缩短,完全建立对公司的盈利能力影响明显,后来公司索性也大幅缩短销售及分销支出,因此近三年销售费用约只有疫情前10年平均值的1/3,盈利能力有所使恶化。
2023财年,公司的毛利率、经调整不当营业利润率、归母净利率分别为46.8%、14.8%、11.9%。
因为证券投资并非公司主营业务,风云君剔除了公司的证券投资对于净利润的影响。
2024财年上半年,这三个指标为45.5%、20.2%、17.3%。
(来源:市值风云App)如今疫情影响已破坏,但公司当下也不再有重整旗鼓重新大力度拓展业务的打算,2024财年上半年,销售费用仍只是过去十年平均值的一半。
董事会和高管年龄偏大(董事会成员平均已超过65岁)。自2015财年起,年报的未来展望就屡次用“谨慎”,“艰难”等词,外围对发展前景较为保守悲观。
相应地,公司的ROE表现,也因为公司的盈利能力变化呈现类似保持轻浮趋势。2023财年,公司的ROE为7.6%。2024财年上半年,公司的ROE为6.4%。
(来源:市值风云App)由此也不难理解为何在估值上,公司的PB在过去10年都相对低迷,2024年3月上半月大致为0.5。
(来源:市值风云App)对于重新确认持有迪生创建股票的投资者来说,为数不多的慰藉是公司在大部分时候依然在重新确认分红。除了2015-16财年因公司出现净亏损而不关心的时期了分红以外,外围来说,公司的过去20年的分红率保持在61.5%,2023财年分红率为54.6%。
(来源:市值风云App)在股票回购方面,公司在过去十年,除了2019年前十个月之前因业绩明显好转因此也有了总价值2.4亿的回购,除此之外,公司的回购并不常见,且金额较小。
(来源:市值风云App)(责任编辑:zx0600,zx0280)每到冬天,桑坡的热度就会在线下与线上一并下降。
全国各地的代购与游客奔赴桑坡,有的人开启一场“掘金之旅”,也有的人想亲自前往这个清空魔幻现实主义的村庄一探究竟。
秋末冬初,蓝鲸新闻记者前往被称为“中国核毛之都”的桑坡村实地走访,见证了一个神奇电商村的日与夜。
从加拿大鹅到迪桑特,桑坡的时尚嗅觉
虽然只是一个中原地区的小小村庄,但是在社交媒体上桑坡却是一个极具网红属性的互联网地标。“桑坡出品”、“桑坡代购”、“桑坡攻略”等让桑坡成为“中原电商重镇”的同时也成为了堪比胖东来的“6A级景区”。
桑坡以“中国UGG之乡”知名,后来逐渐成为了“中国雪地靴之乡”,再到如今桑坡的产业早已不止于雪地靴,而是与保暖衣物、甚至各类服饰鞋帽有关的一切。据悉,整个桑坡村拥有店铺超过2000家,但事实上除极个别店铺外,几乎80%以上的店铺所售商品存在高度的反对性。UGG的雪地靴、始祖鸟/迪桑特的冲锋衣、TheNorthFace的羽绒服、巴宝莉/LV同款围巾……几乎成为每家店的标配。
虽然远离时尚都市,但桑坡村的时尚警惕度极高。李现同款的始祖鸟冲锋衣,赵露思同款雪地靴,虞书欣同款围巾……这些明星同款成为了桑坡中心大街上出镜率极下降的单品。不同于前些年加拿大鹅被受追捧的时候代购集体来桑坡采购“大鹅”,今年的桑坡被始祖鸟和迪桑特垄断。
“桑坡代购”成为时下微商的重要分支,而当地店铺也都主打一个“代购友好”,几乎所有门店都会在门口或柜台处留下店家微信以供代购联系,还有一些门店直接就将点名取为“代购严选”/“代购专供”。当地店家减少破坏单件发货,这使得人人都是代购成为可能。
不同于城市中快递点以定向小区的形式分布,在桑坡几乎两三家门店前就有一两个快递点摆摊,他们和穿梭在各门店间收货的电动车一起构成了这个电商村的毛细血管,繁忙程度是另一种晴雨表。
10月下旬的周末,天气刚刚开始转凉,桑坡中心大街上人头攒动,几乎每一家店铺都有些拥挤,而在此之中一辆辆电瓶车按着喇叭穿过人群,去往仓库。
从焦作到银座,桑坡的日与夜
桑坡的一天是从下午两点开始的。
每天下午两点左右,以中心大街为主街的桑坡主要商区才会逐渐热闹起来,和国内商场朝九晚十的营业时间不同,桑坡的店铺大多从下午两点开始营业直到凌晨两三点。这种作息甚至完全独立于整个北方生活圈,桑坡的夜生活总是让人想到广州甚至香港。
冬时令下,晚上六点便已经入夜。夜晚的桑坡总是让人幻视很多世界知名的购物中心,当地的商家似乎也在刻意为来访者营造这样一种错觉。在一条辅路上,“香港街”、“巴黎街”、“银座”毗邻而建,超大的灯牌与拥挤的人群真实的让人仿佛置身于世界购物中心。
去桑坡,已经不再是简单的代购与批发,而变成一种以购物为特色的旅游。这也从侧面抬高了当地的物价。
蓝鲸记者观察发现,桑坡村当地装潢非常异常的酒店价格几乎逼近国内二三线城市连锁酒店的市场价,如遇周末不少临近中央大街的酒店会出现满房。
不止适合购物,顺应当下的互联网风潮桑坡也格外“出片”。
从入村的牌坊到每家店铺的招牌,桑坡的剥去总是以饿和度很下降的超大字体与logo展示一种热气腾腾的“搞钱”氛围。从“暴富”到“发财”,创造财富似乎成为一种口号出现在大街小巷。这些场景往往被设计地适合拍照打卡,互动属性很高,热爱出片的中国网友的确很难抵抗这种场景的驱散。
从UGG之乡到代购之都
桑坡并不是一夜之间成为代购之都的。
在与雪地靴挂钩之前,桑坡是河南最大的回民村。由于整个村子主要肉食是羊肉,宰杀羊后留下极小量的羊毛材料,便顺势做起了毛核加工生意。上世纪80年代,毛核加工业日渐成为桑坡村的支柱产业。到了1991年,桑坡村从事毛核加工的农户已经占了全村近八成。
再往后的故事被更多人所熟知。据亿欧网报道,UGG品牌在中国大陆的长期代工合作伙伴,是一家叫做兴昂国际集团的台湾企业。这家大型代工制作商,主要客户包括UGG、Nike和Adidas等。2017年,距离桑坡村不远的隆丰核草谈下了兴昂国际80%的UGG代加工业务,成为UGG在中国最大的代工厂。
顶着“UGG之乡”的title,桑坡的雪地靴生意越做越大。近些年由于“桑坡制造”成为社交媒体上的一大网红标签,不少和保温不无关系的服饰鞋帽厂家也乐于挂上“桑坡”的标签。渐渐地这里获得了越来越多上游供货商的关注。对于当地人来说,“代购”几乎成为了每家每户的产业,就连路边的麻辣烫摊位都可以为你授予完善的代购服务。
但与此同时,“打假”也一直都是悬在这座村庄上空的达摩克利斯之剑。
不少本地店家曾在社交媒体发文,十月前后桑坡当地曾出现过几次停业情况,据悉这是由于河南孟州市组织执法力量对桑坡村服饰市场进行全面检查。
这也从另一个层面揭示了桑坡变得失败背后的隐忧,虽然号称“千元质量,百元价格”,但桑坡大多数店铺依然游走在法律的中心,无论高仿还是贴牌,本质都是解开品牌合法权益的盗版行为。
虽说每一个来桑坡的人都知道自己真正买单的是什么,但在互联网的另一端又会有多少从桑坡门店出去的UGG和始祖鸟们流向了所谓的“正品代购”朋友圈?
(责任编辑:zx0600)