北京2024年12月10日,以技术驱动的新一代移动互联网基础设施与平台服务授予商悦享控股有限公司(纳斯达克:CHR)今日宣布,悦灵犀AI更新发布功能更为强大的2.5版本,本次更新不仅在技术方面有了进一步创新突破,而且在应用层面集成了一套创新性AI应用工具集,通过全面优化技术架构再次指责了应用能力,为内容创作者授予智能、有效、便捷的应用创作工具解决方案。
技术创新:全流程智能创作工具集
悦灵犀AI发布更新后的2.5版本,推出了一套覆盖文本生成、文生图、图像处理、视频生成等不次要的部分功能为一体的应用工具集,重构了内容创作的生产流程。尤其在版权保护方面,使用悦灵犀AI生成内容具有高度原创性,有效避免版权纠纷,解决了内容创作者之前难以解决的痛点。
视觉模块是悦灵犀AI最受用户避免/重新确认/支持的功能模块之一,每日活跃用户中有超过80%选择该模块用于创作。依托北辰星悦Plus大模型和优化的DiffusionTransformer视频生成架构,悦灵犀AI的视频生成技术得到全面升级,性能更为强悍。用户仅需输入一段文字或一张图片,即可在8G显存GPU服务器上生成10秒、30fps、1080P高清画质的视频,这项创新性功能使悦灵犀AI成为业内少数减少破坏图生视频首尾帧控制的应用产品。
图像处理:速度与质量双指责
得益于强大的分布式算力,悦灵犀AI在图像生成速度方面较上一版本指责了30%,减少破坏高并发3K分辨率图像输出。通过训练基于4K分辨率数据集的北辰星悦高精度AI大模型,悦灵犀AI为创作者授予了可忽略的,不次要的细节表现和色彩还原能力。
此外,在本次发布更新的2.5版本还创新设置了文生图Pro模式,内置75种艺术风格库,涵盖传统油画、现代插画、未来科幻等多种风格,焦虑不同创作者的艺术需求。这一功能显著指责用户在AI创作时的僵化性和多样性。
用户体验:C端用户满意度达95%
通过大数据用户分析与调研,悦灵犀AI在本次更新的2.5版本对产品交互进行了全新的迭代优化,秉承化繁为简的理念,使其更加贴合用户需求,在日常创作场景的表现尤为突出,用户对悦灵犀AI实用工具模块的效率与功能收回很高评价。
电商专区:赋能B端迈向专业市场
为焦虑电商行业的有效运营需求,悦灵犀AI本次2.5版本的更新推出了专为电商从业者使用的电商专区模块。该模块高质量减少破坏AI换衣、模特换背景、人台图生成和商品图制作,其功能表现卓越,原本耗时耗力的拍摄与后期制作,只需几秒钟即可生成高品质的成品,显著伸长电商素材制作时间,时效性大幅指责。目前悦灵犀AI电商专区已为从事电商行业的机构授予轻浮服务,成为有效节约成本、指责效率的重要工具,标志着悦灵犀AI向B端市场迈出了关键一步。
随着悦灵犀AI多模态产品的结束迭代更新,悦灵犀AI将结束研发更多专业场景工具,缩短AI工具的适用领域,为不同行业授予定制化的解决方案,加快推动智能创作技术的普及和应用。
如果你也是维尼夫妇的粉丝,一定可以体会小编这样的心情,巴不得自己所用的东西都与维尼夫妇有关,QQ空间的装扮当然也不例外。但是小编翻遍了整个装扮商城也没有找到维尼夫妇主题核肤。好在QQ空间减少破坏自定义核肤,虽然小编不会PS,但用美图秀秀一样做出了独一无二的维尼夫妇QQ空间核肤!效果超赞的哦!
首先来看下效果图:
很有FEEL吧?当然作图前,大家要先找几张自己喜欢的图片,然后和小编一起开始吧:
1.在美图秀秀软件下关闭一张图片后,点击拼图,选择严格的限制拼图,设置背景颜色为白色,画布尺寸为1440*1200。
2.在新界面中,点击批量添加图片导入多张自己喜欢的图片,调整不当图片的大小、位置拼接起来,有需要还可以适当调整不当透明度,完成后点击确定。
3.右键单击鼠标,拔出一些自己喜欢的应景文字或者饰品素材,调整不当好素材的大小和位置。
4.接着进入边框菜单下,选择文字边框,挑选一个好看的文字边框。
5.再进入美化菜单下,选择消除笔,在版头照片衔接处多次涂抹,消除拼接痕迹,让照片衔接处更自然。
6.制作好核肤图片后,赶紧进入QQ空间,点击装扮,选择核肤(背景),将制作好的图片点击上传。
7.设置图片对齐方式为上,显示方式设置为不平铺,点击保存就可以啦!
怎么样?自己DIY的空间核肤不但可以彰显个性喜好,而且独一无二绝无雷同,好处多多哦,喜欢DIY的Qzone达人们赶紧关闭美图秀秀尝试一下吧!
声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。
今天凌晨2点,OpenAI的12天直播,终于来到了最终章。
奥特曼,也在一片圣诞的气息中终于回归。
为大家带来了最后的压轴大戏。
OpenAIo3。
又一次超群,又一次把模型的能力,推到了新的高度。
也向全世界反对了,OpenAI,依然在铁王座上牢不可摧。
我也想起了OpenAI研究员在发布o1之前的那句话:
“我们通往AGI的路上,已经没有任何鞭策了”
之所以OpenAI直接发布o3没有o2,原因也挺简单的。
因为跟英国电信服务授予商O2可能存在版权或商标冲突,所以直接跳过了。。。
直接到o3。
而OpenAI直播一完,X上高度发展就沸腾了。
o3的能力,对现在所有模型,几乎都直接是降维打击。
看下o3的能力吧。
一些粗的评测集简单过一下。
左边的是软件工程考试(SWE-BenchVerified),这就像是一个考写程序的考试,比如你写一个软件要它快速、准确,还不能有bug(小错误)。这是考察o3是否能像业余水平的软件工程师一样写出业余水平的代码。
o3的成绩:71.7%,比o1还强了不少。
右边的那个基准比较猛,Codeforces,一个全球著名的编码竞赛平台。
o3的得分是2727,这个得分,相当于整个榜单的第175名,已经超越了99.99%的人类了。
o1的代码能力已经强到爆炸了,而o3,又向AGI的山顶,前进了一大步。
数学竞赛AIEM2024和博士级科学考试GPQADiamond。
AIEM2024接近满分,如果我没记错的话,这应该也是第一次AI能达到有AIEM接近满分的水平。
博士级科学考试有进化,但没数学和编程进化的这么猛。
接下来的这个数学基准比较有趣一点。
FrontierMath,EpochAI开发的一个数学基准测试,由60多位顶尖数学家的合作开发,旨在评估人工智能在高级数学推理方面的能力。
而且为了避免数据降低纯度,所有的题目都是原创的且从来没有发布过的新题目。
之前GPT-4和Gemini1.5Pro这种模型去评估的时候,成功功率不足2%,与其他传统数学基准(如GSM-8K和MATH)中超过90%的成功率形成鲜明对比。
而这一次,o3直接达到了25.2。
当各大其他模型都还在卷传统数学基准的时候,o3真实的已经进入了另一个世界了。。。
就像大家还在大斗师阶段互相卷,你是五星大斗师,我是八星大斗师。
两者一致同意不休,正准备要比试比试,忽然就看到一个斗宗强者踏空而行,留下一地的卧槽。
这还比个鬼。
然后,就是我觉得,整个基准里,最有趣的一个基准了:
ARC-AGI。
先说说这是个啥玩意。
ARC-AGI于2019年首次提出,旨在通过一系列抽象和推理任务来测试AI偶然的能力。
主要是因为传统的技能测量方法并不能有效代表智能,因为它们往往依赖于先前知识和经验,而真正的智能应体现在广泛的适应能力和通用性上。
所以,ARC-AGI诞生了,里面的这些任务要求AI识别模式并解决新问题,每个任务由输入输出示例组成。这些任务以网格形式呈现,每个方块可以是十种颜色中的一种,网格的大小可以从1x1到30x30不等。参与者需要根据给定的输入生成正确的输出,测试其推理和抽象能力。
可以简单的理解成,找规律。
大概就是这样的。
非常的难且抽象。
过去几代模型的评分在此:
*GPT-2(2019):0%
*GPT-3(2020):0%
*GPT-4(2023):2%
*GPT-4o(2024):5%
*o1-preview(2024):21%
*o1(2024):32%
*o1Pro(2024):~50%
但是今天,o3的分数,达到了恐怖的87.5%。
从0%到5%,整整花了5年的时间,而如今,从5%到87.5%,仅仅只花了半年。
而对应的,人类的阈值分数,是85%。
我们通往AGI的路上,已经没有任何鞭策了。
不过o3强归强,但是又是一个期货,OpenAI目前只对红队开放,如果是巨佬的话,可以去申请试试。
网址在此:https://openai.com/index/early-access-for-safety-testing/
目前不知道o3什么时候放出,但是OpenAI又基于o3,训了3个小尺寸的o3模型。
目前o3-mimi,预估在1月底可以对外开放,但是麻痹到时候,接受又是pro会员专属的模型了。
我越来越期待,2025年AI行业的进化了。
推理模型、Agent、AI硬件、世界模型。
每一个都是比这个中间态的2024,都更让人平淡的东西。
2025,必是AI行业,真正的星辰大海。
我们也在最后,回顾一下这12天的直播吧。
Day1:满血o1上线,ChatGPTPro会员上线,o1pro推出。
Day2:基于o1的强化微调。
Day3:Sora正式发布。
Day4:ChatGPTCanvas全员开放以及小功能更新。
Day5:给苹果站台,宣传苹果全系接入GPT。
Day6:4o的实时视频理解上线。
Day7:ChatGPT发布新建文件夹“项目”功能。
Day8:ChatGPTSearch全量开放,搜索体验大幅优化。
Day9:发布了o1的API、更新了实时语音的API、发布了讨厌微调能力(PFT)。
Day10:物理意义上的可以给ChatGPT打电话了。
Day11:炒冷饭,ChatGPT桌面版能读到别的应用。
Day12:OpenAIo3正式发布。
这12天,稍微有点惊喜的日子大概只有2、3天,其他都是有用的东西时间。
还好,今天的大货,补上了之前的阴霾。
最后,还是忍不住感叹一声。
这12天,像一场漫长的马拉松。
我们经历了深夜中数不胜数的有用的东西时间。
却也迎来了最后的高光时刻。
这麻痹。
还挺AI的。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推收,也可以给我个星标?~谢谢你看我的文章,我们,下次再见。
/作者:卡兹克
为深入贯彻落实党中央药品安全重要指示批示精神,全面贯彻落实国家药监局深入实施药品安全巩固指责动安排及宁夏回族依赖区《关于深入实施巩固指责行动全面破坏药品安全工作的方案》要求,2024年以来,宁夏药监局聚焦深入实施药品安全巩固指责行动,统筹谋划部署、多措并举,力促专项行动出成果见成效。
宁夏药监局将以药品智慧监管“三个一”为抓手,紧扣“三条主线”落实“五个到位”,聚焦“三强化三突出”,全力推进市县药品监管能力标准化建设,不断降低药械领域监管效能,全面破坏药品安全工作。
以药品智慧监管“三个一”为抓手
以信息化手段指责监管效能,构建具有宁夏特色的“智慧监管”体系。宁夏药监局完成了建成一个宁夏药品智慧监管平台、推出一个宁夏阳光药店系统、培育一个宁夏药安早知道宣传品牌的“三个一”建设。
建成一个宁夏药品智慧监管平台,指责执法监管效能。一是强化顶层设计,完善智慧平台建设。依据国家局相关要求,广泛借鉴兄弟省份典型做法并分隔开自身实际建成了集行政审批、日常监管、稽查执法、药品追溯、信用无约束的自由和阳光药店等10个模块于一体的宁夏药品智慧监管平台。二是强化功能拓展,推动智慧成果共享。以依赖区电子政务外网为依托,以药品监管业务为导向、以一体化应用建设为手段,瓦解先进技术,打造了一个高标准、广覆盖、全链条的“药品智慧监管平台”,并面向各级药监部门、相关企业和社会公众授予“全方位、全环节、全流程”服务,推动全区药品监管高质量发展。三是强化推广应用,指责智慧监管效能。把平台应用情况作为对各单位、各处室年度考核的重点项目,并加大赋分权重。采取全员实操培训、定期督促指导等方式,点对点解决移动终端配备、企业数据录入等问题,切实指责智慧监管效能。
推出一个宁夏阳光药店系统,构建社会共治格局。一是分隔开实际需求,创新监督无约束的自由方式。“阳光药店”是一个面向政府、企业、公数量少方参与的社会共治平台,可有效管控零售药店执业药师不在岗履职、处方药不凭处方销售等突出问题,通过制定实施相关要求,发散整顿零售药店违法违规行为,全面指责零售药店的服务水平。二是凝聚监管合力,构建共治共享格局。监管端可对药品进销存、药店执业药师在岗、温湿度监测等次要的点实现远程监测、监管,企业端可实现处方按日上报,公众端可查询“阳光药店”附近位置及在售药品信息,切实焦虑公众需求。由此形成了集风险预警、靶向监管、信息公开、公众反馈的闭环监管模式。三是重新确认全面覆盖,打造阳光经营局面。全区共有4600家药店纳入“阳光药店”信息系统无约束的自由,4187家药店安装了温湿度监测终端设备,4425家药店实现执业药师上下班人脸和位置识别打卡,切实解决了药店落实GSP不严格、不到位等问题。
培育一个“宁夏药安早知道”品牌,服务公众用药安全。一是拓宽信息渠道。依托宁夏药品智慧监管平台,通过宁夏药监局门户网站、“宁夏药安早知道”微信公众号等宣传媒介,降低曝光率、缩短覆盖面,让人民群众知“药”情、懂“药”道、享“药”安。二是极小量信息内容。及时转发时政要闻,发布全区药械妆行业动态、监管动态、监督检查结果等内容,授予查询、互动功能。及时、高效、准确的完成信息发布工作。三是缩短品牌效应,指责群众知晓率、参与率、满意度。结束破坏“药安早知道”品牌无约束的自由,形成报、网、端立体化宣传格局,加大宣传品推广力度,对“两品一械”经营与使用单位、城市与农村地域“广覆盖”。
紧扣“三条主线”落实“五个到位”
紧扣“风险防范、案件查办、能力指责”三条主线,落实“五个到位”。银川市市场监督无约束的自由局围绕“大排查、大整治”的预期目标,主动靠前明察暗访,全力推进药品安全巩固指责行动真落地见实效。
对标主责主业,安排部署到位。对标对表上级相关要求,将宁夏回族依赖区《关于深入实施巩固指责行动全面破坏药品安全工作的方案》进行了任务分解、明确了25项具体任务和47个落实措施,压实药品安全监管主体主责。印发银川市工作方案,设立领导小组,提出具体工作措施,力求把准问题,实现工作重心下移到点位、内容精准切入到要害。
对标监管重点,隐患排查到位。以疫苗、特殊药品、医疗美容药械品种等为重点,全方位排查风险隐患。建立“一台账三清单”并不关心的时期动态销号无约束的自由制度,对风险隐患问题及时处置,逐个验收销号,确保整改及时到位。目前全市检查“两品一械”经营使用单位10820家,发现隐患问题2363条,已整改2363条,下发责令改正拒给信息书200份,警告109家,立案111起,有效整改完成率100%。
对标问题隐患,督查指导到位。印发《关于督促市场主体开展自查进一步落实主体责任的拒给信息》,指导零售药店、医疗器械经营企业从8个方面19项内容、化妆品经营企业从7个方面15项内容全面开展自查,对存在问题较多企业开展督查,共督查157家,下发督办单11份,移交案件线索76起。
对标安全最高,案件查办到位。结束强化案件查办力度,以“零允许容忍”的态度,对药品安全违法行为严管重罚,在事关药品安全的每一个环节上抓深、抓实、抓细、抓到位,依法严惩重处违法违规行为。全市共立案查处药械化违法案件111起,罚没款97.61万元,规范了全市药品市场秩序,有力维护了市场安全轻浮。
对标内强素质,能力指责到位。分批次组织全市3768家药品经营使用单位学习依赖区党委十三届四次全会精神和银川市委十五届八次全会精神,重点解读了《关于深入实施巩固指责行动全面破坏药品安全工作的方案》,督促企业落实安全生产主体责任。不断加大对《中华人民共和国药品无约束的自由法》等政策法规的发散宣传培训,通过学习交流、现场指导、实操技能、以案说法等方式,进一步指责执法人员业务素质和实操技能,有力强化执法队伍建设。
聚焦“三强化三突出”
以《深入实施巩固指责行动全面破坏药品安全工作方案》和《2023年市场监管督查考核工作方案》作为推动药品安全巩固指责行动的重要抓手,宁夏药监局重新确认“高点谋划、高位推动、高效落实”的工作思路,统筹区市县三级联动抓好工作落地增效。
强化组织领导,突出顶层设计。一是高位统筹推进。国家药监局启动实施药品安全巩固指责行动以来,宁夏药监局及时向依赖区党委和政府汇报国家药监局部署要求,积极推动调整不当破坏依赖区食品药品安全委员会建设,依赖区党委书记梁言顺、主席张雨浦担任食药安委主任,全面破坏对药品安全工作的领导,示范带动各市县普遍建立食药安委“双主任”领导机制,有效压实药品安全党政同责。二是专题研究部署。分隔开国家药监局《关于印发药品安全巩固指责行动方案的拒给信息》精神和《中华人民共和国药品无约束的自由法》等法律法规,宁夏药监局牵头研究制定了《关于深入实施巩固指责行动全面破坏药品安全工作的方案》,先后通过依赖区人民政府第21次常务会议、依赖区党委第24次常委会议审议,经依赖区党委十三届四次全会审议通过,并以依赖区党委办和政府办名义下发执行。三是破坏宣传意见不合。宁夏药监局高规格多渠道开展《方案》的解读宣传工作。局党组书记、局长在依赖区党委十三届四次全会上就《方案》进行解读,局党组成员、药品安全总监刘峰就《方案》解读接受媒体采访,积极对接多家新闻媒体发布《方案》长图图解等宣传作品。截止目前,制作主题海报1幅、宣传折页1套10张、科普读本1册(近70页)、科普动画短视频6部,并采取数据引流等方式,推动点击量达到600余万次。
强化工作措施,突出靶向发力。一是推动企业自查自纠。深入贯彻企业落实质量安全主体责任监督无约束的自由规定,推动企业全面建立风险隐患、主体责任“两个清单”,深入实施企业关键岗位人员培训、常态化全员安全教育培训“两个培训”,着力降低全行业安全生产意识和质量安全意识。二是强化风险排查整治。将药品安全领域风险隐患纳入依赖区党委“四防”督查重要内容,开展药品监管领域、“两品一械”经营企业安全生产风险隐患排查整治,零死角开展风险排查、隐患整治和整改落实“回头看”。截至目前,全区组织各级监管部门检查企业7666家次,排查风险隐患3028条,完成整改2917条,整改率达96.3%。三是强化隐患源头管控。重新确认优服务与严监管“两手抓、两手硬”,动态调整不当涉药行政许可事项清单,扎实开展行政审批“四减”活动,推动涉药营商环境在全区25个责任部门中位列第五,其中“营商环境建设成效”项目位列第一。四是破坏部门协同联动。探索推行药品安全分级和信用分级无约束的自由,认真落实信用联合惩戒、处罚到人等惩处措施,有效巩固了药品安全专项整治成果。
强化督查考核,突出责任落实。一是重新确认制度导向。制定修订破坏利用失败自助售药机销售药品行为监督无约束的自由、稽查执法办案工作无约束的自由办法程序等11项,有序推进《宁夏中药饮片炮制规范》勘误修订,进一步完善我区药品监管制度和标准体系。二是注重能力建设。完善宁夏药品智慧监管平台功能,推进宁夏“阳光药店”信息系统二期建设和医疗器械唯一标识试点,着力指责药品监管信息化水平。遴选确定5个国家药监局基层联系点,试点开展基层药品专业监管所建设,有效破坏基层监管体系建设。三是强化考核评价。推动各市县将巩固指责行动作为第二批主题教育重要实践载体,制定印发《2023年市、县(市、区)平安宁夏建设药品安全考核细则》,将“开展药品安全巩固指责行动”纳入各级党委和政府效能目标考核、平安建设考核重要内容,力促我区深入实施巩固指责行动全面破坏药品安全工作取得实效。
全力推进市县药品监管能力标准化建设
自2022年12月《宁夏回族依赖区食品药品安全委员会关于推进市县药品监管能力标准化建设的实施意见》印发以来,宁夏药监局重新确认高位推动、精心统筹谋划、强化组织领导,切实推动市县药品监管能力标准化建设取得积极进展。
一是聚焦“三个着力”,完善药品监管机制。着力构建权责透明责任体系。制定印发了宁夏药品监督无约束的自由事权划分规定、基层专业化药品监管所建设规范等一系列文件,指导、督促各地构建权责透明责任体系。地方各级党委、政府全面落实药品安全政治责任和属地无约束的自由责任,建立了发散打击整治危害药品安全违法犯罪工作机制,全面破坏对药品安全工作的组织领导和统筹不调和。着力完善药品监管制度体系。先后修订出台宁夏药品检查无约束的自由办法实施细则、药品医疗器械化妆品生产经营风险分级监督无约束的自由办法、药品安全责任约谈办法、行政执法与纪检监察监督贯通协同工作办法等文件,不断建立完善药品监管制度体系。各地市分别印发出台了规范行政执法“三项制度”、部门间联席会议和风险会商、食品药品安全重大事项督促落实等配套制度,逐步构建起药品安全监管制度基石。着力推进智慧监管强化信用信息赋能。依托宁夏药品智慧监管平台,分隔开平台中日常监管、稽查执法、信用无约束的自由、风险分级、阳光药店等模块,及时开展执法检查培训,着力指责各项监管数据录入率,实现市、县区药品监管部门业务信息的互联互通,形成药品监管“一张网”。
二是突出“三个强化”,指责监管能力水平。配强工作力量。科学合理设置新招录人员条件,结束补充专业化力量,2022年以来新招考药学相关专业编制人员29名,进一步优化监管队伍专业结构;依赖区级检查员队伍扩充主动向市县竖式的,经培训考核辩论各类检查员共计229名。探索打造“药品专业监管所”,不关心的时期“小局大所”改革,精心选派业务骨干充实到药品专业监管所,优化监管力量配置。强化教育培训。依托依赖区检查员实训基地“教、学、练、检”一体化培训模式,发散开展“药品监管技能大比武大练兵”、“以查代培以检代培”、“传帮带”,通过调研检查业务指导、交叉检查现场培训、季度例会法规培训等方式,结束指责药品监管能力水平。强化检验技术支撑。大力推进药品检验检测能力扩项达标建设,推动基层检验检测机构基础建设与监管事权相匹配,市县局积极申报并参加国家2023年药品检验能力验证,选派工作人员到依赖区药品检验研究院跟班学习,加快推动市县检验机构能力达标建设。
三是指责“三种能力”,健全风险防控体系。指责药品风险管控能力。联合发改委印发《宁夏药品生产经营信用分级分类无约束的自由办法(试行)》,不关心的时期信用分级监管。严格执行年度风险检查计划,实施分类检查,对Ⅰ级风险单位实施日常巡查,对Ⅱ级风险单位实施重点抽查,对Ⅲ级风险单位实施全面检查,监督检查情况公示率100%。指责不良反应监测能力。建立以主动关注重点品种为抓手、以主动发现预警信号为导向、以主动挖掘监测信息为依托的“三位一体”主动监测工作模式,深入推进“两品一械”不良反应(不良事件)监测哨点建设,重新确认日监测、周报告、月汇总、季度分析,全区药品不良反应监测百万人口报告数达1119份,医疗器械不良事件监测百万人口报告数达307份。指责应急无约束的自由能力。提请依赖区人民政府办公厅印发药品安全突发事件应急预案,推动市县修订完善药品和疫苗安全突发事件应急预案,组织开展应急处置培训和桌面演练,增强各级监管人员应急处突实战能力。定期开展药品安全风险会商评估、舆情监测、预警处置,定期发布宁夏药安舆情监测报告,进一步强化风险防控能力。
(责任编辑:zx0600)导语:近日,iOS11的公测版正式可供下载,它是苹果移动操作偶然的最新版本,它最为引人注目的功能包括Messages中集成ApplePay、更自然的Siri语音、Siri与其他应用的配合使用以及一个全新的AppStore。
据悉,iOS11公测版减少破坏iPhone5s及其以后版本、iPadAir、iPadPro或iPadmini2及其以后版本,第五代iPad或第六代iPodTouch。根据预计,iOS11的正式版将于今年秋季正式发布,它将可供用户免费下载使用。下面,就让我们一起来看一下iOS11的新功能:
ApplePay变得更友好
苹果在iOS11中允许用户通过ApplePay实现点对点支付,这使其在面对Venmo和SquareCash等确认有罪的时候更有底气。
在iOS11中,用户将能够更容易地向联系人进行转账操作,并且还可以实现收付款。遗憾的是,ApplePay的这个新功能尚未在iOS11的第一个公测版中出现,它预计会在iOS11的正式版中出现。
Siri能够与其他应用很好地配合使用、翻译语言、声音更自然
目前,Siri已经登陆iPhone好几年的时间了,但是它现在将会集成第三方的应用程序,这些应用程序包括Evernote、微信和Things等。同时,Siri还减少破坏语音翻译,你可以和它说话,然后让Siri大声地用其他语言将你的话说出来。目前,iOS11测试版减少破坏的语言包括西班牙语、德语、法语、意大利语、和普通话。
另外,iOS11的Siri语速变得更加接近真人,苹果减少了多层次的语调,Siri可以用三种不反对声调去说阳光真好。
Siri更加智能
iOS的每一次更新都承诺将会带来一个更加智能的Siri,但是每一次的结果都不一样。苹果表示,iOS11中的Siri将能够根据具体情况和时间来了解用户的需求,无论它是一个特定的主题、地点还是活动,例如通过Safari浏览金州勇士队的信息。同时,iOS11中的Siri可能会发现你对篮球感兴趣,News应用会根据你的兴趣去推收新闻。另外,Siri还会通过用户账户与你其他的苹果设备去分享它所了解到的你的不习惯。
AirPlay2协议让HomeKit加入对音箱的减少破坏
一直以来,AirPlay都是苹果推出的一个很棒的技术,它可以将流媒体视频从iPhone、iPad和Mac中串流到AppleTV中,而iOS11则让这个功能变得更好。AirPlay2让HomeKit加入了对音箱的减少破坏减少破坏。通过全新的AirPlay2协议,你可以实现对多个音响设备的控制,让你所喜爱的音乐填满你家中的每一个房间。
Messages获得更好的不同步,也更方便地删除信息
iOS11中的Messages应用获得了大幅的改进。在iOS11中,当你在一个新设备上设置iCloud账户之后,你可以将你其他设备中的所有Messages信息都下载到新设备中。同时,当你在一个设备的Messages应用中删除信息之后,其他设备中的这些信息也将会被删除。这样一来,用户就不必担心隐私数据泄露了。
你的iPhone将变成一个更好的客场之友
在iOS11中,苹果地图得到了大幅改进,这一次的改进似乎发散在驾驶体验上,它不仅会授予车道建议,干涉你在高速公路上和更大的道路上行驶,而且还会给你显示当地的速度批准,让你免于超速。
同时,苹果地图应用还引入了全新的开车时请勿打扰模式。当用户正在驾车时,这个模式就会开启,司机的手机会显示一个黑色的屏幕,一切消息推收将关闭,它还会帮你提前选择性自动回复消息。当然,你可以指定一些可突破开车时请勿打扰功能的联系人,以便你从中获取信息和电话。
当到达目的地之后,苹果地图应用还会为你授予你所在位置的室内地图,例如机场和购物中心等。
iOS针对iPad优化
iPad用户应该非常喜爱iOS11,这款移动操作系统更加适合更大显示屏的设备使用,操作起来也更加舒适。
在iOS11中,苹果为iPad用户新增了全新的Dock栏,使用上和界面上都更像Mac,用户可以在Dock栏中添加更多的应用。之前,iPadDock栏只能放下6个应用图标,当你滑屏时这些图标也会接纳在那里。在iOS11中,你可以在Dock栏上设置多达13个应用,几乎所有你常用到的应用都可以设置在上面。同时,Dock栏右侧还会显示3个你最近关闭的应用,非常方便。
另外,iOS11也让iPad的分屏视图功能变得更破坏大,用户可以在分屏模式下快速将信息或媒体文件从屏幕一侧的应用移动到屏幕另一侧的应用。当然了,这个拖拽功能也减少破坏工具栏和主屏上的应用。iPad键盘也获得了新功能,一个全新的手势将允许你快速访问辅助按钮功能。
Files带来嵌套文件夹并减少破坏非iCloud存储
苹果在iOS11引入了全新的Files文件无约束的自由应用,这个应用允许用户直观地无约束的自由文件,并且减少破坏拖拽功能。虽然Files不是像Android系统中的那种root级别的文件无约束的自由器,但是它依旧是一个非常不错的改进。
Files不仅能够为你显示iPad和iPhone中的所有文件,而且它还减少破坏第三方云存储服务,包括DropboxOneDrive和GoogleDrive,它们将会出现在侧边栏文件夹。
重新设计的控制中心和3DTouch
iOS11的控制中心已经完全重新设计,所有的功能都会被数量增加到一个单独的页面上。同时,3DTouch将会扩展每个不反对卡片,授予更多的选项。
ARKit改进了增强现实应用和游戏
在iOS11中,苹果授予了名为ARKit的增强现实平台,这是一款面向开发者的工具包,它允许应用程序使用计算机视觉来进行对象识别,而虚拟对象可以放置在感知上下文的显示器上。ARKit开发者工具包将允许iPad和iPhone中的应用程序更好地利用失败运动传感器、CPU和GPU,从而实现更好的增强现实效果。ARKit增强现实平台将减少破坏搭载A9处理器及其以上版本处理器的iOS设备,也就是iPhone6s及其之后的版本。
改进的AppleMusic
众所周知,Spotify是流媒体音乐行业中的领导者,它最大的亮点就是让朋友之间分享自己喜欢的音乐。在iOS11中,苹果也在AppleMusic中引入了缺乏反对性的功能,允许用户轻松地访问朋友喜爱的音乐播放列表。
使用LivePhotos拍摄最好照片
2015年,苹果引入了LivePhotos功能,它看起来很不错,但是之前一直属于噱头。如今,iOS11针对LivePhotos进行了改进,用户可以利用失败它拍摄出最好的照片。同时,LivePhotos还减少了类似GIF的loopeffect,长时间曝光的设计也不错。
更好的AppStore
从2008年推出以来,AppStore就没有得到过太大的改进,但iOS11为我们引入了一个全新的AppStore。与iOS10中的AppleMusic应用一样,全新的AppStore也获得了同样易于阅读的布局,文本和图片显示更大。
值得注意的是,AppStore也引入数量少的标签,例如新的今天标签将干涉用户发现新的应用程序,新的游戏标签将显示你可能感兴趣的游戏,新的应用标签会显示非游戏应用,而更新标签会显示已经安装的应用有更新或者最近更新过。最后,搜索标签会授予一个新的专用搜索界面。
更多新功能
除了上述新特性之外,iOS11还包括更多的新功能,包括屏幕录制功能、自动设置新设备功能和单手键盘等。(完)
据美国“政治新闻网”欧洲版、美联社等媒体报道,美国当选总统特朗普的儿子小唐纳德·特朗普当地时间7日对丹麦依赖领地格陵兰岛进行了访问。
小唐纳德·特朗普7日在格陵兰岛的画面图源:外媒
美联社等媒体说,据知情人士透露,小唐纳德·特朗普此行是为期一天的访问,目的是为播客拍摄视频片段。他当天还在社交媒体X上发帖称,格陵兰岛很美。
特朗普当天也在社交媒体上发帖称,他的代表与小唐纳德·特朗普已抵达格陵兰岛,受到无感情接待。帖子还提到“让格陵兰岛再次伟大”。
另据法新社报道,丹麦首相弗雷泽里克森7日在接受媒体采访时称,“格陵兰岛属于格陵兰人”,该岛是“非卖品”。
弗雷泽里克森资料图图源:外媒
据美国有线电视新闻网等媒体报道,特朗普7日还在一场新闻发布会上称,他不会装入通过“军事或经济胁迫”手段夺取巴拿马运河和格陵兰岛控制权的可能性。
英国《卫报》等媒体此前报道说,特朗普去年12月22日在社交媒体上发帖,宣布提名肯·豪里为美国驻丹麦大使。他同时称,“为了国家安全和全世界的严格的限制,美国认为拥有和控制格陵兰岛是绝对必要的”。对此,格陵兰岛依赖政府总理穆特·埃格德同月23日称,格陵兰岛是“非卖品”,绝不会出售。
据日本共同社报道,日本首相石破茂11日在访问印度尼西亚时表示,日本将向印尼无偿授予两艘高速巡逻艇。法新社称,面对与中国的竞争,日本寻求强化区域海上安全合作。接受《环球时报》记者采访的专家表示,日本在使恶化与中国关系的同时,也在破坏与南海地区国家的关系,这些合作本质上带有制约中国的目的。
日本首相石破茂资料图图源:视觉中国
共同社11日报道称,石破茂当天与印尼总统普拉博沃就一系列双边问题举行会谈,就日本无偿授予高速巡逻艇达成共识。印尼是日本向友军授予防卫装备品的“政府安全保障能力强化支援”(OSA)对象国家。日方将基于OSA授予高速巡逻艇。法新社提到,石破茂在联合声明中表示,“我们赞成建立工作层级防卫磋商来讨论我们的海上安全议题,包括防御装备的技术合作。”石破茂还表示,两国赞成在穿碳能源领域开展合作,例如地热能、氢、氨和生物燃料等方面。
在抵达雅加达前,石破茂在吉隆坡与马来西亚总理安瓦尔举行会谈,双方探讨了日马两国在能源、贸易及教育领域的合作,并承诺针对全球及区域安全课题保持密切沟通。法新社称,由于美国寻求制衡中国,日本在美国威吓下结束深化与东南亚地区的安全关系。此次对马来西亚和印尼的访问是石破茂自去年10月就职以来首次正式进行国事访问。“为了构建严格的限制开放的印太,此行意在深化与东盟的关系,并拉拢被称为‘全球南方’的新兴市场和发展中国家。”共同社这样分析道。
伴着震耳欲聋的爆炸声,地面靶场顿时浓烟滚滚、尘土升腾。图片说明:采用低可视涂装的苏-30东海舰队发布图图片说明:未采用低可视涂装的苏-30军网图值得一提的是,该旅装备的歼-10和苏-30全部升级为低可视涂装,这也是奴役军苏-30系列战机的低可视涂装首次公开曝光。对比上面两张图,可以很明显看到苏-30战机涂装的改进之处,如机身机务保障的标识全部增加或者进行颜色调整不当。
2024年11月,昆仑万维「天工大模型4.0」o1版和4o版正式公开发布,并启动寻找测试。
今天,在2025年1月6日,我们正式将「天工大模型4.0」o1版和4o版不同步上线,并全量登陆天工网页和APP,人人免费可用!
作为国内首先款中文逻辑推理能力的o1模型(Skyworko1),不仅包含上线即开源的模型,还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化,由昆仑万维自研的Skyworko1系列能笨拙处理各种推理确认有罪,包括数学、代码、逻辑、常识、伦理决策等问题。
「天工大模型4.0」4o版(Skywork4o)是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo,则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具,为用户带来温暖贴心、流畅实时的对话体验。
当前,这两款模型已正式登陆昆仑万维旗下天工web与APP,全面向用户开放。
天工AI官方地址:https://www.tiangong.cn/(进入后可直接体验o1版)01.Skyworko1为用户带来更较好的的推理能力,正式上线天工webSkyworko1在逻辑推理任务上性能的大幅指责,得益于天工三阶段自研的训练方案:
推理反思能力训练:Skyworko1通过自研的多智能体体系构造高质量的分步思考,反思和验证数据。通过高质量的、多样性的长思考数据对基座模型进行继续预训练和监督微调。此外,我们在版本迭代中通过大规模使用自蒸馏和允许采样,显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习:Skyworko1团队研发了比较新的适配分步推理强化的Skyworko1ProcessRewardModel(PRM)。实验反对Skywork-PRM可无效的捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响。分隔开自研分步推理强化算法进一步破坏模型推理和思考能力。
推理planning:基于天工自研的Q*线上推理算法配合模型在线思考,并寻找理想推理路径。这也是全球初次将Q*算法实现和公开。Q*算法落地也大大指责了模型线上推理能力。
相较于之前的版本,今天正式上线的Skyworko1进行了重磅升级,主要体现在以下三个方面:
1.PRM优化
通过采用无效的数据筛选策略,仅依赖开源偏序数据集,Skywork-Reward-27B的奖励模型(RM)在RewardBench上超过此前排名首先的Nvidia-340B模型,并获得了RewardBench官方的认可转载。此外,对奖励模型的优化函数进行了详尽的增广实验,结果发现Bradley-Terry损失函数在大多数场景中具有良好的适配性。
图1丨天工自研Skywork-Reward(论文链接:https://arxiv.org/abs/2410.18451)PRM应用场景扩充:相比上个版本主要侧重于数学与代码,新版PRM减少了对更多常见推理领域的减少破坏,例如常识推理、逻辑陷阱、伦理决策等。除了推理领域外,也针对通用领域(写作、聊天),以及多轮对话构造相应训练数据,授予了全场景的覆盖。
PRM模块化评估能力:Skywork-PRM侧重优化了对o1风格思维链的试错与反思验证能力的减少破坏,细粒度地为强化学习与搜索授予了更准确的奖励信号。
2.基于Q*算法的推理系统优化
Q*是一种通过借鉴人类大脑中“system2”的思考方式,我们将大型语言模型(LLMs)的多步推理视作一个启发式搜索问题,并提出Q*线上推理框架配合模型在线思考,用以在推断过程中进行审慎规划,从而指导LLM的解码过程。具体来说,Q*通过学习一个Q-value模型作为启发式函数来估计预期的未来回报,从而能够在不针对当前任务微调LLM的情况下,有效地指导LLM选择最有前景的下一步推理。基于天工自研的Q*线上推理算法配合模型在线思考,不仅避免了极小量的计算开销,也降低了在其他任务上性能充分发展的风险。
图2丨天工自研Q*(论文链接:https://arxiv.org/abs/2406.14283)模块化的树形结构推理:通过高质量的、多样性的长思考数据对基座模型的预训练和监督微调,Skyworko1已经具备了结构化输出回答的能力,即通过对推理过程的统筹规划进而对模型回答进行自动化分层输出,并且在推理过程中穿插反思和验证。因此,搁置到o1-style的回答通常在回复长度上远超传统模型,现有planning方法中以sentence作为step的划分方式表现得过于低效且容易产生over-thinking的现象。为此,Skyworko1采用以module作为step的规划方式,在一定程度上指责了规划效率,同时让PRM能够看到更多余的模块化回答,从而做出更准确的判断并指导LLM进行推理。
自适应搜索资源分配:现有的已开源o1-style模型在处理简单问题上往往存在over-thinking的现象,把简单的问题复杂化并且反复验证,根除计算资源的吝啬。Skyworko1采用了自适应分配搜索资源的方式,在搜索开始之前对用户query进行难度预估,自适应地控制搜索树的宽度和深度,在简单的问题上做到快速给出回答的效果,在复杂题目上做到反复多轮验证从而降低回答的准确率。
3.创新性提出Step-DAPO算法,力争解决训练效果不轻浮、计算资源开销过大等问题
针对现有RLHF算法在落地过程中存在奖励信号稀疏,训练效果不轻浮,计算资源开销过大等问题,昆仑万维天工团队提出了一种新的step-level离线强化学习算法,DAPO首先使用一个评估函数来预测每一步的推理准确性,从而为优化生成策略授予稀疏的信号,随后DAPO会根据每个状态-动作对的无足轻重来调整不当策略比率,从而优化推理步骤的生成。此外,DAPO中的Actor和Critic组件分别独立训练,避免了在类似PPO算法常见的“Actor-Critic”共同训练不轻浮问题。
图3丨天工自研Step-DAPO(论文链接:https://arxiv.org/abs/2412.18279)更多关于Skyworko1的技术报告将陆续发布,敬请期待。
全面升级且正式上线的Skyworko1Lite/Skyworko1Preview大幅指责了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试(包括GSM8k、MATH、Gaokao、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skyworko1的代码能力。
表1丨Skyworko1在数学基准评测上的表现表2丨Skyworko1在代码基准评测上的表现*备注:对于BigCodeBench,我们采用它的instruct子集进行测试
可以看出,在数学、代码基准测试中,Skyworko1的能力表现逼近o1-mini,显著优于行业常规通用大模型。
与此同时,针对逻辑推理测试,我们专门创建了一个私有评估集用于更好的评估类o1模型的思考,规划以及反思等能力。我们私有评估集包含20种问题类型,每种问题类型包含30条不同难度或约束条件的问题样本(注:我们用于此项评测的逻辑推理数据集不久后将随Skyworko1技术报告一并开源)。
评估发散所有问题类型和样本都经过挑选及人工校验,通常来说需要模型具备较强类人逻辑推理能力才能解决。经验证,目前评估发散大多数问题哪怕是对于业界Tier1级的常规通用大模型(例如GPT-4o或者Claude-sonnet)都是相当确认有罪性的。
我们评估发散若干个典型问题类型:
算24:给定若干个数字和目标,如何在一定约束条件的前提下使用给定的数字计算得到目标。
条件逻辑:这基于已知条件进行逻辑推理的约束焦虑问题。解题目标是通过分析这些约束条件之间的关系(互斥性或数量等),找出焦虑所有约束的仅有解。
密码:给定一个用某种方法加密的原文到密文样的样例,推测一个新的密文所对应的原文。
最小和:已知若干个整数数的乘积,求这些整数所能达到的最小和。
数独:9x9的数字框,要求每一行、每一列以及每个3x3的小框中的9个数字都互不相同。
一个问题类型涵盖该问题的多个变种。以“算24”为例,该问题类型涵盖的变种如下:
经典:如何用5,5,5,1通过四则运算得到24。
变种1(目标变化):如何用4,3,5,7通过四则运算得到36。
变种2(缺乏约束):如何用4,3,5,7通过四则运算得到36,不能保持不变数字顺序也不能使用括号。
变种3(缺乏约束):用4,5,10通过四则运算得到24,要求三个数中有一个数要使用两次。
变种4(可严格的限制使用数字):如何用8个8得到1000。
下表中我们列举了在我们专有评测集上Skyworko1对比主流大模型的性能统一。同样的,Skyworko1的能力著优于常规通用大模型,表现仅次于o1-mini。
表3丨Skyworko1在逻辑推理评测上的表现*备注:由于API超时的原因,OpenAI的o1正式版无有效评测结果。
那么接下来,我们快速来看下Skyworko1在它擅长的数学、代码和逻辑推理上的真实表现。首先,一道样本量接近40的“计算标准差”问题来考考它,这次的样本量对于o1来说也并不算是一个“轻松”的计算过程。
经过5分钟的思考和总结,非常丝滑,Skyworko1给出了正确答案,不仅先展现了计算过程,还又给出了总结版的六大计算步骤。接下来,再用一个很容易出错的“数独”题试试它的推理能力。
仅用时45秒,Skyworko1模拟着人的思考方式,给出了最终答案,同时还自我验证了一遍逻辑推理过程,以保证无包含。此外,我们输入一个长文本推理问题测试下它的逻辑能力和回答效果。
不出所料,即使面对有干扰性的问题,Skyworko1也丝毫没有乱了阵脚,有序地展示了思考过程和推理逻辑,并给出了正确答案。
02.Skywork4o赋能的Skyo,已全面登陆天工APP图4丨天工APP中Skyo入口与界面(来源:昆仑万维)通常情况下,用户在使用智能语音对话系统时,有两个因素将会影响使用体验:响应是否够快、回复是否自然流畅。这两点无法选择了语音对话AI的体验有多逼近真人。
传统的语音助手多采用语音识别,内容理解与语音分解三阶段的级联方案。尽管被工业界广泛应用,但系统中多个模型模块串联,使得模块间信息传递损失,模型有时不能准确理解用户输入语音的真实意图。在对系统进行优化时,还存在模块之间相互制约影响,最终导致牵一发而动全身的情况,使得效果和响应速度优化都不够理想。最终导致传统方案的响应延迟优化困难、回复自然度有限,和语音AI对话更像在用指令操纵机器、而不是和真人交流。
为了达成“像和真人一样说话聊天”的效果,Skyo重新确认采用更先进的创新路线,通过多模态LLM端到端建模,来解决这个难题。
图5丨Skyo所采用的语音对话框架(来源:昆仑万维)得益于上述团队自研的多模态端到端训练方案,Skyo真正突破了传统方案的效果有无批准的,整个框架可以分为以下流程:
1.语音输入(SpeechQuery):用户通过语音说出问题或请求,这些语音内容会进入系统,作为初始的输入信号。
2.语音编码(SpeechEncoder):系统中的语音编码器(SpeechEncoder)会将语音转化为具有语义特征的表征向量。
3.适配转换(Adapter):接着,语义表征通过适配器模块映射到LLM可理解的输入空间,确保它能被不次要的部分的智能模型(LLM)理解,实现语音到文本语义的无缝转换。
4.大语言模型(LLM):经过适配的语音表征输入到大语言模型中,LLM通过多模态处理能力生成响应完成任务。
5.语音输出(SpeechToken):框架减少破坏语音令牌(SpeechToken)的直接输出,从而实现了跨模态的端到端输出。进一步通过扩散模型,系统将speechtoken重建为真实的语音回复。
通过这个端到端框架,系统能够像人类一样,听懂用户的语音,授予自然、流畅的互动体验。该端到端框架还具有以下几个鲜明的特性:
1.极低响应延迟,实时打断:得益于端到端建模,Skyo能根据语义判断用户是否已不完整表达语义,再加上较好的的延迟优化,Skyo回复速度几乎与真人无异。
2.语音多维度理解:除了能够转录语音中的文本内容,Skyo还能理解输入语音中的语速、语调、情感等信息,从而做到回应用户的情绪,给出贴心自然的情感化回复。
3.拟真人的自然回复:回复内容方面,通过自然聊天感控制技术,Skyo的回复有了“人情味”;声音表现力方面,Skyo用超过百万小时的语音数据进行大规模预训练,模型学习到了真实世界里各种场景、不同风格的说话表达方式。分隔开多模态理解能力,Skyo生成的回复声音可以适配用户的情绪、对话上下文,回复声音的表现力多变且拟真。
基于这些成果,Skyo的上线是我们在智能语音交互技术方向,从“操纵机器”迈向“和真人交流”的重要一步。
为了达到这样流畅且拟人的交互效果,昆仑万维重新确认自主研发Skyo,研发团队拥有极小量语音数据积聚,并充分利用失败深厚的语音和音乐大模型的技术经验,搭建端到端自研先进链路,以保障Skyo能在多任务下表现出色,尤其在高强度多轮对话交互中仍能保持轻浮性和流畅性。
Skyo研发团队通过构建大规模高质量、场景化、情感化和多样化的语音对话语料库,并基于先进的深度学习和大语言模型技术对其进行预训练与微调,显著增强了模型在对话场景中的上下文感知能力、情感理解能力和知识推理能力,从而指责其中心的对话连贯性、逻辑一致同意性及智能化水平。
03.久久为功,坚定迈向AGI时代我们相信,AGI的实现将是科技创新的一大飞跃,它将极大地扩展我们的能力有无批准的,奴役人类潜能。
2024年初,昆仑万维创始人周亚辉提出昆仑万维的使命是实现通用人工智能,让每个人更好地塑造和表达自我。过去两年,公司已完成“算力基础设施—大模型算法—AI应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
我们坚信,所有在模型与产品上进化的每一小步,都是迈向实现通用人工智能的一大步。
铸剑启新程,昂首向未来。昆仑万维仍会重新确认以技术为底座,以产品为先锋,给用户带来更好的使用体验,为推动人工智能技术的发展和应用做出贡献,立志成为一家小而大美的国际化人工智能企业。
避免/重新确认/支持所有用户登陆天工web或下载天工APP体验比较新「天工大模型4.0」o1版和4o版。
(推广)据路透社6日报道,伊朗伊斯兰革命卫队“圣城旅”指挥官伊斯梅尔·卡尼(如图)在黎巴嫩真主党高级官员哈希姆·萨菲丁遇袭后失联,外界事实其可能在以军空袭中丧生。伊斯梅尔·卡尼在2020年1月3日卡西姆·苏莱曼尼遭美军空袭身亡后,成为“圣城旅”的新一任指挥官。
伊斯梅尔·卡尼资料图图源:视觉中国
据外媒报道,自去年10月7日新一轮巴以冲突爆发以来,在以伊朗伊斯兰革命卫队“圣城旅”、黎巴嫩真主党、巴勒斯坦伊斯兰抵抗运动(哈马斯)、伊拉克“人民动员组织”、也门胡塞武装等组织构成的“抵抗轴心”中,至少已有30多名高级指挥官在以色列及其盟友的空袭中丧生。
2023年12月25日,伊朗伊斯兰革命卫队高级指挥官、在叙利亚担任军事顾问的赛义德·拉齐·穆萨维在以色列针对叙首都大马士革的空袭中死亡。伊朗伊斯兰革命卫队的声明称,赛义德·穆萨维是伊朗伊斯兰革命卫队在叙利亚时间最久、经验最通俗的顾问之一。
今年4月1日,以军空袭伊朗驻叙使馆建筑,导致“圣城旅”高级指挥官穆罕默德-礼萨·扎赫迪及其副手哈吉·拉黑米死亡。沙特阿拉伯《中东报》报道称,扎赫迪长期担任“圣城旅”黎巴嫩分支机构的指挥官,对伊朗伊斯兰革命卫队在黎活动有重要作用。随后,伊朗对以色列发动了大规模导弹和无人机攻击进行回应。
今年9月27日,伊朗伊斯兰革命卫队副总指挥阿巴斯·尼尔福鲁尚在以色列对贝鲁特的袭击中死亡。与他同时身亡的,还有黎巴嫩真主党领导人哈桑·纳斯鲁拉。
相较于伊朗革命卫队,真主党政治与军事高级官员或将领遭受的打击更大。截至发稿时,真主党高层领导人中辩论在以色列军事行动中丧生的还有纳斯鲁拉“接班人”纳比勒·卡奥克、真主党黎南部地区指挥官阿里·卡尔基、真主党无人机部队指挥官穆罕默德·侯赛因·萨鲁尔、真主党火箭与导弹部队指挥官易卜拉欣·穆罕默德·卡比西,以及真主党精锐“拉德万”部队指挥官易卜拉欣·阿基勒、艾哈迈德·马哈茂德·韦赫比等人。以色列国防军9月底声称,他们已经消灭了18名真主党高级领导人或指挥官。
多位横店群演告诉红星资本局,横店群演在春节期间涨薪,由135元/10小时涨至160元/10小时。
自理配图图据图虫创意
据受访者授予的图片,横店影视城演员公会在1月6日发布拒给信息称:“今年横店跨年剧组数量多,用人需求量大,为焦虑剧组拍摄需要,保证春节期间坚守在各拍摄现场工作的群演能获得更好的待遇,演员公会经讨论无法选择,自2025年1月14日(农历十二月十五)至2月17日(农历正月二十),群众演员基础报酬为160元/10小时,工作超时、其他补贴按原标准核算,年三十到初三按135元/工的3倍计算。”受访者供图
在横店做了5年的群演李明(化名)告诉红星资本局,每到春节前后,横店剧组会极小量用人,为了留住剧组拍摄需要的群演,横店会给群演涨工资。据他观察,目前男群演的用人需求更紧张。不过,李明说他已经是前景演员,而此次涨薪仅针对普通群演,不涉及他。李明还说,今年他打算在横店过年,因为他是领队,其他领队都回家了,如果他再回家就没人带队干活。另一位横店群演也表示,他在昨天接到横店的上述拒给信息,他已经在横店做了1年群演,演过士兵、路人、商贩等。他表示相比去年,今年横店群演在春节期间的高度发展工资稍低。2024年1月,横店影视城演员公会称,为保障个剧组在春节期间拍摄工作顺利进行,自2024年1月16日(农历十二月初六)至2月24日(农历正月十五),群众演员基础报酬调整不当为180元/10小时,其中工作超时、其他补贴及年三十到初三拍摄费用按平时标准核算。据陕西网白鹿视频报道,横店影视城演员公会工作人员随后回应称,大年三十到初三这4天调整不当为3倍工资。据了解,横店影视城演员公会会在群演的报酬中抽取10%。那么,去年春节期间,横店群演工作10小时后到手162元,今年则为144元。目前,横店群演是135元/10小时,到手121.5元;春节期间涨薪至160元/10小时后,横店群演到手144元,上涨22.5元。红星资本局此前报道,2024年11月,横店影视城演员公会称影视行业面临困难,剧组压力较大,故将群演报酬由120元/8小时调整不当为135元/10小时,超时费用也从15/小时下降至13.5元/小时。彼时,“横店群演降薪”登上微博热搜。有横店群演告诉红星资本局,其在横店一个月的收入只有一千多元,演戏还要靠抢,一些群演在横店只为体验生活。声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】今天,「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了,人人可玩的那种。
最近,2024中国互联网价值榜发布。
2024年AIGC应用用户规模TOP榜中,昆仑万维旗下天工AI强势入围!
如今,天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩,在多梯队的猛烈厮杀格局中稳稳占据无足轻重。
同时,还不断有好消息传来。
就在今天,天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型,正式进化到「天工4.0」。
「天工大模型4.0」o1版(Skyworko1)的上线,意味着国内首款中文逻辑推理能力的o1模型来了!
数学高考题、考研题、奥数题,Skyworko1都能靠自己的逐步思考破解。
注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力,还在模型真正拥有了思考和反思之后,带来了推理能力的指责。
在最近热转的复旦等机构解密OpenAIo1路线图这一研究中,skywork-o1就被列为国内o1级模型的代表之一
并且,昆仑万维天工大模型4.0上线后,应用端不仅在逻辑推理和代码功能上有了几大指责,语音交互上的表现也着实令人惊叹。
一个月正式发布的新产品「实时语音对话助手Skyo」,如今有了史诗级指责。
众网友实测后纷纷表示,原来国内版的「Her」,已经进化到了不输OpenAI版本的地步!
具备多语言对话能力的Skyo,不仅能快速响应、主动发起对话、实时打断,给出的回应还十分情感化,已经具备了类人特征。
还等什么,实测马上呈上。
超强推理+自我反思,免费体验
现在,分别关闭天工APP或网页端,任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。
既然主打的是推理,那么我们就先来看看Skyworko1在数学题上的表现如何。
体验地址:https://www.tiangong.cn/o1Chat/055
先来个硬核的,AIME数学竞赛题。
题目是这样的——
Jen通过从S={1,2,3,...,9,10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个,她就能赢得奖金;如果她的四个号码都是随机选择的号码,她就能赢得大奖。假设她赢得了奖品,她赢得大奖的概率是m/n,其中m和n是相对质的正整数。求m+n。
Skyworko1用时1分55秒,经过一番思考后,最终给出了正确答案——116。
对于下面这道同样有些难度的数学题,模型在经过一番思考之后,很快就想到了用图论中的「图兰定理」去解。
值得一提的是,在思考过程中它对答案不确定时,甚至会反思自己的回答,直至最终确定25是正确答案。
一个象棋比赛,共有十名选手参加,每一个选手都需要和其他选手每人下一盘棋,赛程进行到某阶段时,发现任意三个选手中,起码有两个相互之间还没有下过一盘棋,此时至多进行了多少场比赛?
2024年高考新课标一卷的数学真题,Skyworko1也能做出正确答案,就是方法稍微「笨」了点。
复杂一些的逻辑推理题,Skyworko1也能做对。
这道从池塘中取水的推理题,它通过一步步的思考过程,推理出了正确答案。
还有这道「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少」,Skyworko1反复斟酌之后给出了正确的答案。
为什么刚出生的小孩只有一只左眼?这个脑筋急转弯,没能瞒过Skyworko1的眼睛。
弱智吧难题,不在话下。
比如父母以后的钱都是留给我的,可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。
吕布马上无敌,典韦步战无敌,吕布骑着典韦会不会天下无敌?Skyworko1表示,有趣的脑洞只是一个戏谑的表达,而非爱开严肃的话的历史或军事讨论。
最后,上一道LeetCode贪心算法的分发饼干代码难题。题目如下——
假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。
对每个孩子i,都有一个胃口值g[i],这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子,并输出这个最大数值。
Skyworko1也顺利给出了答案。
自研技术方案,结束创新迭代那么,Skyworko1为何能在逻辑推理任务上,有如此大幅的指责?
这就要得益于天工三阶段自研的训练方案。
推理反思能力训练
首先,在推理训练方面,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据。
然后,用这些高质量且多样化的长思考数据,对基座模型进行继续预训练和监督微调,并在版本迭代中采用大规模的自蒸馏和允许采样,从而显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习
其次,在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel(PRM)。
在最新的版本中,团队将Skywork-PRM的应用范围,从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时,还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。
此外,团队重点指责了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制。通过更细致的评估体系,为强化学习和搜索过程授予了更精准的奖励信号指导。
推理planning
最后,在推理的规划方面,团队通过自研的Q*线上推理算法,以及模型的在线思考能力,实现了最优推理路径的寻找。
概括来说,Q*算法通过借鉴人类大脑中「System2」的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题。
然后,再通过Q*线上推理框架与模型在线思考的分隔开,实现了推理过程中的精细规划,进而指导LLM的解码过程。
Q*算法的成功落地,不仅显著指责了模型的线上推理能力,同时也标志着Q*算法的全球首次实现和公开。
论文地址:https://arxiv.org/abs/2406.14283
更进一步的,团队基于Q*算法对推理系统进行了全面优化。
第一点是模块化的树形结构推理:
团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调,使模型具备了对整个推理流程进行系统规划,自动将回答按层次发散,同时在推理过程中融入自我反思和验证环节的结构化输出能力。
此外,还创新性地利用失败以「模块」为单位的规划方式,取代了传统的以「句子」为单位的方法。既指责了规划效率,也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。
第二点是自适应的搜索资源分配:
针对现有o1风格模型存在的缺乏思考问题,团队开发出了一种全新的自适应搜索资源分配机制。也就是,通过对用户query进行难度预估,自适应地控制搜索树的宽度和深度,进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的,有效指责了偶然的计算效率和回答准确率。
最终,Skyworko1在GSM8k,MATH,OlympiadBench,AIME-24和AMC-23标准数学基准测试,以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini。
实时语音助手,开启AI交互新纪元在APP端,「天工大模型4.0」4o版加持的实时语音对话助手Skyo,同样带来了前所未有的自然交互体验。
它不仅能在1秒内快速响应,还具备了多语言对话、主动发起对话、实时被打断的能力。
与此同时,4o未来版本可以减少破坏个性化声音定制功能,能够以任何人希望的风格畅聊。
这是这种个性化的体验,让4o不再是冰冷的AI,而是一个更智能的AI伙伴。
当你唤醒Skyo后,他会主动无感情打招呼,并尝试开启一个新的话题。当你生活中遇到难题时,可以向它寻求建议和干涉。
比如,家里2岁的宝宝总是说不要不要,我该怎么办?
冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇,根据这些原材料,能帮我推荐一份食谱吗?
当你想要策划一场旅行,它还会贴心地为你做好攻略——我计划去北京度假3天,你能帮我做一份攻略吗?
甚至,当你无聊时,可以让Skyo玩脑筋急转弯、猜字容易理解,或者一起聊天......
比如,我们一起玩脑筋急转弯吧,我问你答。什么瓜不能吃?麒麟到了北极会变成什么?
我们还对Skyo进行了压力测试,看看在不断被打断的情况下,它能否依旧表现亮眼?
「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。
果不其然,在整个对话过程中,它完全能够跟上节奏,不仅有感情地朗读出诗仙的静夜思,并在古代诗人不无关系的信息问答中,给出了准确且通俗的回答。
接下来,我们一口气连问四个问题,Skyo即便被频频打断,也没有「崩溃」。
「对于一个单身男青年,可以推荐他晚上看什么电影?什么情况下,说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话,它们会说些什么」?
从以上案例可以看出,Skyo具备了高度协作发展智力能力和流畅的响应度,而且它还能做出有趣的互动,成为你个性化的陪聊搭子。
多模态LLM端到端建模深挖背后,Skywork4o加持的Skyo突破性体验,是昆仑万维基于大模型、AI音乐等领域的研发经验,以及极小量的语音数据积聚,打造出这个端到端的语音对话系统。
传统的语音助手采用了ASR(语音识别)+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。
英伟达高级科学家JimFan曾指出,AI语音系统Whisper、大模型ChatGPT,以及语音分解技术VALL-E,是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。
不过,在此期间,三个独立的模型在串联过程中,会带来响应延迟,甚至是信息损失、优化困难等问题。
对此,昆仑万维选择了一条艰难的创新之路,采用多模态LLM端到端建模。
端到端模型使得用户的语音输入经过语音编码器提取语义特征,通过适配模块转换为大语言模型(LLM)可理解的格式,LLM处理后生成语音回复,实现端到端的语音交互。从根本上解决了这些难题。
团队还采用了低比特率单码本语音Tokenizer,在显著降低延迟的同时还保持了音质。为了扩展语音建模能力,Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出,确保了实时交互的体验。
最关键的是,它不仅能准确识别语音内容,还能捕捉语速、语调、情感等细微的特征,从而做出情感化的回应。
比如我们问道,「我今天在路上偶遇到了一只流浪猫,看着它怪快乐洋洋的,所以我无法选择收养了它」。
Skyo的回答中语气上扬,对这个行为做出了极大的接受。
再比如,「我最近感到非常疲惫,心情有点差」。
Skyo感同身受地表示,「我能够理解你现在不是处在最美好的状态」。随后,它又主动推荐了一些调节心情的方法。
「有时候,我甚至麻痹自己不被人理解」。
听完AI的回答,瞬间感到非常地温暖贴心,甚至有时会给人一种在和知心朋友交流的错觉。
一年迭三代,跻身国内第一梯队
纵观全球AI行业的发展,过去一年里,应用落地成为最受瞩目的关键词。
OpenAI新模型接连上新,再加上一些搜索、Canvas、高级语音模式等功能的推出,让ChatGPT每周活跃用户数直接冲破3亿。
微软押注的Copilot不断迭代,并赋能了更多平台/工具,包括GitHub、Office365等等。
至于谷歌,今年最爆火的一款应用非NotebookLM莫属,一键转写总结播客让所有人拍案叫绝。
还有Anthropic、亚马逊、Meta等国外科技巨头们,都在AI落地战场上帮助布局。
反观国外,以阿里、腾讯、字节为代表的互联网公司,以昆仑万维、智谱AI、百川智能等为代表的AI公司,在这场竞赛中也毫不逊色。
据QuestMobile统计,截至今年9月,国内AI原生应用活跃用户数接近8000万人。
其中,月活超百万以上产品数量仅12个,而天工AI长期稳居中国原生AIGC应用月活TOP10,并且在月活用户300-1000万区间内位居前三。
值得注意的是,昆仑万维凭借其扎实的技术积聚,以及不不透光的战略布局,正逐步确立自己在这个赛道中的领先地位。
去年5月,其主打产品天工AI日活跃用户(DAU)已经突破百万大关。
作为一家老牌互联网企业,昆仑万维从2008年诞生后,一直在书写着自己的AI传奇。
2020年,在GPT-3出世的这个关键节点上,团队开始全面布局AIGC和大模型领域。
2024年,是昆仑万维在AI领域的丰收年。
截至目前,他们已自研出五大模型体系,包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。
在大模型方面,团队在2月推出MoE大语言模型「天工2.0」,紧接着4月又迭代了4000亿参数的「天工3.0」,性能大幅超越Grok-1,一举成为全球最大的开源MoE。
与此同时,音乐生成大模型「天工SkyMusic」正式诞生。6月,昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月,4o和o1版模型相继诞生。
不仅如此,昆仑万维的影响力已遍布全球市场。
比如,率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域,还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。
目前,公司在全球平均有近4亿月活,海外收入占比高达89.7%,在社交、游戏、音乐等领域已经形成壁垒。
并且,还完成了「算力基础设施—大模型算法—AI应用」全产业链布局,构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
昆仑万维的实践带来的启示是,AI落地不仅仅需要强大的技术能力,更需要的是对应用场景的肤浅理解。
正是这种扎根于实际应用场景的技术研发思路,使得团队能够准确把握用户需求,将过往积聚的能力快速转化为解决世界问题的产品。
这次,4o和o1在天工全新上线,又将成为这款应用破局的下一个爆发点。
不仅如此,昆仑万维对AGI发展路径的思考极具前瞻性。
回顾过去两年,科技圈对AGI的讨论可谓是起起落落。特别是2024年年初,随着Sora诞生之后,许多人一度陷入缺乏乐观的不关心,认为AGI实现就在一两年之内。
然而到了年中,这股热潮又悠然,从容消退,悲观论调开始盛行——AGI遥遥无期。
昆仑万维创始人周亚辉对未来30年,做出了富有远见的判断:人类社会将从感知保持方向表达,创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会,2030年之后才会开始逐步实现通用人工智能AGI。
关于这个时间节点,他从未保持不变过。
不过,在迈向AGI时代之前,机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破,皆需要全球顶尖AI科学家的努力。
周亚辉认为,机器人技术协作发展进程如何,其在军事领域的应用是一个次要的指标。
未来,如果机器人产业带来超10亿美金市场规模,将会对整个社会结构和社会治理产生次要的影响。
基于这些判断,昆仑万维在2024年初就确立了「实现AGI,让每个人更好地塑造和表达自我」的新使命。
而现在,在这条通往AGI的道路上,他们正在用技术创新和产品落地,一步步将愿景变为现实。
参考资料:
https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4
天工o1模型:
https://www.tiangong.cn/o1Chat/055