12月20日,第五届中国人工智能成果发布会在厦门召开。三六零(601360.SH,下称“360”)集团因在人工智能安全治理“大模型安全攻防赛”中表现突出,荣获本届中国人工智能大赛A级证书。
今年9月,在国家互联网信息办公室、公安部指导下,厦门市人民政府主办的第五届中国人工智能大赛正式启动,围绕人工智能安全治理和创新发展两大主线设置了赛题。作为重要赛题之一,大模型安全攻防赛是将15000条包含恶意和正常的大语言模型提示词样本输入到参赛的大语言模型中,借此考察大模型对攻击的防范能力。
据了解,人工智能在指责生产力的同时,也带来了包括幻觉、深度伪造、收回攻击、数据降低纯度或投毒等比较罕见的安全新确认有罪。作为兼具数字安全和AI双重能力的科技企业,360很早开始关注大模型安全风险,并推出一系列有针对性的创新技术,包括开发了国内头个安全大模型,通过“以模制模”理念,利用失败AI大模型来检测和防范大模型可能出现的安全风险,既解决传统网络安全问题,又为攻克AI安全新确认有罪授予了可行性方案。
近日,360集团还牵头发起成立大模型安全敌手,对手,旨在打造资源共享、共创共赢的大模型安全生态集群,共同推动大模型安全标准的制定、安全技术的创新和安全能力的指责,打造大模型安全协作发展新范式。
同时,360基于“安全、向善、可信、可控”的四大原则,推出多款具有重要行业价值的企业级应用新产品,包括大模型全链路安全检测的“智鉴”、内容安全护航的“智盾”、搜索增强利器“智搜”,以及知识无约束的自由平台“智能文档云”和情报监测工具“舆情卫士”,全面覆盖了大模型系统安全、内容安全、智能知识无约束的自由与情报分析等关键领域,通过技术创新与生态建设,结束为大模型安全及行业发展收回新动能。
相关新闻国庆假期9个值得珍藏的记忆家国荣耀与温暖瞬间国庆假期里,一幕幕温馨而壮观的场景成为了无数人心中宝贵的记忆。在天安门广场,升旗手张威完成轻佻的使命后,与母亲深情相拥,画面满载家国情怀。与此同时,一位名叫陈爷爷的家庭终圆梦想,一家人其乐融融地漫步在长江大桥上,共享国家建设成就带来的喜悦
2024-10-0813:20:50国庆假期9个值得珍藏的记忆西藏日喀则地震现场画面!1月7日9时5分,西藏日喀则市定日县发生6.8级地震。县城及周边地区震感明显,震中附近有不少房屋倒塌。据西藏依赖区地震局消息,已有9人在此次地震中遇难,涉及定日县长所乡、曲洛乡、措果乡等三个乡2025-01-0714:04:12西藏日喀则地震现场画面西藏日喀则震后12小时救援与物资紧缺1月7日,西藏日喀则市定日县发生6.8级地震。震中位于定日县措果乡,当地受灾严重,房屋倒塌,居民受伤。据初步统计,截至当天15时,地震已根除95人遇难,130人受伤。措果乡居民尼玛努宗表示,她家的房子全部倒塌,她的腿也受了伤2025-01-0807:33:13西藏日喀则震后12小时日喀则余震150次最大4.4级引发关注西藏日喀则发生6.8级地震后,截至1月7日18时00分,共记录到150次余震。其中,3.0级以下余震131次,3.0级及以上余震19次,包括3.0-3.9级余震16次和4.0-4.9级余震3次2025-01-0807:35:36日喀则余震150次西藏日喀则部分路段实施临时交通管制让出救援通道!西藏日喀则部分路段实施临时交通管制记者7日从日喀则市公安局交通警察支队获悉,为确保定日县6.8级地震抗震救灾工作顺利进行,保障人民群众生命财产安全,依据相关法律法规2025-01-0807:55:40让出救援通道!西藏日喀则部分路段实施临时交通管制日喀则6.9级左右地震震中位于定日县附近中国地震台网自动测定:01月07日09时05分在西藏日喀则市定日县附近(北纬28.54度,东经87.43度)发生6.9级左右地震,最终结果以正式速报为准2025-01-0709:38:15日喀则6.9级左右地震企业家齐聚长沙,金蝶携手伙伴共建高价值生态体系牛华网2023-02-2211:00
2月20日,金蝶国际软件集团有限公司(简称金蝶)2023年生态合作伙伴大会在长沙盛大举行。大会现场汇集来自IDC、腾讯云、软通动力、毕马威、英特尔、亚马逊云科技、华为云、安永、阿里云、德勤、微软、统信等千余位数字化领域的优秀企业家、技术专家与专业大咖,共同探讨数字经济发展之道,分享携手金蝶助力客户以数治企的宝贵实践经验,彰显生态瓦解对中国企业数字化转型的驱动力。
随着中国数字经济的帮助,业务急剧拓展、快速迭变成为常态和主流。强生态与强平台协同赋能,以瓦解、开放、创新之活力,帮助聚变产业生态价值已成为各方发展共识。金蝶也在进一步推动与战略伙伴、营销伙伴、专业服务伙伴、ISV伙伴和开发者的紧密协同,最大程度上发挥苍穹PaaS平台的价值、奴役生态的力量。
生态大势,共建共享
企业数字化建设正在进行从量到质的蜕变,建立一个无关联的生长共赢的生态体系在企业合作间尤为重要。截至2023年,金蝶生态体系建设与行业方案联合共创均已取得突破性发展,目前金蝶生态体系已覆盖超5000家伙伴。
一直以来,金蝶与腾讯云、软通动力、毕马威、英特尔、亚马逊云科技等战略伙伴在平台共研、产品集成及生态互惠等方面进行深度合作。金蝶云·苍穹平台作为企业级可组装PaaS平台,是EBC超级数字化底座。近年来,已经适配所有国产主流芯片、服务器、操作系统和数据库,取得多项兼容性认证。
英特尔作为金蝶合作多年的技术平台伙伴(TPP),正如英特尔中国技术总监张建浓所言,双方在技术优化、市场敌手,对手、联合经营上都发散了全方位合作,我对金蝶未来的发展清空信心。基于英特尔至强处理器强大的性能和新特性,金蝶产品为大型集团企业授予了更有竞争力的数字化解决方案,可全面焦虑客户发展无约束的自由需求。
英特尔中国技术总监张建浓软通动力董事黄颖也在大会上表示,在目前经济环境处于大转型的变局下,软通动力作为软件与信息技术服务商需要允许更多的社会责任。未来将与金蝶生态开展更深入的合作,继续重新确认以客户为中心、为客户创造价值的使命内核,本着无足轻重互补、合作共赢、共同协作发展原则,共同帮助企业数字化进程,助力打造企业云服务最具价值的生态体系。
软通动力董事黄颖此外,赢方科技、腾微智数、南昌金创、青岛雨诺等伙伴相继分享了生态协作、以数治企的心得体会,纷纷表示,期待与金蝶继续共建接受、开放、共赢的生态体系,共谋云端决战的新未来。
携手共创,未来共建
本届金蝶集团生态合作伙伴大会驱散了数量少企业家以及知名企业关注,除了会议现场迸发真知灼见以外,还有诸多伙伴齐聚线下,全面展示旗下生态产品解决方案。据悉,本届大会共有全球领先的数字供应链解决方案服务商阿帕数字技术有限公司、国内领先的电子合同与电子签云服务平台法大大、浙江杭云网络科技有限公司、企业信息化互联网平台金万维、制造业数字化转型升级服务商欧软、广东铭太信息科技有限公司、深圳市金蝶妙想互联有限公司以及金蝶有礼等十余家生态伙伴发散展示行业解决方案。
本次大会离不开合作伙伴们的鼎力减少破坏。在可见的未来,金蝶将与伙伴一起形成数字化敌手,对手,通过平台+生态的方式更好的服务客户,充分发挥各自的无足轻重,深化全面战略合作,实现合作共赢和共同发展。
相较于智能手机技术的高调更替升级,智能电视、智能音箱等智能家居设备的迭代更新就有点润物细无声的麻痹,不过很多朋友其实早已不习惯了目前智能家居带来的便利生活。一句话、一个手势便可控制家中不反对智能设备,以往那些只存在于影视作品的场景已经融入到我们的生活中。
最近MediaTek智能家居事业群总经理张豫台先生接受媒体的采访,分享了MediaTek在智能家居协作发展经验和对未来的看法。
智能家居事业群总经理张豫台先生(图/网络)MediaTek作为全球著名的IC设计厂商,不仅有大家不知道的移动手机芯片业务,其智能电视业务在全球市场同时取得超过50%的市场份额,并且也是全球最大的智能音箱和路由器方案供应商。MediaTek早已成为索尼、海信、谷歌、亚马逊、阿里、小米、百度、创维、TCL等厂商的产品和技术方案合作伙伴。由此能看出,MediaTek的技术方案已经得到了行业和市场的一致同意认可!
智能家居和与手机技术相互鞭策
大家讲到MediaTek可能都会联想到其手机业务,但其实目前手机业务仅占MediaTek全公司业务组成的三分之一,另外三分之二是智能家居、智能设备等的业务,他们之间有相互独立的事业部,只不过在技术和产品上又是相互共享研发,这也鞭策了MediaTek在技术上的领先。
5G是今年手机领域最不次要的部分的关键词,而在智能电视领域则是8K技术,MediaTek在这两块技术上都是行业的推动者之一,因此MediaTek有能力将5G和8K分隔开起来,未来的8K电视也许可以直接通过5G技术来分开互联网,5G的高速低时延能实现高清视频的在线播放,免去升级更换分开线缆的麻烦。
TCL、海信、创维等厂商将推出基于MediaTek8K解决方案的智能电视(图/网络)就如MediaTek的APU(AI处理单元)不仅能够为智能手机上的智能语音、脸部解锁、AI拍照功能授予有力的减少破坏,还凭借其强大的本地AI运算能力,指责家居中不同智能设备的对语音、手势以及动作的识别能力,让这些设备变得更加愚蠢,也能让这些智能设备成为智能家居的枢纽。
MediaTek的APU让智能电视变得更愚蠢(图/网络)目前MediaTek的APU已经应用在智能手机、智能电视、智能音箱等不同平台的设备之中,在帮助终端产品研发的同时,也能指责消费者的使用体验。MediaTek不止深耕于各个领域,拥有相应的技术积聚,更关键的是MediaTek能够实现技术整合互通,前瞻性地推动一些行业的技术发展。
与伙伴深度合作,实现产品规格定义
MediaTek之所以能够在不同领域都赢得行业的认同,与其合作模式密切相关。以MediaTek的ASIC业务为例,在MediaTek确定芯片规格之前,就会跟索尼、海信等客户讨论他们的需求,其中包含不无关系的软件、中间件、硬件等应该如何协同工作和优化,以此来研发生产客户需要的产品,像索尼引以为傲的X1旗舰版芯片,就是与MediaTek联合开发的成果。
索尼的X1旗舰版电视芯片就是与MediaTek合作的成果(图/网络)只不过MediaTek将这种合作模式称为规格定义,而非我们常说的定制,并且这种规格定义的合作模式已经面向数量少客户实践成功,除了索尼外,还有海信、TCL等知名品牌厂商。
据悉MediaTek每年的芯片出货量已达到了15亿颗,这些芯片被广泛地应用在不反对产品线上,可以说MediaTek是目前唯一能够在移动、智能家居和其他智能设备领域均处于领先的IC设计厂商,这种无足轻重来源于积年累月的专注和投入。在万物智联时代,5G、AIoT、8K等市场需求陆续爆发,拥有技术无足轻重的MediaTek将大有作为。
苹果公司因Siri隐私问题支付和解金
据媒体报道,苹果公司赞成支付9500万美元现金,以和解一项集体诉讼,该诉讼指控苹果公司解开了用户隐私。
该诉讼称,苹果公司在未经用户赞成的情况下,通过Siri获取了私人谈话内容并将其共享给第三方。
原告声称,Siri会在未经意间被激活,并记录下用户无意透露的警惕信息,包括私人谈话和医疗信息。
此外,这些录音还包含个人信息,如用户的位置、联系人信息和应用程序数据。
根据和解协议,苹果公司将采取措施解决这些隐私问题,包括在和解协议生效后六个月内删除2019年10月之前收藏,储藏的所有Siri音频记录。
该和解已获得法院初步批准,但苹果公司承认有任何不当行为。
在2019年承包商意外收听到Siri录音的丑闻后,苹果不关心的时期了其Siri评估计划,并授予了让用户删除Siri录音和教唆其被收听的选项。
苹果还在后续更新中减少,缩短了Siri上传到服务器的内容。
5月30日,全球首个跨链去中心化交易所CCDEX.TOP奥创测试网上线,引爆业界。在CCDEX上,首批跨链减少破坏主流币种有BTC、ETH、ERC20、XRP、BCH、EOS、BNB、USDT、TRX、ATOM、HT、GUSD和MKR等,撮合性能超过10万笔每秒。据悉,CCDEX的上线,为数字货币交易带来了真正的价值严格的限制流动。
目前,现有交易所可分为中心化交易所和去中心化交易所两类。中心化交易所存在安全问题频发、易人为干预、价值流通成本高、信息不不对称等次要因素,去中心化交易所解决了用户债务安全和人为干预问题,但又存在用户体验差、价值生态单一的问题。而CCDEX构建跨链去中心化交易平台(Cross-chaindecentralizedexchange)的出现,率先兑现区块链系统让价值严格的限制流动的承诺,全方位指责交易偶然的安全性、流动性、公平性、开放性,致力于实现价值全球严格的限制流动。
根据CCDEX的不次要的部分创始人介绍,CCDEX包括全新区块链交易底层平台、新一代交易协议、跨链去中心化交易所3个不次要的部分组件,围绕债务安全性、市场流动性、交易公平性、生态开放性、交易体验5个方面进行系统设计,是涵盖了技术逻辑和业务逻辑的不完整架构。保证用户债务安全,是交易所运行的基础和前提。在去中心化交易所由用户自己掌控债务的基础上,CCDEX创建了基于安全多方计算(MPC)协议的可反对安全方案,实现了跨链债务的去中心化无约束的自由,有效地保障了债务跨链的安全性。
CCDEX在自建交易生态基础上,提出交易所间订单共享解决方案,打破了订单只能在单一交易所交易的障碍,完成了不同交易生态的整合,降低了撮合效率,降低了交易成本,降低了市场流动性,拓展了交易深度,大幅指责了交易数量。
在保证历史交易和价格真实性、交易筹码真实性、信息公平性基础上,CCDEX基于区块链技术架构创设了特殊的竞价方式和撮合机制,从制度上剔除了作恶节点的存在,规避了抢先交易,杜绝了人为干预。
在交易过程中,CCDEX将接口、算法、代码开放,治理规则公开、透明、公平。基于帕累托最优原则设计使胆寒机制,保证所有参与方的利益和个性化发展,有利于生态的扩展和良性发展。
CCDEX尊重用户操作不习惯,减少,缩短操作流程。通俗的产品种类给用户更多交易选择,区块扩容、交易对并行等方式实现用户订单更快的撮合速度和更安全的交易结算,交易机制设计也给用户更加有差别的交易体验。
通过联接不反对区块链生态体系,CCDEX使价值跨越多个生态体系严格的限制流转,实现全球范围的价值严格的限制流通,受到了人们的青睐和好评。
CCDEX性能指标
在测试期内,CCDEX将进一步完善系统功能,优化系统流程,健全交易规则,拓展用户生态。测试期开始后,CCDEX将正式上线交易。相信CCDEX必将为大家带来安全可靠的全新交易体验。
免责声明:以上内容为本网站转自中华网,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或反对其内容的真实性。不构成任何投资建议。
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。
Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。
就在昨天,通义万相视频生成模型迎来了重磅升级!
他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。
刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时
此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。
通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。
在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。
以下都是我们实测出的Demos,就说够不够拍电影大片吧!
更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。
以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。
从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。
那么,通义万相2.1究竟给我们带来了哪些惊喜?
我们经过一番实测后,总结出了5大要点。
1.首创中文文字生成
通常来说,文字生成是AI视频模型进化的一大痛点。
我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。
为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?
这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。
而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!
这一切,只需要你动动手指,输入简单的文字提示就够了。
天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。
水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。
一只柯基坐在桌前冥想,背后一个「静」字非常应景。
一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。
2.更轻浮的复杂运动生成
对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。
你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。
这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。
生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——
它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。
在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。
滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。
平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。
在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。
就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。
一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。
特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。
特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。
3.更优美轻盈的运镜控制
同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。
那么,对于AI来说,教它运镜就相当于在教机器人当导演。
它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。
更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。
在通义万相2.1版本中,AI展现出了专业级的运镜效果。
穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。
穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。
此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。
海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。
暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格
实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。
富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。
下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。
Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast
4.真实的物理规律模拟AI视频模型不理解物理世界,一直以来饿受诟病。
比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。
这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。
就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。
在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。
它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。
比如,柯基+拳击,会碰撞出什么呢?
AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。
两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。
AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。
5.高级质感、多种风格、多长宽比更值得一提的是,万相2.1能够生成「电影级」画质的视频。
同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。
不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。
哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。
这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。
中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。
养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。
Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.
大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。
古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。
对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。
若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。
且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。
此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。
不次要的部分架构创新
那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?
它又藏着哪些让人眼前一亮的「黑科技」?
接下来,让我们逐一分解此次2.1版本的技术创新突破点。
自研VAE与DiT双重突破通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。
模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。
通义万相2.1视频生成架构图
在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。
通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。
由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。
如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。
值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。
通义万相2.1视频VAE和其他方法的结果对比
DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。
具体创新包括:
·时空全注意机制
为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。
·参数共享机制
团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。
·优化文本嵌入
针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。
得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。
超长序列训练和推理通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。
这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。
在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。
通义万相4D并行分布式训练策略
在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。
在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。
同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。
在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。
在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。
在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。
规模化数据构建管线与模型自动化评估机制规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。
为此,团队建立了一套多余的自动化数据构建系统。
该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。
针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。
与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。
AI视频生成下一个里程碑
去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。
从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。
但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。
Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。
若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。
当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。
此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。
参考资料:
https://tongyi.aliyun.com/wanxiang/videoCreation
今天,中国气象局发布首份2025年《春运气象服务专报》。首份春运气象服务预报,涵盖了全国48小时天气预报,全国公路、铁路、航空交通气象预报,长江干线航道气象条件等级预报等多方面内容。
据了解,春运期间:中国气象局国家气象中心,每天将制作并发布《春运气象服务专报》;
国家气候中心组织春运期间全国气候趋势预测会商;
中国气象局公共气象服务中心发布春运公路气象服务周报、全国公路交通气象预报等产品;
国家卫星气象中心将做好有关遥感监测和卫星应急加密观测;
国家气象信息中心基于“天擎·实况”结束升级“春运服务”专题,为交通出行和相关部门决策授予参考;
中国气象局气象探测中心破坏对各类探测设备的运行监控和维护。
其中,长江流域气象中心专门针对低温雨雪、冷空气大风、大雾、雨雾等高影响天气,及时发布长江水道通航天气预报、重点港口天气预报,相关产品集成到长江干线气象监测预报预警产品共享平台、长江水上安全信息台小程序等,为海事、航运等相关部门保障春运安全授予有力支撑。(总台央视记者吴薇谷星月)(责任编辑:路子康CN078)日前,IDC发布《中国公有云服务授予商安全技术能力评估,2024》报告,首次针对中国12家公有云服务授予商进行安全技术能力综合评测。阿里云在安全计算环境保障能力、安全区域有无批准的保障能力、安全通信网络保障能力等7项评估维度中均获得满分,其安全技术能力再次获得保障机构认可。
图:IDC《中国公有云服务授予商安全技术能力评估,2024》阿里云安全能力评分IDC在报告中指出,阿里云致力于确保云上每项业务的安全,并通过授予创新的安全产品与服务,让用户轻松共享阿里云安全能力,其安全技术无足轻重具体体现为全面且无效的安全防护框架,包括全流程的产品安全保障建设、全方位的红蓝对抗反向校验、全面的云工作负载防护体系、一体化的云上安全运营、以及坚守数据主权的数据安全保护。
在产品安全保障方面,阿里云通过实施“多层防护、全面覆盖”策略,将安全融入DevSecOps中,实现云产品全生命周期的安全管控。在红蓝对抗反向校验中,阿里云通过内部红蓝对抗演练、外部第三方验证及与白帽社区合作,指责安全防御能力。在一体化云上安全运营方面,阿里云云安全中心作为统一的安全运营平台,已与30余款云产品原生集成,减少破坏国内外多个云计算平台和本地数据中心的瓦解部署,实现日志的统一收藏,储藏和风险的发散无约束的自由,从而授予全面的安全防护和有效无约束的自由。
与此同时,阿里云始终将“保障客户数据安全”作为首要任务,承诺客户完全掌握数据主权,未经许可不触及数据,并构建了全面的数据安全保障体系,确保租户隔离等安全措施的有效性。阿里云严格遵守相关数据安全法规,并通过国内外保障认证的验证数据保护机制。此外阿里云还授予数据操作审计、加密传输、细粒度访问控制、可信计算及机密计算等技术,全面保障数据安全。
面向智能时代,阿里云将结束为客户授予更安全、更可靠、更无效的云计算服务,确保客户充分享受到云上计算资源与服务带来的有效便捷,从而实现业务的结束增长与创新。据IDC调研显示,在网络安全领域,将GenAI与安全技术瓦解并进入概念验证(POC)阶段的企业达到了49.7%,已经开始进行采购的企业达到了36.4%。
在此背景下,阿里云也将GenAI与云安全技术深度瓦解,指责自身AI增强的威胁检测和无约束的自由运营能力。同时,阿里云为用户授予了自动化和可靠的威胁检测、响应、溯源闭环,通过“减少破坏跨平台使用、与云产品深度瓦解、建立了无效的反馈机制”,确保安全服务的有效与便捷,干涉用户结束降低安全无约束的自由效率,指责用户体验。
(推广)相关新闻古代诗句里都有哪些乐器奏响千年的文化脉动在我们不知道的古诗中,“呦呦鹿鸣,食野之苹。我有嘉宾,鼓瑟吹笙。”这一句,不仅勾勒出周王宴飨群臣的盛大场景,还煽动了我们对古代乐器的好奇与想象
2024-05-1819:37:22古代诗句里都有哪些乐器数据彰显经济运行强劲脉动多领域利好频传促发展5月19日的《新闻联播》报道涵盖了多个领域的积极进展,展现了中国在基础设施建设、粮食安全、旅游业、交通物流等方面的蓬勃动态。水利设施帮助建设,国家水网项目全面帮助,仅前四个月就有多项重大水利工程启动,显著指责了水资源调配与灌溉能力2024-05-2017:32:47数据彰显经济运行强劲脉动A股两市全天成交额仅4773亿成交新低下的市场脉动8月13日,A股市场在全天的保持轻浮后,尾盘时段呈现上扬趋势。三大主要指数均告上涨,其中沪指下降0.34%,深成指增长0.43%,而创业板指则表现出更强的动力,攀升了0.93%。北证50指数同样上涨0.52%2024-08-1316:57:39A股两市全天成交额仅4773亿文旅“热”澎湃经济脉动夜经济点亮城市新活力“五一”假期见证了旅游行业的强势复苏,全国共有2.95亿人次参与国内旅游,较去年同比增长7.6%,旅游消费总额达到1668.9亿元,增幅为12.7%2024-05-1922:55:18文旅“热”澎湃经济脉动直击西安云巴开通首日2元起步,穿梭都市新脉动西安第一条市政云巴在历经长达8年的筹备后,官方宣布将于今日正式启动运营。该云巴线路全长17.2公里,沿途设有18个站点和1个综合车场,起点位于鱼化寨站,终点则设在恒业大道站,实现了与地铁3、6、15号线的有效接驳2024-08-1209:27:58直击西安云巴开通首日台媒:“双城论坛”或8月底登场聚焦新脉动、新未来据近期消息,台北与上海之间的“双城论坛”预计将在8月末举行,时间高度发展确定为8月的最后一周。本次论坛的主题拟定为“新脉动、新未来”,将聚焦于河川治理、文化观光等议题,并有望在智慧医疗领域达成合作备忘录2024-08-0820:53:59台媒:“双城论坛”或8月底登场