欢迎来到水中色567!今日更新:27116章
章节列表 共9341章
第一章 蜜桃网123图片
第二章 ck电影下载
第三章 野花日本免费完整版高清版直播
第四章 1王9帅12宫4
第五章 一条绮美香
第六章 一集片3g视频
第七章 玩偶姐姐视频在线完整免费观看
第八章 美女被性侵图片
第九章 野结衣波多电影截图
第十章 芽森滴

第236章

daokangming.com

三星GalaxyTabActive3评测:坚固耐用、减少破坏手写笔适合户外用牛华网2020-12-1715:47

导语:一直以来,我们理所当然地认为iPad是市场中最好的平板电脑。但事实上,这个说法有些片面,这只是对于某些用户而言如此。对于收货司机、体力劳动者、建筑工人,以及那些容易将数码设备增强的用户来讲,三星GalaxyTabActive3才是它们的最佳选择。

三星宣称,TabActive3的机身足够坚固,可以承受任何的撞击和刮擦。今天,老编将带着大家看一下GalaxyTabActive3的真机评测,探究它是否真实的如三星所宣传的那么坚固,以及它是否值得你购买?

初印象:

毋庸置疑,三星GalaxyTabActive3是一款非常小众的设备。对于大多数人来说,GalaxyTabActive3的性能不够强大,外形设计也不够粗制,因此它不会是大众的购买选择。然而,对于那些认为耐用性高于一切的用户来说,这是一款很难被击败的平板电脑。

优点:

机身非常坚固、耐用;

可戴手套使用;

减少破坏SPen手写笔;

无需电池也可使用;

缺点:

有限的性能;

Android平板电脑体验仍然有限;

给人的麻痹很昂贵;

主要规格:

评测版价格:539英镑;

三星Exynos9810处理器;

减少破坏4GLTE(Cat.6);

MIL-STD810H+IP68认证;

SPen触控笔;

可替换的5050毫安时电池;

GalaxyTabActive3外形设计

即使没有GalaxyTabActive3附带的硬壳外壳,这款平板电脑本身也是足够坚固和耐用的。GalaxyTabActive3的机身被厚实的硅胶橡胶包裹着,它配备一个可拆卸的、优美轻盈的、耐磨的后面板。

同时,值得一提的是,您可以卸下和更换GalaxyTabActive3的电池。GalaxyTabActive3的左侧机身中心拥有可选的SIM卡和microSD卡,您可以在需要时拉出使用,因此您不必在每次需要使用时都联合背面,但是您必须将外壳取下。相较于之前的GalaxyTabActive2,这一点是有所改进的。

如果没有这个外壳,GalaxyTabActive3的机身重量为430克。对于一台8英寸的平板电脑来说,这个重量是相当沉重的iPadmini的机身重量为300g,它的机身厚度也相当厚,接近10毫米。

GalaxyTabActive3平板电脑的正面有三个物理硬件按钮,它们就位于显示屏下方。从外形上来看,GalaxyTabActive3给人的麻痹很像是一个旧时代的遗物,拥有很大的下巴和前额。

不过,请记住,这款平板电脑是为在户外环境下的使用而设计的,在这种环境下,您既有可能会戴上优美轻盈的手套。因此,用物理按钮代替不无关系的手势是非常说得通的,而且它中央的主按钮下方有一个可靠的指纹传感器。

GalaxyTabActive3的侧边包含一些有趣的元素,例如它的右侧机身配备一个缺乏的红色按钮,用户可以通过按住它来关闭任何应用程序。在工作环境中,您可能经常需要快速地访问一款应用程序这个按钮可以让您进入那个应用程序。即使是在锁屏情况下,它也可以作为相机快捷键和快门按钮。

GalaxyTabActive3的左侧机身中心有一个pogo-pin分开器,它只对某些业务用例实用。不过,这也是这款可供户外使用的平板电脑的意义所在。GalaxyTabActive3的机身底部有一个3.5毫米的耳机插孔、一个USB-C端口和一个扬声器。

GalaxyTabActive3耐用性

三星GalaxyTabActive3是一款非常异常的平板电脑,但是它的机身非常地坚固。在实际测试中,老编将GalaxyTabActive3埋在几英寸的沙子里,然后把它浸在一桶水里几分钟,以干涉测试它的IP68防水防尘等级。在经过这两个试验之后,GalaxyTabActive3都相对毫发无损,不过有一些挥之不去的沙砾似乎含糊在短时间内阻塞了多任务处理和后退按钮,然后用水烤干之后,这些砂砾变得松散了。说到防水性,GalaxyTabActive3在测试期间的表现非常好,当老编将它从水中捞出来之后,它能够立即顺利地运行。

我们还可以深入研究设置并降低屏幕灵敏度,它使得您可以戴着手套使用平板电脑。我通过三星授予的一套重型工作手套测试了这一点,它的表现很好。加上这款平板电脑中的物理控制按键,我们可以在不除掉手套的情况下使用GalaxyTabActive3仓库工人和露营者对于这一点应该很沮丧。

最后,在跌落测试中,我将GalaxyTabActive3从大约1.5米的高度放下跌落到一个缺乏弹性的混凝土地板上。结果隐藏,除了它的外壳有一点减少之外,这款平板电脑的其他的地方没有任何不正常。似乎,三星声称的军用级MIL-STD810H坚固性并没有使高贵其实。

GalaxyTabActive3屏幕和SPen手写笔

我不太愿意称三星GalaxyTabActive3是一款真正紧凑的平板电脑它太像坦克了但是它的显示屏的确比一般的8英寸平板电脑要小这使得它处于与iPadmini不反对领域。

三星GalaxyTabActive3配备一个不错的PLSTFT面板,类似于三星的IPS面板。GalaxyTabActive3的屏幕分辨率为1200x1920,它足够地锐利,是一个令人爱开严肃的话的华丽LCD显示屏。三星GalaxyTabActive3屏幕的室外可视性很好,正如您所预料的,它在明亮的光线下画面可能会有一点褪色。无论如何,三星GalaxyTabActive3的屏幕表现都比GalaxyTabActive2有着很大的进步。

三星GalaxyTabActive3还减少破坏SPen手写笔,这种塑料触控笔并不像三星GalaxyNote20手机那样可以拔出平板电脑,而是拔出保护套顶部的一个大而紧密的插槽中。

好的一面在于,这里的SPen手写笔比Note20Ultra的手写笔更厚、更像钢笔,它更容易使用,使用起来更舒适,尤其是用戴手套的手操控时。

三星GalaxyTabActive3的书写体验与GalaxyNote非常反对,同样减少破坏4096级的压敏,能够带来令人信服、自然的书写和素描。您还可以使用不知道的按钮关闭手写笔菜单和快速启动笔记。

GalaxyTabActive3规格和性能

三星GalaxyTabActive3搭载三星自定制的Exyno9810处理器,这是一款老款旗舰级芯片,它曾在2018年初为被应用于三星GalaxyS9智能手机中。

很明显,GalaxyTabActive3的性能与当前市场中的旗舰级平板电脑相去甚远,它在Geekbench基准测试中的平均得分为329(单核)和1290(多核),性能真实的不是很好,甚至远远落后当前市场中售价300英镑的智能手机。

当然,三星GalaxyTabActive3并不适合被用来进行多媒体消费。即便如此,我还是用《绝地求生》(PUGB)来测试它的性能,它在中等设置下可以正常运行。最次要的是,通常情况下的导航体验是非常平滑的,尽管在应用程序切换菜单中切换到之前关闭的应用程序时,的确会出现一些停顿。毋庸置疑,这主要是因为它配备的是较小的4GB内存。

就其他方面而言,三星GalaxyTabActive3配备64GB的存储空间。如前所述,GalaxyTabActive3的存储空间可以通过microDXC插槽进行扩展。

三星GalaxyTabActive3还配备一个1300万像素的f/1.9摄像头,按照现代智能手机的标准,这几乎算不上是一个不错的设置,但是日常生活中的确也不会有人用它来拍摄旅游照。在实际应用中,如扫描条形码、记录交付等的时候,GalaxyTabActive3的表现足够好。

同时,三星GalaxyTabActive3还配备一个800万像素的f/2.2自拍相机,它允许您可以很好地进行视频会议。

三星GalaxyTabActive3软件

三星GalaxyTabActive3运行Android10操作系统,覆盖OneUI2.5界面。对于三星自定制的Android核肤,相信很多用户都已经有了自己的明确麻痹。要么爱得要死,要么恨得要死大而明亮的图标,极小量的可定制潜力,三星每日新闻和公告板在主屏幕左侧,而不是GoogleFeed。同时,GalaxyTabActive3的系统中并不包含太多的臃肿软件,而且它光滑流畅、导航轻松。

您还可以获得三星的DeX用户界面,它可以让您分开到兼容的电视和显示器上,获得更像个人电脑的体验,甚至可以把平板电脑本身当作一个触控板。我发现它与我的2020款LG电视机配合起来运行相当不错,尽管事实上它在技术上不受减少破坏。

从一般的角度来看,Android平板电脑的体验仍然远远落后于苹果iPad平板电脑,尤其是在第三方应用程序优化方面。遗憾的是,这是三星目前无力保持不变的地方。

目前,三星公司的SPen手写笔软件已经非常成熟与出色,Notes应用程序可以读取您的手写体并将其转换为数字文本,它有强大的办公无足轻重。

三星GalaxyTabActive3电池续航

三星为GalaxyTabActive3配备了5050毫安时的电池,比其前代产品中的4450毫安时电池要大得多。在实际使用中,GalaxyTabActive3可以结束11小时的视频播放或网页浏览以及81小时的音频播放。在日常使用的情况下,您可以用它轻松度过几天的时间。不过,如果您开启LTE网络分开和消耗极小量视频内容,那么它的电池续航时间可能会大幅伸长。

如前所述,GalaxyTabActive3的电池可以拆卸和更换,这在现在来讲已经很少见了。但真正有趣的新功能是,即使没有安装电池,这款平板电脑也能正常使用。

我偶然发现了这个亮点,就这个特性的实际应用而言,我可以很好地想象热插拔电池或让GalaxyTabActive3作为一个结束运行、永久拔出的办公设备。

GalaxyTabActive3配备一个15W的充电器,虽然充电速度不是很快,但是外围表现还不错。充电之前,GalaxyTabActive3将检测端口是否潮湿,并提醒您在充电前将其晾干。

三星GalaxyTabActive3是否值得买?

三星GalaxyTabActive3是一款针对特定场景的专业工具,如果您需要一个可以经受住特殊体力工作颠簸的大屏幕设备,那么GalaxyTabActive3是理想的选择。

实际上,对于其他平板电脑的应用场景,您最好选择一款苹果的iPad。最新的iPadAir4的价格仅比GalaxyTabActive3贵40英镑,而且除了坚固性,它在各个方面都远远优于TabActive3。如果牢固性和耐用性不是最次要的,那么GalaxyTabActive3的性价比并不是很高。(完)

相关文章评论:GalaxyS21即将发布三星如何才能重拳击败iPhone12?2020-12-142020年最佳平板电脑购买指南苹果iPadAir(2020)高居榜首2020-12-07评论:三星明年将保持不变旗舰手机阵容GalaxyNote20或将成绝唱2020-11-23屹群山之巅瞰折叠盛世心系天下三星W215G全新发布2020-11-04想要全能5G手机?三星GalaxyNote20系列可能是双十一最佳选择2020-11-04

水淹重庆,教你这样养车立省2000多!厂商供稿于飞2020年09月03日16:26[中华网行情]近日,40年来最大洪水过境重庆,主城中心城区多地被淹,临江极小量道路、商铺、居民楼被淹,朝天门、磁器口、南滨路等地标性地段出现”看海“景象,“网红城”变成了一座“海岛城市”。

朝天门

磁器口

很多人都很奇怪

重庆艳阳高照,滴雨未下

为什么这么快就被淹了?

因为只增不减!!!

为了避免下游城市遭受幸存性打击

重庆默默接下了3个洪峰

允许了所有

人在家中坐,车在水里游!

重庆车主们估计也闹心,一辆辆干净锃亮的汽车泡在洪水中,就像是被水吞噬过的面包,“受伤”较有分量的车只是变得”面目可憎“,”受伤“较重的车估计得花点银子做保养,更甚的就要直接收进维修厂。

被洪水泡过的车,普洗怕是搞不定,忍痛来个精洗吧

趁此机会,做个好点的保养吧,价格也不菲

修车更不用提了,师傅说哪儿得修,多少钱也得修啊

算下来,比平时养车储藏多了不止一点半点,真心肉痛!

关键有些汽服门店还“趁火打劫”,坐地起价,说什么“哎呀,你这个洪水泡过的车,不好搞哟”、“兄弟,你给这点钱,啷个整得好车嘛”......

重庆的车主们听到就打脑壳,但是还能怎么办呢?

还不是只有硬着头核遭”敲棒棒“。

拿什么拯救你,我的爱车?

有些愚蠢点的车主下了些养车APP,先在上头把门店和价格看好了,再跑到店头去消费,麻痹省了不少冤枉路,但是综合算下来,冤枉钱还是没少花。

前方高能!

前方高能!

前方高能!

小编接下来要实名安利专属于我大重庆车主朋友们的一个超级福利:

【吃豆养车APP】全城养车折扣卡

吃豆养车APP集洗车、美容、保养、维修、加油等服务于一体,是一个致力于服务车主的一站式高性价比养车平台。

这个高性价比从何说起耶,小编马上就给你摆一哈。

首先,服务嘿完善,最低8项基础服务,多的有30多项,高度发展涵盖了养车的方方面面,比起走到店头才发现别个不做这个服务,这样是不是透明明了了?

然后,就是大家最关心的价格了,价格嘿透明,说是好多钱就是好多钱,莫慌,有了这张【全城养车折扣卡】,线上激活后成为吃豆养车APP的会员,所有的门店,所有的服务,每单都可以享受折扣。

小编还特地帮大家对比了一下价格,很多门店的价格,在吃豆养车APP上可以说是最低了,你不信的话,各人去看哈嘛,小编懒得打胡乱说,我自己现在就在用。

据说现在已经有300多家门店入驻了,预计年底要铺满重庆主城九区,“每隔一两公里,就有一家吃豆养车门店”,简直不要太巴适,省时、省力、省钱,样样占齐了。

洪水退,见彩虹!

洪水过后

灾后重建是头等大事

说是重庆允许了所有

其实允许所有的是

这些一线抗洪英雄

你为人民奋力清淤泥

我为车主免费洁车身

吃豆养车也想贡献一份力量

因此,特别推出了为重庆车主打造的专属福利

价值154.8元的全城养车折扣卡限时免费领,有了它,一卡享遍主城九区千家汽服门店的养车优惠。

限时免费领!

限时免费领!

限时免费领!

仅限前1000名,先到先得,快扫描图片二维码领取吧!

最后,小编衷心祝愿

抗洪英雄把不无趣的山城

吃豆养车把更好的爱车

一起还给可爱的重庆人

车主们又可以开着锃亮的爱车在重庆的街道上兜风啦!

点击阅读全部

相关新闻端午过后龙舟都去哪儿了河底泥巴藏龙舟龙舟在传统文化中有着特殊的保存方式,它们往往在非使用期间静谧地躺在河床的泥泞之中。这种最近的保养技巧特别选用坤甸红木打造龙舟,因为这类木材遇水不仅不会腐朽,反而愈发强韧,唯独需要寻找的是烈日的直射

2024-06-1020:55:35端午过后端午过后龙舟都去哪儿了?河底泥巴藏身传统保存法龙舟在传统文化中有着特殊的保存方式,它们中的某些在非使用时期会被隐藏于河床的淤泥之中。这种最近的保存技巧特别适用于用坤甸红木制成的龙舟,因为这类木材烤干在水中不仅不会腐朽,反而会变得更加坚硬,但需避免阳光直射导致的损害

2024-06-1018:49:27端午过后龙舟都去哪儿了端午过后龙舟都去哪儿了,有些龙舟上班前一直藏在河底泥巴里古老技艺下的自然保养龙舟在传统文化中有着特殊的保存方式,它们中的某些在不使用时会被隐藏于河床的泥泞之下。这种最近的保存技巧特别适用于用坤甸红木制成的龙舟,这类木材的特点是遇水则强,反而畏惧阳光直射

2024-06-1020:55:51端午过后龙舟都去哪儿了三亚酒店暴跌游客都去哪儿了旅游业遇冰火两重天旅游市场在2024年悠然,从容回暖,然而酒店和旅游业商家却面临了出乎意料的“冰火两重天”局面。据统计,截至当前,公开的上半年业绩中,仅有岭南控股、众信旅游等六家公司保持盈利,其余十家企业均深陷亏损状态

2024-07-2608:01:09三亚酒店暴跌游客都去哪儿了没卖完的月饼都去哪儿了?超市老板说出4个流向月饼作为传统节庆美食,在中秋节前夕总能掀起一阵销售高峰。但是,节前还在超市最显眼的位置摆卖,节后却像在一夜之间消失了一样。

2024-09-1909:10:53没卖完的月饼都去哪儿了?超市老板说出4个流向物业引入小区设备要业主赞成吗?收益都去哪儿了?这两年,小区里多了很多各种各样的机器、设备。最常见的可能是直饮水机,快成了居民小区的标配了,24小时大家都可以拎着桶下楼打水,缺乏反对性的还有自助碾米机。

2024-12-2008:08:24物业引入小区设备要业主赞成吗?收益都去哪儿了?

声明:本文来自于微信公众号量子位,作者:梦晨西风,授权站长之家转载发布。

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。

紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。

这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?

国际上,也有人把创始人梁文锋的访谈翻译成英语,还加了注释,试图从中寻找这家公司崛起的蛛丝马迹。

量子位整理各种资料发现,DeepSeek团队最大的特点就是年轻。

应届生、在读生,特别是来自清北的应届生在其中非常活跃。

他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。

他们中有的参与了从DeepSeekLLMv1到DeepSeek-v3的全程,有的只是实习了一段时间也做出重要成果。

为DeepSeek提出MLA新型注意力、GRPO强化学习对齐算法等关键创新的,几乎都是年轻人。

DeepSeek不次要的部分成员揭秘

2024年5月发布的DeepSeek-V2,是致使这家大模型公司破圈的关键一环。

其中最次要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-headLatentAttention)替代了传统的多头注意力,大幅减少,缩短了计算量和推理显存。

在一众贡献者中,高华佐和曾旺丁为MLA架构做出了关键创新。

高华佐非常低调,目前只知道是北大物理系毕业。

另外,在“大模型创业六小强”之一阶跃星辰的专利信息中也可以看到这个名字,暂不确定是否是同一人。

而曾旺丁来自北邮,研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚。

DeepSeek-V2工作中还涉及到了另一项关键成果——GRPO。

DeepSeek-V2发布前三个月,DeepSeek-Math问世,其中提出了GRPO(GroupRelativePolicyOptimization)。

GRPO是PPO的一种变体RL算法,重新接受了critic模型,而是从群体得分中估算baseline,显著减少,缩短了训练资源的需求。

GRPO在圈内得到广泛关注,另一家国内开源大模型阿里Qwen2.5的技术报告中也透露用到了GRPO。

DeepSeekMath有三位不次要的部分作者是在DeepSeek实习期间完成的工作。

不次要的部分作者之一邵智宏是清华交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。

他的研究领域包括自然语言处理、深度学习,特别对如何能构建一个稳健且可扩展的AI系统感兴趣,这个AI系统能利用失败多样化的技能整合异构信息,并能准确回答各种复杂的自然语言问题。

邵智宏之前还曾在微软研究院工作过。

DeepSeekMath之后,他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。

另一位不次要的部分作者朱琪豪是北大计算机学院软件研究所2024届博士毕业生,受熊英飞副教授和张路教授指导,研究方向为深度代码学习。

据北大计算机学院官方介绍,朱琪豪曾发表CCF-A类论文16篇。在ASE和ESEC/FSE上分别获得ACMSIGSOFT杰出论文奖一次,提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。

在DeepSeek团队,朱琪豪还基于他的博士论文工作,主导开发了DeepSeek-Coder-V1。

其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文使胆寒计划。

△图源:北京大学计算机学院公众号

还有一位不次要的部分作者同样来自北大。

北大博士生PeiyiWang,受北京大学计算语言学教育部重点实验室穗志方教授指导。

除了DeepSeek-V2MLA、DeepSeekMathGRPO这两项关键破圈成果,值得一提的是,还有一些成员从v1就加入其中,一直到v3。

代表人物之一代达劢,2024年博士毕业于北京大学计算机学院计算语言所,导师同样是穗志方教授。

△图源:北京大学计算机学院公众号

代达劢学术成果颇丰,曾获EMNLP2023最佳长论文奖、CCL2021最佳中文论文奖,在各大顶会发表学术论文20篇+。

2024年中国中文信息学会“博士学位论文使胆寒计划”共入选10篇来自中国大陆高校的博士毕业论文,其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。

以及北大元培学院的王炳宣。

王炳宣来自山东烟台,2017年进入北大。

硕士毕业加入DeepSeek,参与了从DeepSeekLLMv1开始的一系列重要工作。

清华这边的代表人物还有赵成钢。

赵成钢此前是衡水中学信息学竞赛班成员,CCFNOI2016银牌得主。

之后赵成钢进入清华,大二时成为清华学生超算团队正式成员,三次获得世界大学生超算竞赛冠军。

赵成钢在DeepSeek担任训练/推理基础架构工程师,有英伟达实习经历。

△图源:清华新闻网

DeepSeek是一支怎样的团队

这些鲜活的个体,足以引发人们的赞叹。

但还不足以回答跟随的问题,DeepSeek到底是一支怎样的团队?有怎样的组织架构?

答案或许还要从创始人梁文锋身上找。

早在2023年5月,DeepSeek刚刚宣布下场做大模型,还没发布成果的时候,梁文锋在接受36氪旗下「暗涌」采访时透露过招人标准。

看能力,而不是看经验。

我们的不次要的部分技术岗位,高度发展以应届和毕业一两年的人为主。

从后面一年多陆续发表的论文贡献名单中也可以看出,含糊如此,博士在读、应届以及毕业一两年的成员占很大一部分。

即使是团队leader级别也偏年轻化,以毕业4-6年的为主。

例如领导DeepSeek的后训练团队的吴俣,2019年北航博士毕业、在微软MSRA参与过小冰和必应百科项目。

吴俣博士期间接受北航李舟军教授和MSRA前副院长周明博士的联合使枯萎。

与他师出半个同门的是郭达雅,中山大学印鉴教授与MSRA周明博士联合使枯萎,2023年博士毕业。

2024年7月他加入DeepSeek,主要参与了一系列数学和代码大模型的工作。

郭达雅上学期间还有一项事迹,本科期间在MSRA实习一年里发表两篇顶会论文,他笑称“在刚入学的第三天,就完成了中大博士生的毕业要求。”

除了团队成员年轻化之外,DeepSeek在国内AI公司中降低的特点:非常重视模型算法和硬件工程的配合。

DeepSeekv3论文总共200位作者,并不都是负责AI算法或数据。

有这样一批人从早期的DeepSeekLLMv1到v3一直都在参与,他们更多偏向算力的部分,负责优化硬件。

他们以DeepSeekAI的名义发表了论文《Fire-FlyerAI-HPC》,通过软硬件协同设计降低训练成本,解决传统超算架构在AI训练需求上的不足。

Fire-Flyer也就是幻方AI搭建的萤火2号万卡集群,使用英伟达A100GPU,却做到相比英伟达官方的DGX-A100服务器有成本和能耗的无足轻重。

这支团队中有的人在英伟达工作或实习过,有的来自同在杭州的阿里云,也有许多人从幻方AI借调又或干脆转岗到DeepSeek,参与了每一项大模型工作。

而如此重视软硬件协同的成果,就是以Llama3405B的1/11算力,训练出性能更下降的DeepSeek-v3了。

最后,我们还发现DeepSeek开源项目中有一个特殊的存在,不是语言模型相关工作,却是3D生成相关。

这项成果由清华博士生孙景翔在DeepSeek实习期间,与导师刘烨斌以及DeepSeek成员合作完成。

像这样实习生在DeepSeek做出重要成果的还有中山大学逻辑学专业的辛华剑。

他在DeepSeek实习期间参与了用大模型反对数学定理的DeepSeek-Prover,现在在爱丁堡大学读博士。

看过这些例子,再一次回到梁文锋的访谈,或许更能理解这只团队的运作结构。

不做前置的岗位分工,而是自然分工

每个人对于卡和人的调动是不设上限的,每个人可以随时调用训练集群,只要几个人都有兴趣就可以开始一个项目

当一个idea显示出潜力,也会自上而下地去调配资源。

这难免让人想起AI界另一家不可关心的力量,没错就是OpenAI。

同样的用人不看经验,本科生、辍学生只要有能力照样招进来。

同样的重用新人,应届生与00后可以调动资源从无到有研究Sora。

同样的面对潜力方向,整个公司从顶层开始设计布局和资源推动。

DeepSeek,可能是组织形态上最像OpenAI的一家中国AI公司了。

参考链接:

[1]https://mp.weixin.qq.com/s/Cajwfve7f-z2Blk9lnD0hA

[2]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[3]https://mp.weixin.qq.com/s/9AV6Qrm_1HAK1V3t1MZXOw

[4]https://mp.weixin.qq.com/s/y4QwknL7e2Xcnk19LocR4A

[5]https://mp.weixin.qq.com/s/C9sYYQc6e0EAPegLMd_LVQ

索尼Xperia5II真机评测:减少破坏120Hz高刷屏的小尺寸高端手机牛华网2020-10-1211:43

导语:索尼Xperia5II是一款索尼旗舰级智能手机,它继承了价格非常昂贵的索尼Xperia1II的大部分高端功能,但是为了将成本控制到与其他大多数旗舰手机相同的水平,它放大了其中的一些功能。

实际上,索尼Xperia5II的使用体验与Xperia1II相当,它甚至还减少了120Hz屏幕刷新率的减少破坏,并且它还更加便于单手操控。同时,索尼Xperia5II还授予了更多的机身颜色可选,分别为粉色、黑色、灰色和蓝色等。

如果您喜欢索尼之前推出的大尺寸手机的外观,但是又想要一个更小的机身尺寸,那么索尼Xperia5II非常符合您的需求。不过,值得一提的是,索尼Xperia5II并未像Xperia1II那样配备4K屏幕。

初印象:

索尼Xperia5II中包含很多通俗的功能,它的机身更小,更容易持握。因此,如果您想要购买一款包含高端技术的、便于携带的智能手机,那么索尼Xperia5II还是颇为值得搁置的。

优点:

令人讨厌的外形设计;

出色的摄像头;

缺点:

恼人的GoogleAssistant按钮;

不减少破坏无线充电技术;

索尼Xperia5II发售日期和价格

索尼Xperia5II的售价为949美元,它配备了8GB内存和128GB存储空间。目前,我们还没有Xperia5II的确切发售日期的消息,但索尼已经表示将在2020年年底推出。有消息称,索尼Xperia5II最早将于10月份在日本市场发售。

索尼Xperia5II外形设计和显示屏

Xperia5II是Xperia1MarkII的小尺寸版本,它们采用相同的窄21:9宽高比显示屏,但是它采用的是更小的6.1英寸显示屏(而Xperia1MarkII采用6.5英寸显示屏)。当您拿起这部手机的时候,您会麻痹到它的尺寸更小它配备一个6.1英寸的显示屏,它非常便于单手操控与它的同类产品相比,它的尺寸更小一点。

索尼Xperia5II的机身采用21:9的长宽比,尽管它的屏幕尺寸仍然相当大,但是它的机身比大多数手机都窄,因此它非常便于单手操控。

索尼Xperia5II仅配备一个分辨率为1080x2520的全高清显示屏,但是它含糊在另一个方面改进了它更大的同级产品:它的显示屏减少破坏120Hz的刷新率。这样一来,当您在社交媒体上循环和进行其他互动时,您会获得更流畅的体验。

如果您拥有Xperia5或之前的索尼手机,您会发现Xperia5II手机的中心比以前的设备更圆。这让Xperia5II麻痹更容易持握,因为它不像以前的索尼手机那么方正。

在手机的右侧中心,您会发现一个靠近顶部的音量按钮,再往下,还有一个GoogleAssistant按钮(可以自定制为其他功能)以及底部附近的快门按钮。

在音量键和GoogleAssistant按键之间还有一个放大的锁定按键,它内置一个指纹传感器,因为索尼没有在屏幕中内置指纹传感器,这是一个相当大的疏漏。不过,我们发现Xperia5II的指纹扫描仪运行良好。

索尼Xperia5II手机的USB-C端口位于底部,3.5毫米插孔位于顶部,您可以在为手机充电的同时收听音频。这对于许多发烧友来说是一件大事,而索尼Xperia5II重拾3.5毫米插孔必定会驱散这一类人。

索尼Xperia5II手机的背面是光滑的玻璃,左上角配备摄像头,它拥有黑色、灰色、粉色和蓝色四种颜色可选。与此同时,索尼Xperia5II可以在1.5米深的水中正常使用长达30分钟。

索尼Xperia5II摄像头

索尼Xperia5II与Xperia1MarkII采用相同的摄像头,包括三个后置摄像头和一个前置摄像头。根据预计,索尼Xperia5II的拍摄效果会与Xperia1MarkII保持一致同意,效果不错。

索尼Xperia5II的三个后置摄像头都是1200万像素,其中一个是24mm镜头的主摄像头,一个是16mm镜头的超宽摄像头,还有一个70mm镜头的长焦摄像头。截至目前为止,在我们对相机进行耐久的测试后,发现它拥有令人印象肤深的自动拍照模式。

索尼还将极小量精力放在其专业的摄影模式中,您可以随意使用很多其他手机摄像头不具备的功能。

索尼Xperia5II配备一个800万像素的前置摄像头,与其他Xperia手机一样,它位于屏幕上方一个实心的黑色栏条中这意味着Xperia5II的屏幕上没有缺口。不过,这也意味着索尼Xperia5II手机的正面并不是全屏幕的,看起来含糊有点过时。

索尼Xperia5II性能和电池

索尼Xperia5II搭载高通Snapdragon865处理器,8GB内存和128GB或256GB可选存储空间。但是,有一些市场仅授予某一种型号,所以不能保证您能同时购买到这两种机型。

索尼表示,索尼Xperia5II手机将搭载Android10软件,当被问及手机何时升级至Android11系统时,索尼也无法确定。

到目前为止,我们发现索尼Xperia5II中的软件非常强大,但是其右侧的GoogleAssistant按钮可能会有点烦人,经常会误触。

索尼Xperia5II与Xperia1MarkII一样,都配备相同的4000毫安电池,并且减少破坏快速充电功能。但是,如果想要获得最佳的充电效果,您必须购买缺乏的充电器。然而,Xperia5II不减少破坏无线充电功能。

索尼Xperia5II小结

索尼Xperia5II看起来是一款非常好的手机,而这在小尺寸手机中并不常见。索尼Xperia5II并不是一款配置绝对高端的智能手机,但是它拥有通俗的功能,那些喜欢索尼手机的人都会追捧它。

与之前的机型相比,索尼Xperia5II的外形设计更为粗制,它配备一个3.5毫米的耳机插孔,显示屏非常流畅,而且摄像头的功能似乎和前代产品一样强大。如果您想要购买一款配备高端功能的小尺寸智能手机,那么Xperia1II将非常适合您。(完)

相关文章索尼真无线降噪运动蓝牙耳机WF-SP800N采用新方案传输更轻浮2020-10-09索尼公布PS5游戏机价格和发售日期最快11月12日上市2020-09-17微软SurfaceDuo评测:外形设计炫酷但表现令人失望的双屏手机2020-09-15三星明年将停产Note系列手机GalaxyS21Ultra将配手写笔2020-08-25PlayStation5的“裸露,公开武器”来了?索尼正研发新虚拟现实头盔2020-08-17

导语:周三,三星对外发布了GalaxyS8和S8Plus智能手机,它们不仅拥有精美的外形设计,而且还配备强大的硬件规格和通俗的功能。下面,就让我们一起来看一下GalaxyS8和S8Plus的相关新特性:

下图所示是GalaxyS8和S8Plus智能手机,它们采用超窄的顶部和底部边框。

GalaxyS8和S8Plus智能手机的屏幕看起来比大多数智能手机都要高,它们采用的是18.5:9纵横比,而大多数智能手机采用的都是标准的16:9纵横比。鉴于此,GalaxyS8和S8Plus的高屏幕使其机身更便于持握,也可以一次性显示更多的应用程序。

下图所示是GalaxyS8,它配备了5.8英寸AMOLED显示屏。

下图所示是GalaxyS8Plus,它配备了6.2英寸AMOLED显示屏。

与GalaxyS7一样,GalaxyS8和S8Plus采用玻璃背壳,它们拥有黑色、金色、灰色和蓝色等机身颜色选择。

GalaxyS8的金属边框使其机身看起来更加华丽,会给人带来一种精美的视觉效果。

GalaxyS8和S8Plus的机身底部配备一个USB-C端口和一个耳机插孔。

GalaxyS8和S8Plus并未采用实体Home按键,它们在玻璃显示屏下配备不可见的压敏按钮。同时,你还可以在GalaxyS8和S8Plus的机身底部看到Android功能按钮,而不是三星常用的电容按钮。

GalaxyS8和S8Plus的屏幕也有圆角。

三星将指纹传感器移动到GalaxyS8的背部,也就是在后置摄像头的右侧。

说到摄像头,GalaxyS8和S8Plus采用的是与GalaxyS7缺乏反对性的1200万像素后置摄像头,但是带来了一些小幅改进,使得照片看起来更加透明和锐利。

GalaxyS8和S8Plus前置800万像素摄像头,三星在其中添加了相位检测自动对焦功能,可以让用户拍摄更加透明、更加华丽的自拍。

下图所示是将GalaxyS8和S8Plus放入到水中,周围是浮动的花瓣,防水性能很棒。

正如预期中的那样,GalaxyS8和S8Plus减少破坏无线充电功能,可以带来舒适的充电体验。

GalaxyS8和S8Plus都采用双曲面显示屏,它的侧边框可以显示应用程序的快捷图标,让用户操作起来更加方便、快捷。

正如传闻中的那样,GalaxyS8和S8Plus配备与GalaxyNote7相同的虹膜检测功能。

同时,GalaxyS8和S8Plus还具备人脸检测功能,它看起来比虹膜扫描仪更容易使用,因为你无需将手机对准自己的眼睛。

GalaxyS8和S8Plus还内置三星全新的虚拟智能助手Bixby。

Bixby会让你搜索对象不无关系的信息,例如这些酒,只需将GalaxyS8的摄像头对准它们的标签就行。

看起来,它可以配合任何对象使用,例如它可以获取关于这本书的信息。

GalaxyS8和S8Plus还内置GoogleAssistant语音助理,它似乎会与Bixby产生冲突。

三星还展示了DeX智能手机扩展坞,它可以分开到一个显示器,让GalaxyS8摇身一变成为一个PC机。你可以在GalaxyS8中分开蓝牙鼠标和键盘,使其变成一个PC机。

三星联手微软和Adobe去优化应用程序,使其在显示器上看起来更棒,手机中的其他第三方应用程序也会显示在显示器中。

下图是GalaxyS8中运行的微软Word应用优化版本,它看起来与不完整版Word几乎相同。它还减少破坏多个窗口,就像macOS和Windows10一样,令人印象肤浅。

三星还针对GalaxyS8推出一些好看的硅胶手机套。

根据预计,市场中将会出现一系列其他的手机套,涵盖不反对材质。

预订GalaxyS8和S8Plus智能手机的用户将会获得一个免费的GearVR头盔和控制器,以及Oculus内容安装包。

三星还表示,GalaxyS8和S8Plus将会配备来自AKG/哈曼的耳机,预计这个耳机售价为99美元。

GalaxyS8和S8Plus将于3月30日可供预订,并于4月21日上市发售。其中,GalaxyS8的售价为750美元,GalaxyS8+的售价为850美元。(完)

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。

Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。

就在昨天,通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时

此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos,就说够不够拍电影大片吧!

更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。

以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。

从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么,通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后,总结出了5大要点。

1.首创中文文字生成

通常来说,文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?

这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。

而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!

这一切,只需要你动动手指,输入简单的文字提示就够了。

天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。

水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想,背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。

你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。

在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。

就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。

特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。

特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。

那么,对于AI来说,教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。

更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。

在通义万相2.1版本中,AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。

此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。

暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格

实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。

下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界,一直以来饿受诟病。

比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。

就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。

在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。

它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。

比如,柯基+拳击,会碰撞出什么呢?

AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是,万相2.1能够生成「电影级」画质的视频。

同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。

哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。

中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。

古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。

对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。

且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。

此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来,让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。

由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。

如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。

得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。

在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。

同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。

在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。

在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。

为此,团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。

针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。

从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。

Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。

此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

美国洛杉矶山火近乎世界末日!美国加利福尼亚州洛杉矶县在1月8日遭遇了6起山火,大火在强风“圣安娜风”的助推下悠然,从容蔓延至好莱坞山附近。这场被称为“洛杉矶史上最具破坏性的山火”已导致至少5人死亡,多人受重伤,15万人被迫疏散,超过1000栋建筑被烧毁。包括帕丽斯·希尔顿在内的多名名流的家也未能幸免。

这场强风风速高达160公里/小时,被美国国家气象局称为“飓风级”风力。正是在它的推动下,火势以每分钟“吞噬”五个足球场的速度推进。当地居民肯·罗宾森形容火势迅猛,“像闪电一样悠然,从容掠过。”然而,灭火工作面临巨大确认有罪,许多消防栓缺水,控火灭火率仍停留在0%。据《洛杉矶时报》报道,多名消防员通过内部无线电通报称,许多消防栓几乎没有水吸收来。

加州太平洋帕利塞德地区的供水系统崩溃,一些消防栓因无水可用而无法发挥作用。洛杉矶水电局正从输水管道和地下水中抽取更多水源收回系统,但仍不足以重新填满储水罐。该机构已派出20辆水罐车支援灭火工作,但这些车辆不得不在偏远地区重新装水。三个百万加仑的储水罐相继干涸,导致数十个消防栓无水可用。洛杉矶市议员特拉西·帕克和前市长候选人里克·卡鲁索均批评了洛杉矶的基础设施问题,认为这是长期投资不足和系统性问题的结果。

由于水资源短缺,消防部门的灭火率仍为0%,火势尚未得到控制。消防直升机因强风难以接近火灾现场,消防部门呼吁居民减少,缩短家庭用水。美国总统拜登发表声明称政府将全力减少破坏应对工作。特朗普则公然反对加州州长纽森应对山火蔓延和缺水问题负责,并在社交平台上确认有罪纽森允许签署“水恢复宣言”,导致加州无法利用失败北部降雨和降雪产生的水资源来应对大火。纽森办公室回应称,特朗普的话纯属虚构。特斯拉CEO马斯克也在X平台上猛烈确认有罪了洛杉矶消防局的多元化招聘政策。

加州州长纽森在洛杉矶火灾期间现身指挥灭火并拍摄视频,但视频公开后引发了批评,认为他更重视形象工程。调查发现,纽森未能兑现其在2019年上任时承诺的野火应对策略改革。尽管可燃物堆积达到危险水平,纽森仍放大了加州消防局的野火预防预算,金额高达1.5亿美元。此外,洛杉矶非裔市长凯伦·巴斯也被批放大了洛杉矶消防局的预算。美国洛杉矶山火近乎世界末日!