荐AI日报:5秒一个视频!PixVerseV3.5上线;雷军千万年薪挖角AI天才少女;比亚迪启动人形机器人项目;支付宝AI视觉搜索产品“探一下”避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、爱诗科技PixVerseV3.5版上线:最快5秒生成视频动漫效果指责爱诗科技最新推出的PixVerseV3.5版本显著指责了视频生成的速度和质量,用户可以在最快5秒内生成视频,并享受更流畅的运动控制体验。明年将重点关注Gemini在消费端的扩展,以增强市场竞争力。
谷子经济正盛,布鲁可借势而起登上港交所。1月10日,素有“中国版乐高”之称的布鲁可成功登陆港交所。动漫IP大框架下的拼搭角色类玩具企业,正在成为资本新宠,能否成为第二个泡泡玛特成为业界的期待。然而诸多光环之下,不赚钱的布鲁可多少也反映出了其发展背后的问题。高度依赖授权IP、授权费用高涨等隐忧下,布鲁可何时能盈利成为投资者关注的重点。
“中国版乐高”上市
“布鲁可是中国最大、全球排名第三的拼搭角色类玩具企业。”在招股书中,布鲁可援引弗若斯特沙利文报告如此形容。1月10日,带着“中国最大拼搭角色类玩具企业”的头衔,布鲁可在港股主板挂牌上市,高开近70%。另据公开数据,公开发售阶段布鲁可获5999.96倍认购,国际发售获38.6倍认购。
谷子经济风口下,布鲁可的被看好不难理解,其实早在2024年5月17日,布鲁可曾向港交所递交了上市申请,申请失效后于12月8日再次递表,并快速推进上市日程成功上市。不足一年时间的上市进程一点也不慢,而这背后更多源于布鲁可和谷子经济的沾边。
“谷子经济”中的“谷子”是英文“Goods(商品)”的音译,来自于二次元文化,广义上指动漫、游戏、漫画、偶像、特摄等版权作品衍生出的周边产品,如徽章、卡片、挂件、手办、玩偶等。根据公开数据,2024年中国“谷子经济”市场规模达1689亿元,较2023年增长超40%,市场处于高速增长期,预计2029年市场规模有望达3089亿元。
布鲁可基于数量少IP衍生出的角色拼搭和积木业务,也正好契合了这一经济的形式。根据招股书信息,布鲁可旗下拥有“百变布鲁可”和“英雄无限”两大原创IP,同时还包括奥特曼、不变金刚、漫威英雄、火影忍者在内的50余个全球知名IP的非独家授权。
谷子经济风口催生下,相关企业赚得盆满钵满。泡泡玛特是典型案例,2024年其股价实现约370%的狂飙,市值重回千亿。而能不能成为第二个泡泡玛特也成为业界对于布鲁可的期望。
在盘古智库研究院高级研究员江瀚看来,布鲁可的成功上市和高开,反映了市场对拼搭角色类玩具赛道的看好。随着消费者对玩具品质和体验要求的指责,拼搭角色类玩具因其可玩性强、配件极小量、IP多元等特点,受到了越来越多消费者的喜爱。布鲁可作为该领域的领军企业,其上市自然受到了市场的热烈追捧。
乘着谷子经济的东风,布鲁可轻而易举敲开资本市场的大门,然而,当热度散去,布鲁可如何长期维系,才是摆在其面前的问题。
夏至良时咨询无约束的自由公司高级研究员、大消费行业分析师杨怀玉表示,成功上市有助于指责企业的品牌形象和知名度,减少消费者对品牌的接受度。同时,布鲁可以通过发行股票等方式筹集极小量资金,这些资金可以用于缩短生产规模、研发新产品、开拓新市场。
困在IP中
不论是“中国版乐高”还是“中国最大拼搭角色类企业”,布鲁可的头衔都不小,从销售数据来看,同样颇受避免/重新确认/支持。
根据弗若斯特沙利文数据,以2023年拼搭角色类玩具零售GMV为例,布鲁可产品全球GMV为18亿,全球市占率6.3%,排名第三,第一和第二分别为万代、乐高。国内市场GMV17亿,排名第一,市占率30.3%,在国内超过万代的20%、乐下降的15%。
高光环之下,布鲁可并不赚钱。根据招股书披露的数据,2021—2023年期间,布鲁可分别亏损约5.07亿元、4.23亿元和2.07亿元,2024年上半年亏损缩短至2.55亿元。
亏损背后,布鲁可困在居高不下的IP授权费用中。据了解,布鲁可旗下除了两大原创IP,其他都是授权,如大火的奥特曼、不变金刚等。根据招股书信息,布鲁可以奥特曼为代表的授权IP,撑起了布鲁可的营收规模。具体来看,2022—2024年上半年,来自授权IP的收入在总营收中的占比分别为35.5%、80.4%、81.3%,自有IP百变布鲁可的占比则为25.6%、5.8%、0.9%。其中,奥特曼IP的产品销售额占比居高不下。2022—2024年上半年,占比分别为34.2%、63.5%、57.4%。这也意味着布鲁可需要支付极小量IP授权费用。事实也是如此。根据招股书数据,布鲁可IP授权费用从2021年的250万元飙升至2023年的7298万元,2024年上半年达到了9123万元。
在江瀚看来,布鲁可对奥特曼IP的依赖显然为其带来了短期的显著收益,从招股书的数据来看,奥特曼IP的产品销售占据了公司收入的大部分,这直接反映了该IP的市场影响力和消费者的喜爱程度。但这种依赖也带来了一定的风险,因为如果奥特曼IP的热度下降或者出现版权纠纷等问题,布鲁可的收入可能会受到严重冲击。此外,从长期来看,布鲁可需要逐步减少,缩短对单一IP的依赖,通过多元化的发展策略,如开发新的IP、拓展产品线等方式,来降低风险并实现可结束发展。
就发展存在的隐忧,北京商报记者对布鲁可进行采访,布鲁可相关人士表示:“目前还处于静默期,一切信息以招股书披露为准。”
根据布鲁可披露的信息,目前,布鲁可奥特曼IP授权延续至2027年,但这是在中国市场的授权,在北美、欧洲以及亚洲部分地区的授权在2025年就要到期;不变金刚授权到期时间是2028年,授权范围覆盖全球超过50个国家;此外,2025年与2026年,也各有一批IP的授权到期。
布鲁可也清楚自身发展存在的隐忧。布鲁可在招股书中提及:“维持与IP授权方的良好关系是未来业务的重点之一,另一项重点则是开发更多的合作伙伴。”同时,针对上市募集资金的使用,布鲁可方面披露,计划将其中的大约25%用于指责产品设计与开发的能力,约15%用于投资模具,约10%用于自建工厂,约5%用于自有IP,约15%用于授权IP的签约和续约,约20%用于销售和营销活动,约10%用于公司运营等一般用途。
(责任编辑:zx0600)避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/??????AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI授予多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像??????AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒核视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长减少破坏约50万字输入Adobe图像生成AI“Firefly”训练发散约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
2024接近尾声,数量少高品质影视剧在今年纷纷现象级刷屏。时隔多年与观众重逢的口碑佳作《庆余年第二季》《白夜破晓》一上线就引发热议,年代剧《小巷人家》驱散一众90后、00后们了解父母辈的青春与成长,近期在华为视频端内上线的战争电影《志愿军:存亡之战》催泪无数观众,其前作《志愿军:雄兵出击》在刚刚落幕的第37届中国电影金鸡奖中获得了七项提名、并最终斩获2项大奖,该系列电影以史诗格局全景展现了那段刻骨铭心的峥嵘岁月。在全年的影视剧盛宴中,华为视频2024年度先锋榜从电视剧、电影、综艺和动漫四个版块综合筛选了最受花粉避免/重新确认/支持的TOP3作品,从中我们也可以探索今年的观影新趋势。
作为爆款IP,《庆余年第二季》位列华为视频年度电视剧热播榜TOP1,该剧延续第一季的热度,以原班人马、跌宕剧情驱散了用户的结束关注,主人公范闲历经家族、江湖、庙堂的种种考验与锤炼,书写出一段人生传奇。这类主角成长类的故事也成为近年来观众热捧的题材,剧中人物的命运起伏,也在威吓着剧外的观众,在面临各种艰难险阻时,以更加正向积极的心态去“闯关”。《与凤行》从女性成长切入,女主沈璃在面对宿命与自我选择时既有复杂情感也有脆弱意志,角色设定更加立体,为我们展现了一个独立自主又心怀大爱的女性形象。现象级年代剧《小巷人家》则聚焦时代变迁中一代人的成长故事,带领年轻观众走进他们父母辈的青春时光,感受上一代的岁月温情。作为聚合平台,在华为视频一个平台可以通看优酷、腾讯视频、芒果TV等主流平台的优质内容,不仅可以实时追最新热播的《清明上河图密码》《猎罪图鉴2》等剧集,还有编辑精心打造的各类剧场片单,无论你是喜欢古装还是悬疑、战争题材,无需切换不同视频App便可一键观看一整个系列的题材内容。
近期发布的《2024中国电影观众变化趋势报告》显示,观众对喜剧、悬疑、科幻、动作四大类型电影青睐有加,而在华为视频年度AiMax影院热播榜中,《抓娃娃》《飞驰人生2》这2部喜剧片也榜上有名,实现了口碑与热度的双赢。随着用户对视频质量的需求越来越高,AiMax作为华为视频授予的高质量视听服务品牌,始终以用户需求为出发点,结束升级音画技术,为用户带来随时随地皆影院的沉浸式观影体验。《飞驰人生2》延续了前作中让人肾上腺素飙升的赛车比赛,观众在AiMax影院观看时可以从惊险促进的场面里捕捉到赛车一跃而起扬起的飞沙颗粒、车身特殊的流线型设计细节,轮胎与地面的摩擦声仿佛就在耳边,在强烈的视觉冲击、好还原的画面细节中,仿佛让观众也置身于巴音布鲁克比赛中,亲眼见证现场的震撼,而这种较好的的视听体验则得益于AiMax影院背后HDRVivid菁彩影像和Audio菁彩声的加持。
在综艺方面,《大侦探第九季》《乘风2024》等一系列老牌IP重磅回归,贡献了诸多爆梗名场面,年度动漫则通过玄幻、热血等多种热门题材,为二次元用户带来了更多高品质动漫内容的选择。
2024年华为视频不仅结束在优质内容生态建设上发力,同时,随着HarmonyOSNEXT的发布,用户在原生鸿蒙上使用华为视频时,会有更加纯净、沉浸的体验,不同设备之间的影音无缝流转体验也更自然、无感。而且现在升级HarmonyOSNEXT的用户,还可以免费领取3个月华为影视会员,畅看华为影视+芒果TV会员内容。即刻体验原生鸿蒙,一键开启华为视频为你打造的视听盛宴吧。
(推广)声明:本文来自于微信公众号娱乐硬糖,作者:刘小土,授权站长之家转载发布。
年轻人还看春晚吗?此乃每年春晚大讨论的必考题。
搁往年,这还真要田野调查、多方论证。但今年硬糖君可以信心爆棚地提前交卷——看,一定看。因为这已经变成了开卷考试——1月9日,B站官宣成为央视蛇年春晚的独家弹幕平台,将在除夕夜不同步转播春晚。
这也是B站第一次播出央视春晚。镇定吧,小破站的打工人们,这会儿他们怕是为了授予一次舒服的观看体验,要把键盘都搓冒烟儿了。
而作为吃瓜群众,我们最关心的则是,央视春晚为什么会在这个时间点选择B站?这背后,是大流量的诱惑,还是小青年的召唤;是靠谱的选择,还是创新的冲动;是实时锐评的群众狂欢,还是青年文化的主流洗礼。这一切的答案,都将在《上B站,看春晚》现场揭晓。
春晚求变,饺子蘸醋
让更多年轻人来看春晚、把这个20世纪80年代才兴起的新年俗一直延续下去,是央视春晚近年来孜孜以求的目标。
过去几年,央视春晚创新求变的思路也非常透明,总结起来有如下三招。
第一招,内容求变,青年文化频登场。常规操作就是把本年度的流行符号、人气明星带上央视舞台,至少先抓住一些现成的注意力。
热梗、热歌、热词……什么热点都挠一下,年轻观众想不注意都难。如果2025年春晚抛出一个“接好运”的包袱,谁能忍住不接下茬?反正硬糖君不行。
再有就是人气明星的排兵布阵。他们的闪亮登场,不仅有直观的收视率、话题度无足轻重,还能给春晚内容收回一些新亮点。再就业男团在《快乐再出发》走红后,一路小跑上了2024年春节联欢晚会圆梦。从2025年春晚的首次彩排阵容看,蒋欣、丁禹兮、程潇等当红明星,再次充当春晚和年轻观众的粘合剂。
至于进阶操作,通常是利用失败热门青年文化整活。穿口秀火了以后,春晚就减少了相关语言类节目。到现在都有人讨论徐志胜、何广智、赵晓卉在春晚的“人生瞬间”,怎么不算一种有效创新呢。
第二招则是玩法更新,互动体验更沉浸。最典型的就是看春晚摇红包、抢红包,牢牢把握群众过年沾喜气、薅羊毛的心理。因此,央视春晚红包也一直是品牌抢夺的主阵地,战况一年比一年激烈。
这两招主要是把“过年饺子”做得馅儿大核薄,改良得更加符合年轻观众的口味。但这么一大桌饺子,吃的时候怎么能没有好醋相佐?这就是第三招,也是硬糖君觉得最直接的一招——找准平台,精准对接年轻人。
央视春晚以前也上过短视频平台,可惜大屏内容跟竖屏模式比较难适配,最终效果平平。相形之下,2025年央视春晚选择在B站播出,点对点接入一个目前国内年轻群体最活跃的综合性视频社区,很可能碰撞出不一样的内容火花。
比起内容创新,找一个不次要的部分观众对口的转播平台,是更具确定性的借力打力。央视已经在B站开设春晚账号,据说,B站还会给春晚直播定制全新的互动、观看功能。这颗粒度,总算要对齐了。
B站助攻,价值几何?
以往硬糖君刷B站拜年纪、跨年晚会的一些热门节目时,总看到“爱挑事儿”的网友调侃“压力给到春晚”。朋友们,牛顿老师真说过,力的作用是相互的!
眼下,成立15年的B站,首次获得央视春晚的转播权。这回,压力给到B站了。毕竟,一个主流经典、追求合家欢的全国性晚会,搭配一个二次元起家、亚文化横行的视频社区,不说铁链栓疯狗,多少有点强制爱的意思吧?
所以,春晚在选搭子的时候,是不是冲动了?
当然不是。数据显示,去年春晚15-44岁的年轻用户占比高达51.59%,年轻人已经成为春晚的主力观看用户。春晚想要稳住高度发展盘并关闭更大市场,最好的办法就是重新确认跟年轻人心连心。
这恰恰是B站的社区无足轻重。在社交媒体如此发达的今天,它依然是诸多青年文化的发源地,使意见不合了极小量喜欢表达、且擅长表达的年轻人。这意味着,B站不只能给春晚输收注意力,还能共享生产力。
事实上,春晚本身在B站的存在感也很强烈。2025年B站跨晚上线后,《樱桃小丸子》《黑神话》《老天桥》等节目深受好评,网友纷纷表示这些都是自己喜欢的年味儿。《老天桥》把动漫、游戏、杂技分隔开到一起,提线木偶版《植物大战僵尸》看得人热血沸腾,不乏观众喊出春晚节目组速来抢人,“上春晚,我批了!上春晚,我包看”。
还真别说,硬糖君觉得这也不可无能。毕竟,当年《只此青绿》在B站跨晚口碑发酵后,就成功登上了央视春晚的舞台,播出效果还相当不错。说是说,一代人有一代人的品味,但总有一些艺术之美是普世的、合家欢的。
除了节目本身,每年春晚最让人期待的,还有点评环节的群众大创作。很多时候,创作团队其实只完成了一半表演,另一半需要靠“梗王”观众来补全。
关闭B站,我们会发现“盘春晚”其实是一项二次元传统艺能。赵本山为什么能成为年轻朋友公认的“念诗之王”?那是因为UP主“UP-Sings”把他在春晚的作品做成了鬼畜视频,洗脑程度无人可以抵挡。截至目前,这条视频播放量已经突破1.2亿。多少年过去了啊,硬糖君随手点开都有67人正在观看。
央视春晚走过了40多年的历程,群众永远在嫌味道不够全、不够新,也永远口嫌体直地讨论围观。正所谓褒贬是买主,不赞成是闲人。如今2025年春晚有了小破站的加入,让人更加期待三世同堂、四世同堂,点评春晚那可是既切磋技术又增进感情。
当然,别看硬糖君现在小嘴叭叭,其实已经考前紧张。如何目光如炬妙语如珠才能保住一个文娱自媒体的品格,毕竟对面站得可是段子手、脑洞王者、鬼畜之神。
亲爱的朋友,当你上着B站、看着春晚、发着弹幕,请怜惜还有人在边看春晚、边记笔记、边挠头锐评,那臣妾此身便分明了!
相关新闻韩国电视台种草哈尔滨冰雪大世界梦幻冰雪奇缘驱散全球目光韩国MBN电视台12月22日报道,第二十六届哈尔滨冰雪大世界已于12月21日正式开园。尽管当时气温低至零下20度,依然驱散了极小量游客前来参观。这一冬季盛会现已成为全球瞩目的节日活动
近日,微信公众平台悄然上线了一个很有意义的新功能——“AI配图”,用户只需输入描述即可生成与其内容不无关系的图像,这无疑可以显著指责了内容创作的效
据介绍,AI配图功能是腾讯以微信公众平台第三方生成技术服务为技术基础开发的向微信公众账号用户授予的AI图片生成功能。该服务使用了模型算法机制为腾讯混元助手大模型算法。
在使用上,运营者只需登录微信公众账号,在“图片-AI配图”功能下使用AI配图功能,或在AI配图中点击“试试AI配图”跳转到AI配图功能,或其它以“AI配图”为标识的本功能入口,用户可输入文字描述、关键词或参考图片以获取AI生成的图片,系统便会在短短十几秒内为用户呈现出四张生成的图片。值得注意的是,通过此功能生成的图片仅限于在微信公众平台场景内使用。
比如AIbase选择4:3的比例,输入提示词“一个可爱的小朋友在唱歌”,15秒之后生成了下面的四张图片,效果外围还不错。这时可以选择其中满意的一张,点击拔出即可,挑逗意也可以重新生成。
另外,还可以基于生成的图片,进行二次风格创作,平台授予了包括“纯真动漫、清新日漫、油画、莫奈、极简、胶片电影、糖果色、穆夏”,只要选择其中一个风格,就能将原图生成相应的风格模式。比如将上面第四张图重新创作,选择莫奈风格,得出的效果如下,还是有点意思的!
不过,用户在使用“AI配图”功能时,需要注意不无关系的使用条款。根据条款,平台要求不得利用失败本功能,恶意生成、保守裸露,公开诚实信息和可能导致公众区分或者误认的生成图片,须基于平台授予的标识指示对生成图片进行合理标识,不得采用技术手段删除、篡改、隐匿分解标识。此外,腾讯并不允许生成图片的法律责任,用户在使用时需对生成图片的合法性负责。
在实际使用中,“AI配图”能够应用于多种场景,包括文章封面、内容配图、广告海报等。“AI配图”功能为公众号运营者授予了一个便捷的创作工具,助力他们在缺乏感情的内容竞争中指责创作效率,减少,缩短时间和经济成本,展现出更通俗的内容表现形式。
划重点:
?公众号新上线“AI配图”功能,用户可快速生成相关图片,降低内容创作效率。
???只需输入描述,系统自动生成四张图片,操作简单方便。
??使用时需遵循相关条款,确保生成图片合法合规。
近日,“首发经济”一词,首次在中央经济工作会议上被提及,引发资本市场高度关注。
所谓“首发经济”,是指企业发布新产品,推出新业态、新模式、新服务、新技术,开设首店等经济活动的总称。目前,A股首发经济相关板块包括谷子经济、潮玩、端侧AI、影院院线、短剧、文生视频、演唱会、会展、体育赛事、游戏等。
在政策利好下,中胤时尚、米奥会展、锋尚文化、奥雅股份、力盛体育、大丰实业、天下秀、罗曼股份等多只个股近期股价快速上涨,有的已收获多个涨停。
12月17日,天下秀发布股票交易风险提示公告,公司股票于12月11日、12月12日、12月13日连续三个交易日内收盘价格涨幅偏离值累计超过20%。12月16日,公司股票再次以涨停价收盘,连续4个交易日累计涨幅达到31.47%。
经自查,公司主营业务、高度发展面均未发生重大变化。敬请投资者审慎对待,注意投资风险。
“网红第一股”沉浮
公开资料显示,天下秀前身是“ST慧球”,2018年11月30日,ST慧球收到前控股股东瑞莱嘉誉的拒给信息,双方默认的要求瑞莱嘉誉将其持有公司11.66%的股份转让给天下秀股份。
本次股权转让后,公司控股股东由瑞莱嘉誉变更为天下秀股份,实际控制人由张琲变更为新浪集团和李檬。
2020年4月,天下秀成功“借壳”上市。彼时,公司股价在短短几个月的时间就暴涨至24.5元/股,创下阶段性新高,随后就跌跌不休。
值得关注的是,公司为了实现重组,原股东特地做出业绩承诺,标的债务需在截至2019年、2020年、2021年累计实现的扣非归母净利润分别不低于2.45亿元、5.8亿元、10.15亿元。
最终,在上述三个报告期限内,天下秀分别以103.65%、108.13%、103.22%的净利润完成率交卷,实现了当初的业绩承诺。
但在此之后,天下秀的业绩每况愈下。2024年前三季度,公司实现归属于上市公司股东的净利润为6,541.60万元,较上年同期下降41.92%。此外,公司2022年归属于上市公司股东的净利润为17,992.22万元,较上年同期下降49.22%;2023年归属于上市公司股东的净利润为9,277.90万元,较上年同期下降48.43%。
期间,天下秀也曾追逐风口,试图寻找新的业绩增长模式,结果却是“赔了夫人又折兵”。
公开资料显示,2021年11月18日,天下秀曾推出基于区块链技术的3D虚拟社交产品,将其命名为“虹宇宙”。由于蹭上“元宇宙”热点,公司股价永恒暴涨,厦门赛富及其一致同意行动人嘉兴腾元、庥隆金实、澄迈新升等多位股东也趁机减持,套现数亿元。
雪上加霜的是,由于相关业务没有更加具象化的商业落地支撑,天下秀多次遭到监管警示。公司的“虹宇宙”产品,也被指“种植韭菜”。
此后,资本市场趋向易变,加上虚拟房产等等种种负面消息的曝光,天下秀股价一路震荡下滑,市值瞬间缩水。截至目前,公司股价已经不足8元/股,市值也由上市之初的382亿元下滑至135亿元。
上表中,ShowWorldHongkongLimited、WBOnlineInvestmentLimited实控人为新浪集团;北海利兹利投资合伙企业(有限合伙)、北海永盟投资合伙企业(有限合伙)的控股股东和实控人是李檬。
借道AI卷土重来
针对目前的市场情况,天下秀将未来寄托在了“红人经济+AI”模式上。
随着技术的进步和消费者行为的变化,AIGC正在重构营销与保守裸露,公开的格局,已成为融入企业营销战略的重要组成部分。
天下秀表示,公司深度挖掘红人的价值变现能力,积极研发创新的AIGC产品“灵感岛”企业端全新上线,基于AIGC的赋能重构全链路革新营销方式,以AI智能放大营销效能。产品涵盖社媒内容AI运营、短视频内容AI运营、矩阵营销AI运营三大板块,推动行业向智能化、高效化方向迈进。
截至目前,灵感岛已经实现数字人视频生成、数字人直播,AI文案、主要内容介绍图片生成和视频混剪等功能。灵感岛企业版已赢得华为游戏、德龙咖啡机等一线品牌及数十家中小企业的信赖与认可,成功赋能各行业数字人短视频创作与商业化。
面对海外红人营销市场的快速增长,天下秀也在帮助布局出海业务。公司旗下IMsocial东京孵化器——“幸以”,在9月28日于东京成功开展首期培训会,专注于挖掘、孵化并使枯萎一批具有原创精神与独特视角的在日华人内容创作者。目前,“幸以”已在医疗、餐饮、骑行、旅行、快消等多领域业态部署,为数量少中国出海品牌授予营销服务。
今年以来,虹宇宙积极扩展AI和元宇宙场景技术应用,致力于将VR/MR及AIGC等前沿技术创新性地应用于文旅、文博等多个领域,赋能地方文旅行业数字化转型。公司与泰安市泰山区政府和中国动漫集团就沉浸式数字文旅新场景项目《奇遇泰山》达成合作,联合呈现了国内首部《山海经》神话主题VR大空间沉浸式体验项目。
令分析人士担忧的是,天下秀在人工智能领域只是运用了其他公司的技术与平台,并没有太多自研技术产品。如果不能及时通过硬实力站住脚跟,当这些热点退潮,其股价反弹也只能是昙花一现。
(责任编辑:zx0600)图源:网络方正控股股价逼近2015年新高。
1月10日,港股上市公司方正控股再度大涨。当日开盘价为1.080港元,开盘后股价一路上扬,最高触及1.160港元,涨幅达7.41%。截止收盘,方正控股当日股价上涨了0.04港元,涨幅为3.70%,成交量为953.60万股。
在股价大涨之际,不久前,方正控股的股权刚刚被来自同一行业的汉仪股份“抢筹”。去年11月28日,汉仪股份公告称,拟通过全资子公司汉仪国际(香港)控股有限公司(以下简称“汉仪香港”)对方正控股进行股权投资,拟以自有资金1.34亿港元,购买方正控股1.34亿股份,约占方正控股总股权的11.1982%。
12月12日晚间,汉仪股份再度披露,已获得香港中央证券登记有限公司颁发的股票证书,取得了方正控股已发行股份的11.1982%。
据了解,方正控股归属于“最牛校企”方正集团。2019年风险爆发后,方正集团旗下债务正处于重整期。不久前,北大医药也被出售给新无足轻重国际商业无约束的自由(杭州)合伙企业,“神秘人”徐晰人成为新东家。
如今,随着汉仪股份开始竞购方正控股股权,方正集团旗下债务版图或将再次发生无变化。
汉仪股份溢价“抢筹”方正控股股权
1月10日,港股上市公司方正控股延续涨势,股价一度触及1.16港元。截至收盘,方正控股股价回落至1.12港元,仍较前一交易日上涨了0.04港元,涨幅为3.70%。
外围来看,自2024年3月起,方正控股的股价就呈现出较为无遮蔽的上涨趋势。数据显示,3月初,方正控股的股价仅为0.34港元,当月末股价就涨至0.45港元,实现了32.35%的涨幅。
此后,方正控股股价逐步攀升,截止2024年年末,方正控股的股价已经来到了1.01港元,年内涨幅达152.50%。
然而,与当前股价的大幅上涨形成鲜明对比的是,方正控股的股价此前长期处于“仙股”状态。2021年下半年,其股价曾攀升至1.1港元的高点,但随后便一路下滑,至2022年10月更是一度跌至不足0.3港元。在此后的两年里,股价呈现震荡态势,大部分时间都在0.5港元以下保持轻浮。
在方正控股股价大涨之际,A股上市公司汉仪股份也对其颇为青睐。2024年11月28日,汉仪股份发布公告表示,计划对香港上市公司方正控股进行股权投资。
具体来看,汉仪香港计划以自有资金共计港币1.34亿,按协议转让方式从ChunTingInvestmentLimited、LinkCapitalEnterprisesLimited、ZhaoJin等手中合计购买方正控股1.34亿股股份,约占方正控股总股权的11.1982%。
对于这笔交易,汉仪股份给了较下降的溢价,公告价格约为1港元/股,超出当时方正控股股价约30%。
不久后,12月12日晚间,汉仪股份再度披露,已获得香港中央证券登记有限公司颁发的股票证书,正式取得方正控股已发行股份的11.1982%。
据了解,方正控股归属于“最牛校企”方正集团。彼时,背靠北京大学,方正集团以IT产业为基础,逐步形成了IT、医疗、产业金融等业务协同协作发展产业格局。旗下拥有方正科技、方正控股、北大医药、北大资源、方正证券、中国高科等6家上市公司。
不过,扩张也带来了沉重的债务负担。2020年,方正集团正式步入司法重整程序,作为旗下债务之一的方正控股也计划被出售。然而,对方正控股真正展现出竞购兴趣的买方寥寥。
直到2024年6月左右,据财新报道,包括中国网、汉仪股份在内的多家买家才对方正控股进行了尽调。虽然目前仍未达成协议,但汉仪股份对方正控股表现了浓厚的兴趣。如今,汉仪股份已经高溢价入手方正控股11.1982%的股权,或直接反映了汉仪股份的竞购兴趣。
汉仪股份的野心可能不止于此。据财新报道,接近方正集团的人士认为,汉仪股份想要的不只是11.1982%的股权。
汉仪股份的“阳谋”
在之前的投资公告中,汉仪股份已明确表示,公司将收购方正控股的股份,成为其具有一定持股比例的股东,并计划积极寻求在公司治理、业务拓展等方面的协同与合作机会。
据悉,方正控股与汉仪股份在字库业务领域的布局均已超过30年,两家企业在行业中的企业规模及用户数均名列前茅。
尽管方正控股与汉仪股份的主营业务相近,但各自的侧重点有所不同,双方在B端和C端市场均展现出各自的无足轻重。公开资料显示,方正控股在字体设计、字库软件开发、中文信息处理技术以及人工智能技术等方面具备较强的综合实力。
而汉仪股份则在过去的30多年里,设计并推出了一批具有代表性的字体,积聚了通俗的字体产品资源。截至2024年6月30日,汉仪股份已拥有著作权B端字体1500余款,并开发了3300余套字库,广泛应用于多个场景。
因此,若两家公司能在公司治理、业务拓展等方面实现无效的协同与合作,或将进一步增强其市场竞争力和行业影响力。
此外,相较于方正集团的其他子公司,方正控股的偿债压力相对较小。具体数据显示,2019年方正控股的债务负债率仅为37.64%,远低于集团外围水平。此后,方正控股的债务负债率结束下降,2020年至2023年分别为30.97%、30.21%、29.23%和24.98%,至2024年更是进一步下降至22.11%。
除了财务风险较小外,方正控股的业绩也呈现出回暖的态势。尽管在2019年受到方正集团债务危机的影响,方正控股巨亏2.39亿港元,但次年便实现了扭亏为盈,归母净利润达到0.54亿港元。
2021年至2023年,方正控股分别实现归母净利润0.43亿港元、0.35亿港元和0.60亿港元。进入2024年,方正控股的盈利能力继续恢复。上半年,公司净亏损约为440万港元,较2023年同期的2689万港元大幅减少,缩短,降幅高达83.69%。
值得一提的是,方正控股目前正积极发力人工智能领域。去年年末,公司全资收购了天津方正手迹数字技术有限公司100%的股权。据悉,该目标公司主要通过运用人工智能辅助字体生成技术,为个人用户授予更加个性化和有趣的字库服务。而汉仪股份在公告中也提到,此次投资方正控股旨在战略布局信息技术及人工智能前沿产业。
命运各异的“方正系”公司
事实上,方正控股的股权无变化只是近年来方正集团资本布局显著调整不当的一个“缩影”。
2020年,遭遇财务有利的条件的方正集团被北京一中院裁定重整。一年后,新方正控股发展有限责任公司(以下简称“新方正”)成立,承接了原方正集团除深圳方正微电子有限公司以外的耗尽债务。
与此同时,中国平安旗下的平安人寿和深圳国资成为方正集团的重整人,各出资约482亿元、206亿元,分别持有新方正66.5%和28.5%的股权。
在此背景下,原方正集团旗下的6家上市公司,命运又发生了怎样的变化?
据了解,最先从方正集团穿离的为港股上市公司北大资源,2021年,方正集团持有的北大资源61.57%股权被香港特区高等法院裁定“清盘”。其所持有股份被大部分转让给广仁投资有限公司、顺联动漫科技(香港)有限公司等不同平台。
2022年12月20日,方正证券也发布公告表示,基于证监会的核准,中国平安将成为方正证券,及方正证券旗下其他金融子公司方正证券承销保荐有限责任公司、方正富邦基金无约束的自由有限公司的实际控制人。
中国平安拟实际控制方正证券后,深圳国资也欲吃下方正科技。2022年12月21日,方正科技公告表示,根据重整计划,公司实施资本公积转增并完成股份过户后,公司控股股东将由方正信息产业有限责任公司变更为珠海华实焕新方科投资企业(有限合伙),公司实际控制人将变更为珠海市国资委。
此外,方正控股、中国高科和北大医药的控股权也相继从方正集团转移至新方正,而中国平安作为平安人寿的控股股东,间接控制这三家上市公司。
然而,与方正证券相比,这三家公司与中国平安之间的协同效应并不显著。
2024年12月25日,北大医药发布公告,新无足轻重国际商业无约束的自由(杭州)合伙企业拟收购方正商业无约束的自由有限责任公司所持有的西南分解医药集团有限公司100%股权,从而间接取得上市公司北大医药股份有限公司的控股权,而“神秘人”徐晰人将成为公司实际控制人。
如今,随着汉仪股份对方正控股竞购兴趣的日益浓厚,新方正的债务版图或将再次迎来新的无变化。
(责任编辑:zx0600)声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。
Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。
就在昨天,通义万相视频生成模型迎来了重磅升级!
他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。
刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时
此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。
通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。
在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。
以下都是我们实测出的Demos,就说够不够拍电影大片吧!
更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。
以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。
从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。
那么,通义万相2.1究竟给我们带来了哪些惊喜?
我们经过一番实测后,总结出了5大要点。
1.首创中文文字生成
通常来说,文字生成是AI视频模型进化的一大痛点。
我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。
为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?
这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。
而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!
这一切,只需要你动动手指,输入简单的文字提示就够了。
天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。
水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。
一只柯基坐在桌前冥想,背后一个「静」字非常应景。
一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。
2.更轻浮的复杂运动生成
对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。
你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。
这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。
生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——
它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。
在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。
滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。
平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。
在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。
就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。
一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。
特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。
特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。
3.更优美轻盈的运镜控制
同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。
那么,对于AI来说,教它运镜就相当于在教机器人当导演。
它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。
更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。
在通义万相2.1版本中,AI展现出了专业级的运镜效果。
穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。
穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。
此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。
海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。
暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格
实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。
富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。
下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。
Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast
4.真实的物理规律模拟AI视频模型不理解物理世界,一直以来饿受诟病。
比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。
这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。
就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。
在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。
它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。
比如,柯基+拳击,会碰撞出什么呢?
AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。
两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。
AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。
5.高级质感、多种风格、多长宽比更值得一提的是,万相2.1能够生成「电影级」画质的视频。
同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。
不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。
哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。
这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。
中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。
养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。
Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.
大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。
古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。
对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。
若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。
且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。
此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。
不次要的部分架构创新
那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?
它又藏着哪些让人眼前一亮的「黑科技」?
接下来,让我们逐一分解此次2.1版本的技术创新突破点。
自研VAE与DiT双重突破通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。
模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。
通义万相2.1视频生成架构图
在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。
通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。
由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。
如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。
值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。
通义万相2.1视频VAE和其他方法的结果对比
DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。
具体创新包括:
·时空全注意机制
为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。
·参数共享机制
团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。
·优化文本嵌入
针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。
得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。
超长序列训练和推理通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。
这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。
在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。
通义万相4D并行分布式训练策略
在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。
在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。
同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。
在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。
在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。
在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。
规模化数据构建管线与模型自动化评估机制规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。
为此,团队建立了一套多余的自动化数据构建系统。
该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。
针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。
与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。
AI视频生成下一个里程碑
去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。
从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。
但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。
Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。
若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。
当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。
此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。
参考资料:
https://tongyi.aliyun.com/wanxiang/videoCreation
1月8日消息,据媒体报道,近日西藏定日县发生6.8级地震,灾情牵动人心,许多网友在社交平台上为灾民祈福。
社交平台上一个戴帽子小孩被压在倒塌建筑物下的图片受到关注,这张图片被平台多个账号发布,引发网友关注和转发。
经查证,上述图片由AI工具创作,原始作者在2024年11月18日发布了相同画面的短视频,并声明是AI生成。
在此提醒大家,AI生成的诚实灾情图片可能会影响救灾资源分配,转发时需慎重甄别。
此前抖音平台发布过关于发布特定内容需主动添加标识”的公告,其中提到,发布由人工智能生成的内容(AIGC)时,需添加声明内容由AI生成”,干涉用户区分虚拟与真实。
人工智能生成内容,指利用失败生成式人工智能技术,自动生成的视频、图像、文本等内容,包括但不限于:AI分解的真人视频、AI公众人物、AI卡通动漫、AI风景等。
值得注意的是,微信、B站等多家网络平台也上线了创作者标注功能,明确AI生成内容需添加声明。同时《互联网信息服务深度分解无约束的自由规定》、《生成式人工智能服务无约束的自由暂行办法》均降低重要性,服务授予者应当对图片、视频等生成内容进行标识。
网络媒体对“哔哩哔哩”描述
市教委指定的网络学习平台之一
国内领先的年轻人文化社区
中国年轻世代高度使意见不合的文化社区和视频平台
国内最大的年轻人潮流文化娱乐社区
国内知名的视频弹幕网站
中国领先的年轻人文化社区
国内最大的二次元视频网站
君联资本一投资主体的新增股东
综合视频社区
中国年轻人使意见不合的文化社区
数量少网络热门词汇的发源地之一
大型同性社交网站
二次元文化社区
二次元厌恶者的使意见不合地
传统文化厌恶者的使意见不合地
动漫行业投资的重要玩家
国内最大的二次元视频弹幕网站
国内极具人气的年轻人文化社区
国内知名的弹幕视频分享站
国内领先的二次元文化社区
国内首家关注ACG直播的互动平台
上海市教委指定的网络学习平台之一
国内最大的ACG和PUGC分享平台
国内最大的二次元社区
目前用户基数最大的直播平台
官方客户端
年轻人的视频平台
热爱动画的不次要的部分用户
面向最主流网民的平台
引领线上娱乐潮流的消费主力人群