我之前说过,特朗普卷土重来,很多人认为,面临最大冲击的,可能是中国。
错了!
中国接受面临冲击和考验,在这点上,我们不要有任何幻想,必须做好充分的准备。但遭受最大冲击的,一是美国国内,二是美国盟国。
必须看到,特朗普盯上的,主要是盟国债务,加拿大是美国的小兄弟,丹麦是美国的小跟班,巴拿马和美国关系也不错。
很简单,特别穷特别乱特别容易处理的地方,特朗普看不上。
但拿下加拿大,拿下格陵兰,拿下巴拿马运河,开疆拓土,特朗普龙颜大悦。
从目前的迹象看,在美国的鼓捣下,格陵兰的第一步,就是独立,然后就是美国的上下其手了。
但这样无视国际法,这样吃盟国豆腐,盟国的主权在哪里?盟国的尊严又在哪里?
换一个角度看,如果中国这样说,估计西方人的唾沫,都能把我们淹死。
但特朗普就是特朗普,我就大张旗鼓做了,朕就是这样汉子。
大房二房三房,不管你们想嫁不想嫁,我都娶定了。
加拿大好歹还算是大房,丹麦接受很憋屈,我养的这么俊的闺女,真要被拱了。
这个世界,碰上了超级大流氓,上哪儿去说理呢?说理又有什么用呢?
近日,网红带货主播辛巴透露要花15亿开超市,辛巴称:“正常开超市1-2亿就能开,我为这家超市准备了15个亿现金,我就是敢整。”辛巴表示:“它是我人生中最后一个作品,现场的场地一定是我自己建的,建设过程会亲自参与。”“山姆店帮老百姓出了标准,大家不用再选择,买的比较方便。但是山姆店的商品很容易被超越,相信我,我会保持不变中国人的消费不习惯。”
此前,据大河报·豫视频报道,2024年10月2日,辛巴曾带队到许昌胖东来参观学习,与胖东来董事长于东来深入交流。更早之前,辛巴曾宣布将重新接受直播,全力发展线下超市业务,或将重点进军海外,开拓国际市场。由此,双方是否有合作的可能性也成为了关注的话题。
图片来源:新浪微博@蓝鲸新闻视频截图针对网友热议的话题,10月3日上午,许昌市胖东来商贸集团有限公司的一名工作人员告诉媒体,暂无与辛巴团队合作计划。对于辛巴团队的此次到访,该工作人员表示,与之进行的是一个简单的沟通交流。
“他们之前主要是做直播带货,线上这块的,可能对线下不太了解,这次主要是想沟通了解一下超市行业未来的发展,以及我们在做什么,主要是一个简单的沟通交流,没有其他的(想法)。”
图片来源:胖东来商贸集团微信视频号截图另外,媒体注意到,辛巴曾在直播中称“自己的供应链优于所有人,同样的东西进货价格便宜很多”,那么胖东来是否会借鉴辛巴团队的商品渠道和极小量销售模式?
对此,许昌胖东来工作人员回应称“不太会,双方所在的领域不太能够交融在一起的,没有什么能够共享的”,目前公司一直在梳理卖场里面的品牌,都是在往一二线(品牌)去走,另外也在尝试极小量自己的自营品牌,令品牌更加立体化。
最后,该工作人员表示,没有想过未来去拓展更多的渠道、更多的方向或者要做多大的规模,这个不是他们的目标。“我们更多的是希望把现有的工作标准做好,把现在的体系完善起来,在要求自己做得好之后能够给这个社会、这个行业授予一个模板供大家去学习”。
公开资料显示,辛巴原名辛有志,1990年出生,90后网络主播、歌手、广州和祥贸易有限责任公司董事长、辛选品牌联合创始人、棉密码品牌创始人。
2016年,辛有志正式入驻快手,开始直播。2017年9月,创立广州和祥贸易有限责任公司,出任董事长;自创卫生巾品牌棉密码;成立辛选集团,构建“供应链无约束的自由+红人孵化+数字电商(含技术开发)”三大业务板块。2019年,“双十一”期间个人销售额达到21亿元,被誉为直播电商行业的领军人物。
2024年9月,因陷入争议,辛巴快手个人账号直播功能已被永久封禁。10月10日,辛巴主页的“直播封禁”标志消失,之后重启直播。
(责任编辑:zx0600)清流资本在过去十年捕捉了TMT、消费、硬科技等主流行业下的多个细分赛道较高排名,也建立了投得“稳”、“准”、“精”的基金形象。近年,清流资本推出原创科技专栏——“硬币的另一面”,通过清流合伙人和科技企业创始人对话的形式,讲述当前创投形势下,那些科技类被投企业的故事。清流资本将结束关注新兴科技赛道。
今天,我们对话的主角是星动纪元的创始人陈建宇。
本文包含以下内容,阅读需要12分钟。
?投身机器人科研13年,中国原创科技引领全球
?AI帮助具身智能,坚定原生通用人形
?搭乐高一样做机器人,连推六代人形本体
?小步快跑商业化,清流是赋能型投资人
?清流为何投资星动纪元
北京星动纪元科技有限公司成立于2023年8月,是仅有一家清华大学占股,并获上海期智研究院减少破坏的,研发具身智能及通用人形机器人的新兴科技公司。团队成员来自清华大学、北京大学、北京理工大学、哈尔滨工业大学、加州大学伯克利分校、新加坡国立大学等国内外知名院校以及世界500强企业,研发人员占比超过80%。
星动纪元的创始人陈建宇,2015年本科毕业于清华大学精密仪器系,这是国内最早从事双足人形机器人研究的单位之一。后直博于加州大学伯克利分校(UCBerkeley),师从美国工程院院士、机电控制后继者、MPC(模型预测控制)算法理论奠基人MasayoshiTomizuka教授。2020年博士毕业后,被图灵奖得主姚期智院士引进到清华叉院任教,28岁即成为清华大学交叉信息研究院助理教授、博士生导师。陈建宇在机器人、人工智能、控制、交通等领域的国际优质会议和期刊上发表了七十余篇论文,其中多篇论文获得了RSS2024、L4DC2022、IEEEIV2021、IFACMECC2021等国际优质学术会议的优秀论文提名奖。
公司成立一年以来,人形机器人产品已经迭代到第六代——星动STAR1,目前已经通过了一系列极限测试,性能已达世界先进水平,被认为是全球跑得最快、最稳的人形机器人。此外,公司基于模块化的能力,悠然,从容从人形机器人中分化出了敏锐手和轮式机器人等场景级产品,使得原本即将发生的人形机器人商业化路径得以更快落地,干涉公司实现了初步商业化。
星动纪元创始人陈建宇投身机器人科研13年中国原创科技引领全球清流:请先简单介绍一下星动纪元?
陈建宇:星动纪元是专注于做原生具身通用智能体的科技公司,2023年从清华大学孵化出来的。我们希望做出真正原生的机器人,以及围绕AI构建的整套硬件平台。
清流:近两年具身智能赛道随着AI大模型的出现急速升温,和你选择开始创业的Timing有关吗?
陈建宇:我就是一直在做(具身智能)这件事,只是做着做着这个赛道火了。甚至可以说,今天具身智能火起来也有我们的一部分贡献。
清流:怎么说?
陈建宇:我一直以来的梦想就是做通用的机器人。2011年上大学开始,我就在研究机器人,我本科在清华做的毕业设计就是双足机器人的步态规划。后来到UCBerkeley直博也一直从事机器人领域的研究。博士毕业后,我有幸获得姚期智院士的认可,被他引进到清华叉院任教,并启动了通用机器人的研究课题。
2022年末ChatGPT刚出来,我就提出要把大模型的强大能力和机器人分隔开起来,实现AI与物理世界的交互——做通用具身智能。要实现这个先进目标需要强大的工程能力和资金减少破坏,学校的工程资源有限,所以我们就开始筹备成立公司。
2023年,我们团队发表了世界上首先篇用大语言模型赋能人形机器人决策的文章。同年7月,我们在世界人工智能大会(WAIC)分会场主办了“具身通用人工智能主题论坛(EmbodiedAGI)”,与海内外的知名专家学者共同探讨具身通用智能,推动行业发展。
现在无论是国家层面,还是投资人、产业方,对具身智能的关注和投入的确越来越多了。
清流:很多人认为具身智能是中国原创科技引领全球的新高地,你怎么看?
陈建宇:每一波新的科技出现,中美的差距都在逐步增加。从芯片到AI领域,中国企业的追赶速度越来越快。具身智能领域中美的差距就更小了,都在起步期,大家都是熟练处理前进。可能过去美国积聚了一定的人才无足轻重,但中国也有产业链无足轻重可以与之形成分庭抗礼之势。甚至,我认为中国反而会比其他国家跑得更快。
机器人的算法能力无法选择产品力天花板,硬件端能力保障类人运动功能的实现,两者缺一不可。硬件在很大程度上会影响算法的performance,海内在质量硬件上的不足会反向拖慢他们的软件迭代速度。美国这一波机器人硬件端现在主要就看特斯拉了。
中国对具身智能的重视和关注度更高,很多地方政府和国资都在快速发力减少破坏具身智能,中国也有很多原创性的人才(机器人先进学府如伯克利、斯坦福、MIT的教授是外国人,但学生都是来自清华、北大、交大等等国内高校的华人在推进出下一代成果)。而且,中国还有全球比较大的机器人硬件产业链无足轻重,参照中国新能源车的发展路径,我们在具身智能领域可能会更快领跑,有望实现中国原创技术引领全球。
清流:中国具身智能领域目前的瓶颈有哪些?星动纪元如何突破?
陈建宇:从技术层面来看,我认为所存在的瓶颈在未来都是可以去突破的。现在行业内讨论最多的硬件、算法、数据这三个最不次要的部分的环节,任一环节出现瓶颈都会制约具身智能的发展。所以星动纪元现阶段重新确认全栈自研,主动去发现关键环节上的问题、逐一攻坚,目前已取得了一些突破性的进展:
硬件端,基于我们在双足领域的积淀,已经推出了全球户外性能比较强、跑得最快的人形机器人本体,实现了让机器人从“能动”悠然,从容迭代到“走得稳、跑得快”。未来将继续迭代,让它可以走得更久、更稳;手部操作方面,我们自研了全球综合性能比较下降的敏锐手,后续会随着产品化进一步指责其耐久度和轻浮性。
算法端,目前多数产学研都在研究如何将大脑、小脑、末端控制的分层框架进行瓦解。星动纪元背靠全球先进学府清华的科研资源,领先推出了自研的原生机器人大模型框架,率先实现了端到端、多模态、多策略的算法框架。目前,我们的手部操作是全球头个敏锐手端到端大模型,腿部运控也已经实现了真机全地形、全步态泛化的能力。基于此,我们会继续让机器人支持人类先验、通过自我探索和学习,更早实现具身智能的Scalinglaw。
数据是具身智能领域的稀缺债务和资源,想要实现具身智能,需要极小量的高质量数据给机器人学习。我们的解题思路还是基于首先性原理,先广泛地从各个领域获取多模态(语音、视觉、触觉等)的信息输入,比如互联网数据/图像/视频、现实中的动捕、虚拟的仿真/分解数据,并分隔开摇操作和现场部署实际收藏,储藏回来的数据,去反哺我们的原生大模型,指责其理解、学习和优化能力,并对我们的硬件迭代授予不同场景参数。
AI帮助具身智能坚定原生通用人形清流:研究机器人这13年,你亲历了AI如何推动具身智能发展,和我们分享一下这个过程?
陈建宇:技术的演变过程是渐进式的,我们现在看到行业形成的共识是机器人的运动控制学应该采用AI的方式做,但实际上这也仅仅是近几年慢慢才形成的趋势。
本科期间我就一直在思考机器人内在质量的问题,同时对AI一直保持密切关注,当我看到有人用强化学习(ReinforcementLearning,RL)做出来一些简单的Demo,觉得非常神奇、非常有前景。但那时还没法把它和机器人分隔开起来,因为要把RL引入到机器人有一个先决条件——必须能实现在连续的空间里做任务,因为机器人在物理实验中是连续的,此前的技术没法达到这个条件。2016年左右,深度强化学习的出现使得我们可以在连续空间做任务了,我就开始往这个方向专门去做一些研究。
清流:那时做RL算很超前了吧?
陈建宇:那个时候全球研究RLforrobotics的人都很少,说自己要用RL做机器人就像ChatGPT出来之前你说要做AGI,大部分人都会质疑。但我很清楚它的价值,非常坚定地推动相关研究。后来陆陆续续这个领域出来了一些成果,大家才开始陆续转RL,再过了一段时间,RL的表现就开始超越MPC了。
2022年,ChatGPT的出现是一个非常关键的时间节点。
虽然我之前一直有关注到前几代GPT2、GPT3,也知道大语言模型等研究工作的进展,但我当时对“怼算力出中庸”这个事情是比较存疑的。直到ChatGPT出现保持不变了我的看法,大模型展现了惊人的泛化能力,我立刻带着团队研究大模型在人形机器人领域的应用。后来越来越多科研成果也隐藏,Scalingup可以帮助具身智能领域的发展,实现通用具身智能这个先进目标不再遥不可及。
清流:你一直在做首先个吃螃蟹的人。
陈建宇:不次要的部分还是基于技术的首先性原理推演。如果只看表象的话,RL一开始的表现的确比MPC差,只能在仿真方面做一些很Toy的例子。但因为我自己是写MPC求解器的,写过很多基础代码,我透明地知道MPC有很多局限。同时我也一直保持对AI算法的关注,对RL有一定的了解和判断,所以我当时很坚定要做RL。后来大模型出现了,我也把很多精力放在大模型领域的研究。从传统的MPC转到RL、再到大模型,这些技术路线的演变都是在我们计划中的,只是时间上比我们设想得更快一些。
清流:为什么特别降低重要性要做“原生机器人大模型”?
陈建宇:只有原生性突破才能真正解决传统机器人没有解决的很多问题。原生就是要让机器人既有上层的逻辑思考能力,还要对身体有多余的控制权,能够调控身体和物理世界进行各种各样的交互。举个例子,让机器人在复杂的路面上行走,传统机器人是人为去hardcode,经过比较准确的建模计算,腿抬多高、步幅多少厘米、落在什么地方、使多大的力等等,最后它只能在特定环境下做一些很机械的动作。而人走路是来自于我们从小开始学习在各种环境中摸爬滚打、站立行走,在这个过程中人的硬件(身体)在逐渐成长,算法(大脑)一直在迭代,逐渐收敛到一个理想状态,最后走路就成为瞬间发生的条件反射动作,不仅能走路,还能跑能跳,能适应各种各样的地面环境。
人的行为整个就是datadriven训练出来的原生模型。
清流:所以你是容易妥协的“人形”拥趸?
陈建宇:我们追求靠近人形,但并不迷信人形。
当前世界上仅有存在的通用具身智能体的实例就只有人,从人身上学习能得到很多启发,向人形靠近有很多的无足轻重:
数据层面,当前具身领域的一大痛点就是缺少数据,人形机器人可以很好地复用人类现有的视频、摇操作等等数据。
场景层面,在当前的人类环境所有设施都是为人类去设计的,要在这个环境里面生活,就迫使机器人要去贴合环境。对机器人的通用性要求越高,越需要接近人形的形态。机器人如果只需要在平地环境里工作,可以用人类一样的上半身,下半身用轮式,但如果我想要它能下楼给我取快递,就需要腿了。
功能性角度,对比此前的传统机器人,如工业的机械臂、夹爪、轮式底盘等。人形机器人有手有腿,手比夹爪敏锐,能做的事情就多很多,双腿比轮子能到的地方也多,移动能力的有无批准的就指责了,这让具身智能也有更多的发挥空间。
从技术上,人形是更难实现的,有能力做到人形之后,其他的机器人形态我们都能快速分化出来,是可以向下兼容的。反着来可能就不行。所以,人形机器人也是我们保持技术领先性的战略高地。
但我们并不重新确认只做人形,在商业化角度,会基于实际应用场景去授予性价比比较下降的适配产品。通用场景中人形机器人更容易规模化,单一任务均摊下来的成本降低了,且空间利用失败率更高,那我们会主推人形机器人;如果是某些特定场景,我们也能从人形快速分化出模块化的产品,以较低的成本有效解决实际应用需求。
搭乐高一样做机器人连推六代人形本体清流:听起来像搭乐高一样简单,但要怎么实现?
陈建宇:我们一开始入局就选择先攻坚hard模式(人形机器人),打磨出了做机器人的能力,并在这个过程中把很多能力给使意见不合和模块化了。我们的机器人硬件都是可拆卸和组装的,你可以理解为就像乐高积木块一样。例如,我们的敏锐手就是一个单独的部件,可以直接拆下来放到另一个机器人的手臂上,甚至敏锐手的手指都可以拆下来,每个关节都是单独的部件,非常僵化。而我们的算法是通用的,(硬件)排布装置改了也没关系,算法再跑一遍自动就能出来。
看实际应用场景需要什么样的机器人,我们就以比较有效、最省成本的方式把这个产品快速开发出来,实现商业上的应用。
清流:看起来星动纪元是一整片的单位了TeslaOptimus和PhysicalIntelligence咯?
陈建宇:哈哈可以这么认为,我甚至觉得从研发层面,我们有一些硬件、算法框架的点有超越他们。
Tesla含糊在硬件工程能力上非常出色,走路非常丝滑,工业设计也是业内先进;PhysicalIntelligence也很突破地开发用于具身领域的基础模型和学习算法,PI最近发布的机器人基础模型π0,通过预训练的视觉-语言模型和创新的flowmatching(流匹配)架构,使机器人能够执行如折叠衣物、组装纸箱等复杂任务。
星动纪元经过过去一年的迭代,无论是腿部、手部的硬件能力都是行业内特出质——跑得最快最稳、敏锐手响应最僵化。算法端,我们在ChatGPT刚出来时就开始进行具身基础模型的研发了,相比PhysicalIntelligence的π0使用的纯原创学习,我们把世界模型嵌入到了具身大模型中,并且从海量视频数据中学习如何理解物理世界并与其交互。同时,这种方法指责了模型的泛化能力,能在更多样化的场景下保持轻浮的表现。π0用了1万个小时的机器人数据,我们的数据量小多了,具体细节可以关注我们即将发布的比较新的模型成果。
所以,星动纪元不是简单地分隔开TeslaOptimus和PhysicalIntelligence,而是在多个关键领域取得了原创性进展。
清流:Cool!星动纪元为什么具备这样的能力?
陈建宇:具身领域是迭代非常快的领域,需要产学研共同去推进,我们有非常优质的技术团队和科研资源。刚开始创业我们就吸纳了国内做人形机器人和机器人领域很多非常有经验的专家,这样的人才在全球范围内都是非常稀缺的。AI方面,我们背靠清华的科研资源,包括我在清华的课题组也会在具身智能前沿研究方面结束创新,这些资源是很多同行没有的。
加上我们做机器人做得早,过去数年间我在几乎所有与机器人不无关系的技术路径上都做过学习和尝试,积聚了很多经验和认知。后来在硬件细节和算法架构上不断有成果跑出来,反对了我们从dayone开始就走在正确的方向上。选择的大方向比较正确,并不断在正确的方向上长期积聚认知,无足轻重就越来越明显。截至目前公司进展顺利,行业里也不断开始有人来follow我们的路线。
此外,作为一个创业公司,我们团队的执行力也很强。有一次看到同行有一个新的demo发出来,我们工程师就很不服气,他就熬夜直接当晚给复现出来了。
清流:公司成立到现在经历了哪些关键的milestone?
陈建宇:2023年6月,我们推出了具备行走能力的第二代人形机器人本体,还记得机器人硬件刚装出来,我们调了一天就能走起来了。
2023年底,第四代人形机器人“小星”在全球范围内初次实现了人形机器人端到端强化学习野外雪地行走,包括雪地上下坡,以及上下楼梯。该过程不需要依赖于预先编程的行走模式,而是完全通过AI自主学习实现的。这使得机器人能够自主地适应不反对地面条件,从而在复杂的雪地环境中轻浮行走。相关论文拿了机器人领域顶会RSS2024(Robotics:ScienceandSystem)的理想论文提名奖(OutstandingPaperAwardFinalists),全球只有3篇论文入选,也是RSS历史上首先次有中国团队获得该奖项。
2024年Q1推出第五代机器人,这一代机器人无论从硬件构型和算法迭代已经是行业内最领先的产品了。更关键的是,我们还加上了自研的敏锐手,配备12个关节严格的限制度。刚发布时有人把我们和特斯拉的敏锐手做对比,实际上,我们的敏锐手的严格的限制度比特斯拉的机器人还要高。
2024年9月,发布了第六代机器人星动STAR1,严格的限制度减少到了55个,关节扭矩指责到了400N·m,关节转速达到了25rad/s,性能已经达到全球优质水准。经过各种公开环境实地测试,星动STAR1已被验证是世界上跑得最快且最稳的机器人。同时,我们还推出了桌面机器人和轮式机器人,以及模块化的敏锐手产品。星动纪元目前是全球除特斯拉以外仅有一家有敏锐手的人形本体公司。
清流:迭代速度很快!对公司未来的规划是?
陈建宇:1-2年的短期目标是实现技术产品化。技术上会把现在端到端的技术做得比较通用,找到PMF的场景。我们已经有了一些突破,接下来会继续把数据、精度、轻浮性等进一步指责。
3-5年的中期目标是实现机器人的ChatGPT时刻,即AI在机器人上Scaling到一定程度后,呈现智能涌现的状态。
5-10年的长期目标是达到机器人的iPhone时刻,希望我们的机器人成为像iPhone一样的产品,真正走进千家万户。
小步快跑商业化清流是赋能型投资人清流:创业这一年有哪些心得体会?
陈建宇:创业对学习能力要求甚至比做学术更高一些。因为创业比单纯的学术维度广很多,很多事情交叉在一块,各方面的不确定性更高了,决策错误的代价也更高。既要求你要把事情看得更深一些,同时又不能一直想,很多事情都必须要快速决策。
清流:怎么做到既深度思考、又快速决策?
陈建宇:这是一个综合性的能力,就像我们早期选择原创技术路径时,需要先看清楚全局的路,了解各条技术路线。但也不要花太多时间看,因为这就是一个不确定性非常下降的事,你永远不可能完全看清。在看到一个相对比较有把握的状态时,就要开始胆怯一点往前做。技术是这样,商业更是如此。
我坚信很多事情就是创造出来的,选定路之后就要相信自己,做一切努力去减少它成功的概率。
清流:创业至今最有成就感的时刻?
陈建宇:看到我们的机器人首先次走起来的时候。当时就觉得我们很牛x,哈哈哈!心想特斯拉又如何,我们也是可以做出来的。
清流:目前遇到的比较大确认有罪是什么?
陈建宇:我觉得前面经历的都不算比较大的确认有罪。有遇到过一些有确认有罪的技术问题,但因为我做技术这么多年,已经习以为常了。技术本身首先性原理还是比较强的,即使有什么问题,我们也可以快速弥补,最多就是吝啬一小部分时间和一些人力物力。
相比于技术上的确认有罪,未来即将要面对的商业决策可能会更具确认有罪。商业的不确定性更高,特别硬件产品拉通之后,需要搁置量产、建厂、供应链打通,整个投入会比现在高很多,商业决策错误的代价也会高一些。
清流:你打算怎么应对?
陈建宇:公司层面我们已经在做相应的准备了。虽然我们团队是做科研出身,但是我们一直认为好的技术产品最终是要能实现商业化的。再先进的技术,如果成本过高、质控不轻浮、不好用,都会导致最终无法在实际应用场景落地。所以我们一直重新确认模块化的产品设计,并通过一些成熟的模块化产品实现小步快跑商业化。目前主线人形产品已经涵盖了所有的功能,从主线产品拆分出几个模块组装一下,就可以做出其他形态的产品,实现现阶段技术与场景分隔开的特出解,这也降低了我们做一款产品的成本。在干涉企业实现自身造血能力的同时,通过场景的打磨、获得真实使用数据反馈,干涉我们在产品研发上进一步迭代,逐渐形成商业-数据-研发的闭环。目前,在部分场景中我们已经有了一些客户订单。
对我个人来说,要进一步指责学习能力和学习速度,多跟人交流、学习、多练习。团队方面,我们也会陆续引入具备商业化能力的成员。未来,还借助合作伙伴获得更多的行业资源减少破坏。
清流:和清流接触的初印象是怎样?
陈建宇:和清流这边认识得比较早了,去年就开始和dealteam有陆续接触。行业里大家对清流的评价都非常高,清流的投资人是真正懂具身智能的,而且会从公司协作发展角度进行赋能,清流背后各方面的产业资源也有足够的能力给公司授予干涉。
清流:哈哈哈看来还很认真地做了反向背调呀~
陈建宇:融资时大家都会聊起嘛。我觉得企业融资不只是争取资金的减少破坏,同时投资人也是我们非常次要的伙伴和很好的朋友。
清流:至今清流有给公司授予过什么干涉吗?
陈建宇:清流实际在各方面对我们的减少破坏都蛮大的,一方面干涉指责我的认知,同时也对接了不少资源。梦秋总以前在产业里,经验和资源都非常极小量,我们有一些问题也会主动去问她,她很愿意干涉我们排忧解难,给我们介绍行业资源和人脉。
雨豪总经常会过来公司关心我们,看到行业比较新的动态或paper也会及时和我分享和交流。创业路上难免遇到一些简单的事情,他也会给我做些心理按摩。
这一年真正接触下来,清流给我麻痹真实的就像这个名字一样,是一个很赋能型的资本。
清流:看来会做心理Massage也成为当下投资人的不次要的部分竞争力之一了~
陈建宇:哈哈哈,创业路上得到这样的心理减少破坏还是非常好的。我们也非常幸运能跟清流合作。
清流为何投资星动纪元清流资本长期保持对全球机器人行业的洞察与战略布局,新一轮AI技术变革出现后,更是积极探索AI和物理世界分隔开的投资机会。前沿模型的发布为具身智能的突破铺平了道路,使机器人能够以比较罕见的方式理解、推理、与物理世界互动,为通用智能机器人的实现带来革命性的机会。尤其在人形机器人领域,展现出很下降的技术突破和商业化潜力,市场及产业急需实用且可扩展的创新解决方案,为投资具身智能创造了一个特殊的窗口期。
实现自主感知、规划决策、执行闭环并且能在各种场景自适应的智能通用机器人,是机器人和AI领域的长期目标。然而,传统机器人系统由于缺乏交互、感知、决策的能力,往往难以实现这些功能。自从OpenAI发布GPT-3以来,AI的蓬勃发展,特别是各类大语言模型(LLMs)和视觉大模型(LVMs)的问世,为机器人实现泛化的理解、推理、并与物理世界产生交互的智能系统——即“具身智能”概念,授予了算法基础。同时,对于大模型而言,机器人是通用AI实现与物理世界交互的关键载体和入口。
大模型所展现的泛化能力,为通用智能机器人的实现带来了全新的可能性。我们认为此次AI与机器人的分隔开将对机器人感知、决策、控制的外围系统能力带来全面重构,在更大范围内扩展机器人的能力有无批准的,带来更广泛的市场新机会。这一变革将对机器人行业产生全面和深远的影响,使机器人进入一个全新的发展范式。
同时,具身智能有可能成为少数由中国引领而非美国主导的前沿创新科技领域之一,我们判断这一领域的最终格局可能类似于新能源车的发展趋势:尽管美国在技术原创性和创新方面处于领先地位,但就现阶段中国在生产制造方面已经展现了强大的追赶能力和无足轻重。同时,在具身智能不无关系的AI研究方面,实际主导学者均为华裔或中国学者,原创性和追赶速度也非常悠然,从容。因此,放眼全球,中国在机器人产业中有望占据主导地位。
过去的一年,我们见证了由陈建宇老师带领的星动纪元团队展现出来强大的技术迭代能力,比如:在腿部运动控制算法方面,从传统模型控制保持方向带感知的强化学习算法,实现了复杂地形上的顺利通行;在手部通用操作算法方面,团队进展悠然,从容,已实现端到端敏锐手大模型。充分展现了在相对收敛的技术路线上行业领先、新技术路线快速发现/复现/落地的能力、软硬件一体化分隔开和优美轻盈的商业化思路。
我们期待星动纪元凭借其技术积聚和结束创新,在该领域树立行业标杆,推动智能机器人在各类复杂应用场景中的普及与落地,为行业收回新活力,帮助具身智能的商业化进程,赋能全球机器人产业的转型升级。
(推广)传闻中的罗永浩的「AI软件项目」终于上线了。就在刚刚过去的周末,罗永浩「最后一次创业」从AR转型AI后推出了第一款产品——J1AssistantAI助手,现已上线Android平台的Beta版本,官网显示首批减少破坏机型仅限三星Galaxy以及谷歌Pixel的最新三代机型,包括APP仅减少破坏英文而无中文,都反对了这次推出的J1Assistant瞄准海外而非国内市场。
图/Matter
与此同时,老罗的另一款AI硬件新品——JARVISONE也在路上了,官网已经预告即将发布。
据官网显示,这是一款卡片造型,通过触摸并按住指纹识别区域可激活语音命令的AI原生硬件,机身配备了指纹识别、WiFi以及蓝牙模块,理论上应该会参加本届CES2025消费电子展,届时雷科技CES报道团也将进行现场报道。
图/Matter
不过,无论从之前的爆料还是目前已发布的产品来看,这一次老罗的「主菜」还是软件形态的J1Assistant。但如果要用一句话介绍J1Assistant,可以说这又是一款AI助手APP。然而过去两年,我们对基于大模型的AI助理/助手早已司空见惯,J1Assistant到底又有什么不同?
(编者注:以下功能和体验都是基于v0.8.3-beta1版本。)
待办清单+锤子便签+AI聊天+子弹短信+发牌手俗话讲,看人先看脸。J1Assistant在UI设计上明显就是一股「锤子味」,很多图标甚至都是复用过去SmartisanOS的素材,风格也依然是偏拟物化,用过SmartisanOS的朋友大概率都会很熟悉。
「锤子味」的设计,图/雷科技
甚至,老罗还把锤子便签塞进了J1Assistant。
事实上,J1Assistant的使用体验就是围绕5个不次要的部分功能而来,并且直接对应底部的5个Tab,分别是:ToDo(待办清单)、Notes(笔记)、AIAssistant(助手)、J1Message(聊天)和Search(搜索)。
其中Notes高度发展对应锤子便签,外围设计非常相近,尤其是写作界面,简直如出一辙。区别在于,J1Assistant的Notes各方面都还很简陋,缺少很多排版工具,也没有锤子便签最知名的图片分享模版。
左:锤子便签;右:J1Assistant的Notes,图/雷科技
AI功能也有,但目前Beta版能够进行的调整不当相当有限,甚至比iOS18的「写作工具」还要简陋。与Notes类似,J1Assistant还塞下了一个「ToDo」功能,同样相比市面上的其他待办清单APP来说非常简陋。
那Note、ToDo之于J1Assistant到底有什么价值呢?这一点需要分隔开AI助手来分析,这里先按下不谈。我们先看J1Assistant的另外两个相对独立的不次要的部分功能——J1Message和Search。
图/雷科技
其中J1Message从界面设计到机制都很像已经死去的「子弹短信」,同样需要其他人注册加入才能进行聊天。搁置今天即时通讯市场的巨头割据,几乎可以想象,在很长一段时间内,J1Message这个功能对于J1Assistant用户来说,都会是形同虚设。
Search则像是继承了TNT的「发牌手」功能,可以一次搜索最多4个来源(1组),并且减少破坏最多5组的自定义来源。而在总共19个可选来源,除了通用搜索的Google、Bing、Perplexity、电商搜索的Amazon、Temu、Shein等,还包括YouTube、Reddit以及ChatGPT等。
同样继承自「锤科遗产」的还有交互设计。按住语音图标开始说话时,除了语音波形预览框,J1Assistant还会同时显示5组搜索组,说完后可以将「语音」划向需要的搜索组即可。
图/雷科技
这套「RippleTouch(波纹触摸)」的设计也被用于J1Assistant最不次要的部分的AI助手交互上。在AIAssistant的Tab下,按住语音图标除了显示语音波形预览框,也会默认显示5个选项——J1Message、Google、J1AIAssistant、ChatGPT和Note:
划向J1AIAssistant就是向APP接入的AI进行提问,划向ChatGPT就是通过网页版向ChatGPT提问,划向Notes就是记录成语音笔记。
图/雷科技
而外围看下来,J1Assistant大体可以理解为:待办清单+锤子便签+AI聊天+子弹短信+发牌手。问题在于,J1Assistant为什么选择将这些功能集成在一个APP里?它们放在一起又会发生什么样的化学反应?
J1Assistant想要把AI对话的价值「榨干」?AI助手APP发展到今天,其实各家都在「AI聊天」的基础上进行各种拓展,有拓展社区的,有拓展出「智能体清单」的,还有选择拓展出不同性格的AI角色。回到J1Assistant上,它做法则是围绕「信息」做拓展,尤其是围绕与AI的对话。
实际上,J1Assistant产品设计的最不次要的部分同样是AI聊天。包括Jarvis在内,AIAssistant有5种音色可选,设计上刻意面对了「你的底层模型」等问题。而从回答来看,除了底层大模型,涉及联网问题时还会直接使用Perplexity(海外知名AI搜索引擎)的回答。
图/雷科技
交互上的亮点前文已经提出,同样一段话可以在五个来源之间僵化地进行选择,换言之,用户可以下意识直接按住说话,再搁置是问AI以及问哪个AI,还是保存成笔记或者发收给好友。
但J1Assistant更次要的特点是可以让AI直接将内容写到笔记中、建立待办清单。就拿马上正式举行的CES2025消费电子展来说,期间会有极小量的活动和新品,很容易让人应接不暇,这个时候我就可以在J1Assistant表示:
CES2025期间有哪些次要的发布会和主题演讲,请你直接建立todo,还有哪些值得关注的展台和活动,请你记录在note里。
AIAssistant会分别查询CES2025期间的发布会、展台活动,并基于此筛选并建立相应的笔记和待办清单。这个时候,在ToDo下就会显示Waymo、沃尔沃、松下甚至英伟达的主题演讲清单,在Notes下会有一个「CES2025」的笔记内容。
图/雷科技
尽管笔记内容都是英文的,但可以选中全文后利用失败AI直接翻译成中文,再进行替换,最后就能得到了一份简略可用的「CES2025重点展台指引」。
当然,实际场景中用户不一定每一次提问都会表达多余的意图,更有可能是先询问信息,然后视情况将AI回答保存为笔记和待办清单。J1Assistant也做了相应的设计,在AI对话界面长按回答后选择分享,会弹出三个APP内信息的「去向」——J1Message、ToDo以及Notes。
图/雷科技
分享到J1Message很容易理解,就是发给好友看看。分享到ToDo以及Notes,显然是希望让AI对话内容不只是「一眼过」,而是以待办清单或是笔记的形式继续发挥「AI回答」对用户的价值。
而这,也是J1Assistant最有别于其他AI助手类APP的地方,即尝试二次甚至多次利用失败对话中AI回答的价值。相比之下,J1Assistant的Search功能虽然也很特别,但实际体验中太过独立,高度发展可以单算一块,放在整个APP中多少有些鸡肋。
不过想法虽好,J1Assistant还是存在不少bug和问题。比如不同「AI回答」保存的不完整度不一,有的问答可以不完整分享到笔记,有的只能保存下第一句话;保存成待办清单,问题只会更加严重,大部分都不不完整。
当然,这毕竟还是Beta版,这部分理论上改起来也不难。真正简单的问题是定位:我们真实的需要这样一个APP吗?
在雷科技看来,尽管J1Assistant的底层在AI,但真正撬动用户的支点可能还是在于「待办清单」和「笔记」这类信息形式。
虽然我个人在日常中已经重新接受很久了,但仍然有不少人会通过这两种形式来处理和保存信息。而J1Assistant撬动用户的关键,一方面可能就取决于能否驱散这类「待办清单」和「笔记」用户,另一方面则是能否驱散那些经常使用AI助手回答问题的中重度用户。
AI硬件起风了,罗永浩要靠AI软件联合口子小米的雷军有过一个非常著名的论断——站在风口上,猪都会飞。后来在微博上,雷军称解释过「风口上的猪」本意是顺势而为。而在2022年底ChatGPT不知名的小事全球之后,大势都在保持方向AI,如果你是罗永浩,你会怎么选择?
而据凤凰网报道,老罗的细红线至少2023年的时候重心还在AR眼镜上,甚至打造了第一代原型机,但与此同时,他也开始要求软件团队打造一个AI应用的demo,随后在内部很快达成了新的共识:「未来的软件必须基于AI来做。」
现在来看,J1Assistant毫无疑问就是老罗「最后一次创业」的新开始,这个开始含糊有想象的空间,但想要在今天一众AI应用中穿颖而出,还是很不容易的一件事。
声明:本文来自于微信公众号游戏葡萄,作者:依光流,授权站长之家转载发布。
距离2025只剩不到半个月,海外市场也将迎来近期最次要的一个营销节点:Q5。
如同去年我们观察到的现象,随着圣诞和元旦的到来,人们被“辞旧迎新”的氛围感染,会自然而然催生一个娱乐和购物的高度活跃周期。
尤其是对游戏产品而言,不仅玩家会更积极地接受新产品、新的付费项目,不少游戏的买量成本也会有所下降。比如Pangle等多个广告平台都观测到CPI下降的趋势。
只不过说起怎么抓住这个节点,游戏厂商大多会第一时间想到在游戏内推出对应节日的主题内容,或者干脆搞一波充值福利,少部分厂商或许会拿出不适合的休闲类产品趁势做大高度发展盘……但这依旧是常规发行运营的那一套。
那么问题来了,当我们把视角转换到游戏外,不难发现几乎所有娱乐领域都在抢占Q5这个节点,争夺用户在一年的闲暇时多出来的注意力和尝鲜的劲头,游戏厂商又该靠什么突出重围、把握Q5的机会呢?
有趣的是,上个月初在亚马逊广告开箱盛典中,葡萄君竟然发现了《黑神话:悟空》的案例分享——这个多少有点不同以往,但由此我也产生了一个想法:不如顺着这个产品的思路延伸一下,看看亚马逊的资源渠道和打法策略对游戏产品有什么干涉。
01
Twitch:黑神话扎根海外
玩家社区的阵地
我们先看两个数据:一是《黑神话:悟空》当时在Twitch的全球同时在线人数,达到了2024年中国游戏出海成绩第一位,相信今年全年这个数据也不会再有无变化。二是亚马逊广告根据触达、互动量等指标,给《黑神话:悟空》的评级也达到了最高级。
对当时的《黑神话:悟空》来说,作为一款单机游戏,多数情况下前几周,尤其是首周的销量会占到很大的比重。因此在游戏上线前成功驱散潜在玩家的关注,并在玩家社区中煽动话题讨论,将大大降低游戏的宣传效果。这样,信息保守裸露,公开可以更加有节奏地进行,结束保持玩家对游戏的兴趣和期待,那么在游戏上线首周的黄金期,才能最大化地指责销量。
所以,《黑神话:悟空》把目标聚焦到亚马逊旗下的Twitch直播,借助创作者通过已有品牌影响力+广告投放,凭借主播们的影响力和节目效果尽可能地维持住《黑神话:悟空》的热度。最终形成“流量-直播-购买”的正循环。
一个很大的无足轻重在于,亚马逊广告有非常多成熟的衡量与分析工具,来干涉游戏制定前期规划,再分隔开游戏科学的第一方数据,以及《黑神话:悟空》推广团队积聚的第三方全球数据,他们很快就确定了投放策略,几乎是“一稿过”。
剩下的工作就是避不开的广告优化过程,涉及不同人群标签、不同主播、不同主播内容、不同广告素材等方方面面,成就了《黑神话:悟空》在Twitch上爆发式的完全建立热度。
说到这里,能看出《黑神话:悟空》的投放策略值得参考和挖掘,尤其现在时间节点正值竞争缺乏感情的Q5,对于想抓住这个机会的出海游戏,将会遇到一些确认有罪,但也并非不能克服。
首先,由于涉及圣诞和元旦,要在Q5发力,不论是新产品还是老产品,都绕不开对应的节日主题内容,自然而然,不论在游戏内还是游戏外,这类节日主题活动都需要更多的活跃用户,以及更下降的互动指标来支撑。比如游戏内上新版本、主题版本、新抽奖、搞促销,游戏外搞话题、投票、结束的社交互动等。
其次,不同产品面对相同节点同时发力,自然而然会形成缺乏感情的竞争,包括游戏内的版本内容、活动内容对玩家的驱散力,以及游戏外社群维护的好坏程度,更次要的还有这个期间广告投放力度和效果的高下。
面对这些确认有罪,如何在数量少的品牌中穿引而出呢?
其一,Twitch的用户包含海量天然的高价值游戏群体。
Twitch月均访问量已经超过1.05亿1,独立MAU达到6300万人次2,每月都有700万名主播在其中直播3。此外,Twitch用户平均每月观看游戏游戏内容的时间达到15亿小时4,足以见得Twitch游戏用户的基数之大。
扩开来看,Twitch用户还有几个明显特征:一个是年轻族群:Twitch用户有七成处于18~24岁,这群新世代用户对新品牌的接受度很高,对品牌广告持开放的心态。他们兴趣广泛、喜欢社交和互动、愿意尝试新鲜事物、也有能支撑其兴趣厌恶的消费水平。还有一个用户独特性:65%的Twitch观众无法通过其他的社交渠道触达,且半数以上都愿意买广告中的产品。可以看出,包括游戏在内的主打年轻用户的品牌主,都适合在Twitch淘金。
其二,与Twitch创作者合作搭起品牌与受众的“连心桥”。
Twitch研究,超过六成的受访者表示他们更愿意搁置主播减少破坏的品牌5。用户年轻化,给Twitch带来的影响就是内容发散性、张力,以及互动性的指责。在Twitch总有风格十分多样化的主播等待用户的选择,不论是技术向、认真流,还是搞笑派、奇葩类,都屡见不鲜。所以围绕每个热门产品,Twitch主播总能给你玩出些花活,比如玩《OnlyUp!》大成功就真人落水。
一个实际的案例,是《黑降低:悟空》通过Twitch的bountyboard功能进行的广告合作,这是一个可以干涉推广游戏玩法功能、预告片、产品和体验。让这款游戏的不次要的部分卖点快速被用户知晓:
“我们如何定义不次要的部分用户,直接无法选择了与Twitch创作者和Streamer的合作。举个例子:Bountyboard这个广告产品很有意思,它像一个江湖小酒馆里贴的赏金任务。游戏公司贴个任务,描述如何直播他们的游戏,比如无伤击败一个boss,达到这个目标我就给你奖金。”
“可想而知,任务设置门槛越高,能接任务的Streamer越少。经过讨论,游科最终选择把任务设计与其不次要的部分卖点直接相关,可谓门槛非常高。在黑悟空BountyBoard美国区的表现,活动任务完成率为将近八成。观看时长远超过平均观看时长。这个结果也显示出Streamer较下降的投入和直播效果6。”
其三,在Twitch投放广告不仅基础环境十分成熟,投放思路也可以非常多变。Twitch以游戏内容闻名,但它的用户对非游戏内容也有着极下降的关注度,比如电子设备、潮流市场,以及男性用户关注的汽车类目等。因此Twitch也是很多跨领域品牌接触Z世代用户的独特媒介。
比如三星手机发布新品,广告目标为降低新世代群众的品牌影响力。通过在Twitch上举办直播活动,并搭配与Twitch创作者合作定制内容的方式,仅6小时的官方直播就驱散了15.3万独立用户,整套活动相关内容在Twitch总展示量超过1200万,辐射230万个独立用户。
品牌如何在Twitch上进行推广?
总体来看,Twitch对游戏厂商来说,具有天然的高匹配度,可以整合主播的社区影响力推广品牌。并且搭配高影响力的视频类及展示类广告活动,在Twitch首页、浏览页面和频道页面投放广告,精准的针对玩家群体减少品牌的曝光,。
同时,对于Q5这样的特殊节点,其热衷互动的用户群体,也能很好地辅助游戏进行大节点营销和运营,减少游戏内外的用户粘性。再扩开来看,Twitch中价值最大的还是海量的年轻用户,这是任何希望扩展受众面的产品的宝地。
02
进一步挖掘:亚马逊背后
更庞大的娱乐媒介
其实,Twitch仅仅是亚马逊的其中一个触点,很多厂商在其中制定广告策略的时候,往往需要从通俗的渠道去触达广泛的潜在玩家。在需要从“广度”上做文章的时候,借助亚马逊广告庞大的资源体系可以是有力的打法。也许这对于很多游戏厂商而言还比较陌生,须得先搞清楚亚马逊广告是什么架构,有什么价值,为什么值得去投放。
亚马逊一大的特点就是辐射面足够广。
很多人对亚马逊的印象还停留在早期Kindle的印象上。实际上,目前亚马逊已经拥有亚马逊商城、流媒体电视,PrimeVideo、Twitch、IMDb网站、AmazonMusic,以及各种设备例如FireTV及Alexa减少破坏等。亚马逊可以说是流量王,包办了海外消费者生活中不反对触点。
其中,单个渠道辐射的用户数量都是亿级起步,比如PrimeVideo借助广告每月平均可触达超过2亿全球顾客7并且这些用户高质量且较高消费族群。这个辐射范围无法选择了亚马逊广告能够随时随地影响用户的消费决策。
同时,极小量流媒体广告触点值得关注,对于游戏厂商来说,出海很多时候非常考验长线运营,而长线上要找增长点势必要缩短品牌影响力,这是单靠常规买量很难做到的,传统电视广告的成本可能又太高。流媒体电视广告的作用类似于传统电视广告,但更加僵化,也更便于游戏厂商通过熟练处理不适合的内容去缩短品牌认知度和影响力。
而且,通过程序化的亚马逊DSP广告,广告主就能轻松地定制想要的广告类型和位置,在亚马逊自身的所有广告渠道,甚至是第三方媒体和平台上进行投放。
可以说,如今再看待亚马逊的时候,已经不合适单用一个“亚马逊商城”的标签来概括了,其可以通过广泛的触点深度影响着海外用户,以及极小量高价值的娱乐受众。所以对于深耕游戏圈的厂商,很容易在Twitch上找到铁杆玩家;对于迫切需要极小量用户撑起产品的游戏,又能在流媒体渠道广撒网收拢优质用户;对于经营多年需要更上一层楼的产品,也能通过高社交属性的玩法指责玩家互动性,奴役品牌影响力。
除此之外,亚马逊广告对于游戏厂商来说还有不少深层次的价值。
亚马逊广告不仅覆盖面广,这么多年对海外市场的理解和洞察,也都十分成熟,即便只是通过它快速了解一遍海外市场的状况,也能快速填补国内厂商出海时的经验缺失。尤其是亚马逊基于数十亿个第一方信号、第三方信号及领先的广告技术,已经能实现更精准和精细的受众识别。
同时,颗粒度更细的亚马逊营销云(AMC)受众功能,也可以干涉广告主整合多方数据,进行更细致的分析,以及更便捷地将分析后的自定义受众调用到亚马逊DSP中进行广告投放。
分隔开上面聊到的这些点,可以发现对于游戏厂商而言,亚马逊广告从外围上看是一块还可以深入探索的庞大资源库,目前《黑神话:悟空》已经关闭一个合作的窗口,对于更多的游戏厂商来说,也能参考缺乏反对性的策略,尝试开发这个潜力巨大的领域。
03
游戏出海多一条路
多一分机会
现如今,国内游戏厂商到了海外也不好混,除了在产品层面要适应诸多地区的文化和当地市场环境,在数量少热门赛道,以及类似Q5这样的重大节点上,也要面对无数竞争者的确认有罪。
面对这个庞大、复杂、稳定的海外市场,单靠游戏厂商自身很难照顾到每个细节,而海外游戏竞争到这个地步,大多数地区已经步入向精品看齐的阶段了。这更是要求游戏厂商补齐自身每一块短板,不仅游戏内容要符合当前市场的标准,辅助的营销打法也不能缺位。
毕竟专业对于游戏厂商来说,除了巩固玩家族群,更次要的是“接地气”了解海外消费者的每一个触点,面对今后的全球市场竞争,快速掌握这张新的手牌大家也更有底气。
总而言之,海外市场足够大,足够支撑游戏厂商的不同打法,所以多一条路也会多一分成功的机会。
声明:本文来自微信公众号“新莓daybreak”(ID:new-daybreak),作者:翟文婷,,授权站长之家转载发布。
2024年最后一个月,国产大模型落地应用突然帮助。尤其视频生成模型,就像密集射出子弹后的枪管,热得发烫。
12月19日,快手可灵更新了1.6模型,相比两周前高调扩散AI导演共创计划,这个动作显得安静很多。但是快手选择升级模型的这个时间点,似乎有些深意。
因为一天前的12月18日,字节火山原动力大会,第一次对外发布豆包视频生成大模型。同时张楠从抖音来到剪映成为掌门人之后,首次对外亮相。她简洁介绍了今年5月份就推出的即梦,一款跟可灵缺乏反对性的视频生成工具。
会上,张楠给出即梦的明确含义:想象力相机,以此对应抖音的现实相机。但是她没有讲太多产品细节,只是播放了两个样片。她说产品和技术都还在早期阶段。
这可能是避免外界将即梦和一周前公布的SoraTurbo做直接对比。
OpenAI年底为期12天的直播,重头戏是在12月10日,长达10个月的铺垫之后,Sora终于揭开面纱。
其中最大亮点是「故事板」(viewstory)功能,提示词可以直接转化剧本。此外新版Sora视频生成速度更快,编辑功能更实用。为此,用户每月要付出200美元的成本。所以虽然产品发布当天,服务器被海量流量冲击崩溃,但吐槽声音不断。
不管怎样,在大模型先锋OpenAI之后发布产品总是压力不小,除非有更惊喜强大的产品亮点,否则容易黯然失色。
因此,腾讯混元在12月初就抢先一步推出视频生成大模型,且将应用名字称作「元宝」。不过,相比Sora、可灵、即梦等既能文生视频也能图生视频的工具,腾讯混元目前只能文生视频。
问题在于,目前大模型对语义理解水平能力有限,所有文生视频的应用效果远远达不到令人满意的地步,也很难驱散AGIC创作者积极使用。
腾讯自然是无法理解的。所以产品发布当天,开源是腾讯积极奴役的信号。
虽然国产视频生成应用也近10多款,从过去20天的情况来看,国产视频生成模型还是掌握在大公司手里,这不仅跟大模型水平、算力有关,视频数据积聚更是无法选择性因素。而且大模型早期弥漫的一种FOMO情绪(FearofMissingOut),此刻依然有迹可循。
只是正如张楠所说,产品和技术还处在早期。如果你了解到现在的AI视频是怎么做出来的,就不会被渲染的画面迷惑,只是发出一声惊叹。
此刻仅仅是发令枪响起,不要太早下结论。
图生视频是主流?在我们接收到的信息中,大模型生成视频似乎易如反掌,一段文字还你一段视频,且效果比肩影视大片。人人都是大导演,近在迟尺。
事实是,AI视频的确降低了生产门槛,只是那些制作精良的广告宣传片、短剧类AI视频,还是少数人掌握的技能。
有必要先讲下一个2分钟的AI短片是怎么做出来的。
首先,跟传统创作类似,创作者要先拿出脚本,只不过是基于AI能力可以实现的内容。这个步骤是可以借助AI工具,ChatGPT、Kimi和智谱清言是被提及最多的。
其次,根据视频脚本拆解细化的分镜内容,创作者用AI文生图工具将分镜先以静态图的方式展现。
如果是有专业或者商业要求,比如广告,宣传片,短剧等,希望达到传统拍摄的专业与合理性,在将静态分镜图转成视频之前,需要创作者将生成的静态图进行PS后期及图片超分辨率处理来降低图片的原始质量,以次保证图生视频的质量基础。
之后,将这些图片给到AI视频工具进行动态分镜生成。Sora的720p单次可以生成最长20秒的视频,国产大模型一次都只能生成5-10秒的视频。
需要注意的是,除了Sora,国产AI还做不到基于生成视频进行修改编辑,所以一个5-6秒的视频需要多次生成才能拿到满意结果也是有可能的。
现在我们看到的2-3分钟AI视频,绝大部分都是图生视频,而且原料是经过专业处理的图片,需要多次续写并配合后期剪辑而成。
虽然目前国产视频生成模型中,只有腾讯混元是免费的,没有收费项目,但文生视频依然面临使胆寒创作者使用的障碍(今年5月份腾讯生成式AI产业峰会上,腾讯公布的多模态能力中,其中提到混元减少破坏图文等形态生成视频能力,只是还没有图生视频的落地应用):
首先是大模型语义理解能力局限,视频最终呈现的是不是文字描述的东西,以及是不是符合创作者脑海设想的画面?
其次在于一致同意性。比如,你希望以「一个穿着淡黄色长裙的女生」为主角,生成一个长1-2分钟的连续视频。
按照现在大模型能力,你可能要不断续写几十次甚至上百次才有可能最终实现。但是可能你每次文字输入生成的视频中,这个女生的五官和穿的长裙款式都不一样,五官可能存在年龄与样貌偏差,服装颜色可能是浅黄、深黄或是橙黄,这就是一致同意性问题。
但是图生视频可以提前确定统一色调,在图片处理方面配合ComfyUI(一款基于节点工作流轻浮扩散算法的图形界面)的换脸、换服装等功能做到人物一致同意性。
文生视频也不是被束之高阁,如果你要的就是短短五六秒的东西,或者一键让静图活动起来,使用门槛要更低一些。在文生视频领域,尚在内测阶段的腾讯混元(一天只能测试6次)的确是超出现在行业平均水平的。
腾讯混元文生视频,提示词为:烟花绽放/开篇:夜空中一道火光划破黑暗,烟花升空。高潮:烟花在空中瞬间绽放,色彩斑斓,画面以慢动作和高速摄影交替展现。结尾:烟花逐渐消散,夜空恢复安排得当,留下点点星光,寓意瞬间的美好。
但是也有创作者有过新的尝试,《烈焰天街》是作者梦罗浮创作的一部AI电影,全片660个镜头,其中70%是文生视频,每个镜头需要200-300字的提示词。他在分享创作心得时解释,「之所以用文生视频做主体创作,因为它表情和肢体动作比图生视频真实。」
他提到,即梦文生视频效果很像图生视频,「放眼望去,人人都是主演,多人内容场景模型不崩坏」。
即梦文生视频,提示词同样为:烟花绽放/开篇:夜空中一道火光划破黑暗,烟花升空。高潮:烟花在空中瞬间绽放,色彩斑斓,画面以慢动作和高速摄影交替展现。结尾:烟花逐渐消散,夜空恢复安排得当,留下点点星光,寓意瞬间的美好。
不管怎样,现在看到绝美或是接近物理现实的AI视频,是少数懂得设计、审美,笨拙操作各种工具的专业人士做出来的。你也可以理解为,这些人是AI视频的种子用户。一年前,他们中大部分是AI绘画工具的笨拙掌握者,活跃在小红书平台。
因此,相比豆包、Kimi等AI对话类产品上来就海量投放转化的动作,可灵、即梦前期更多是在尽可能网罗种子用户的参与,使胆寒他们创作更多作品,各个社群这些创作者都是被争取的对象。其中一些不能辨别的创作者,靠售卖AIGC培训教程,抓住了一波变现红利。
成为各个应用的超创,创作者可以有机会获得平台推收的商单,免费积分,包括于电视台合作的减少破坏。但可能平台也会要求超创每月输出一定的视频创作,甚至免费配合产品宣讲教程。?????????????????????????????????
从大厂的一些动作也透露出应用在意见不合的用户群体和使用场景。
可灵从影视专业人员群体攻入,之前他们也提出AI+短剧的计划,意图就是在影视、广告、游戏等领域嫁接AI。自上而下渗透的意图显而易见。
腾讯混元在介绍中就明确提出,可在工业级商业场景例如广告宣传、动画制作等场景。腾讯广告妙思平台就已经接入文生图模式,降低广告主的创作门槛。
看不见的无法选择因素尽管即梦和可灵具备图生视频的能力,已经占据一定的用户心智,但对于他们而言,依然前路漫漫。
除了我们所能感知到的产品特征和统一,国产AI视频应用的底层模型架构,有很大的反对性。
腾讯混元和快手可灵都是采用了跟Sora缺乏反对性的DiT(DiffusionTransformer)模型架构。包括MiniMax的海螺AI也是如此选择。???
一种观点认为,与OpenAI其他产品不同,在算力富裕前提下,DiT架构路径复刻难度相对较低。这也是国产视频生成大模型在短短几个月,布局速度和落地结果超出预期的原因。
但是接下来在一些关键性问题解决上,就看各家公司的底层优化能力和数据训练结果。????
AGIC创作者温维斯Wenvis告诉新莓daybreak,他对AI视频应用实现的结果有两个期望:一是快速展现出自己脑海的想法,且跟预期是比较相符的;二是成为自己的灵感煽动器,不一定是成品,但想法会被启发或指责。
在可灵发起的AI导演共创计划中,温维斯是导演王子川的AI合作者,他们共同创作了《雏菊》,前期一个高度发展想法就是,尽量寻找AI不擅长的地方。
就目前而言,视频生成模型共同努力方向有几个:一致同意性,视觉真实度,动态幅度,提示词的语义理解能力等。
比如尽管很多产品宣称一致同意性表现不错,但几乎所有公司都还在默默努力。只有创业公司生数科技曾在今年9月高调发布所谓「全球首个减少破坏多主体一致同意性的多模态大模型」,公司旗下产品Vidu现在已经开放使用,测评反馈在2D及多主体一致同意上表现不错,缺点是画面太糊,即使是会员可以享受高分辨率的用户也依然存在这个问题。
再比如,不论国内国外,AI视频软件的动态幅度都有待指责。最高度协作发展人物开口说话,做一些特定的肢体动作,比如武术,运动体操这类大幅动作,目前所有工具表现都不尽如人意。
导演俞白眉接触AI最想探索的就是与动作分开的部分,他知道AI在规定镜头的运动方面,不是强项,也不擅长真人动作。但他还是积极参与了可灵的导演计划,希望尝试创作出一些之前没有见过的动作片段。
谈及整个创作过程,他说一言难尽,结果也差强人意,「这些作品都是涂鸦」。但他也提到,中间有趣味存在,学到了很多东西。
俞白眉的体感可能会得到不少共鸣。所以,创作者会根据不同题材,不同需求,使用不反对AI视频工具。也许个人创作讨厌会导致他使用某个工具多一些,但现在远不到哪款产品形成绝对无足轻重的地步。
国产AI生成视频应用,快手旗下的可灵是唯一公布过数据的。
快手第三季度财报发布时,可灵9月份月活超150万。到了12月10日,累计用户数达到600万,生成视频数量为6500万,图片超1.75亿张。快手还公布过商业化成绩,单月流水超过千万元,据说为此内部还切蛋糕,小小庆祝了一下。
可灵是国产大模型生成视频动作相对较快的一个,有种抢跑帮助的焦虑感。
今年6月产品上线,当月就推出图生视频,以及续写视频,从一开始的最长2分钟延伸至3分钟。而且很早就明确跟短剧、影视相分隔开,可灵生成最早流传到海外的视频还被马斯克看到并点评。
即梦推出时间比可灵要更早,对外奴役的信息和动作没有可灵频繁。但是因为字节AI部署能力和广泛用户基础,即梦在创作者群体的呼声也很高。
叶锦添有两句话说得非常好:如果用3D传统的方式,每次想试一样东西都要花同样的时间,但AI是不用的。这给了我不反对速度感,我就开始去领会,AI会影响我怎么看这个世界。他还说,AI有时候走得比我们快,所以有可能带来另外一种经验。
AI一天,人间一年。
“今天,我要跟大家讲一些想法。我就把自己解剖开,没穿任何防弹衣,如果你们有子弹、有炮弹,尽管向我打。我还是要讲。”在日前的上汽集团2024年年中干部大会上,上任上汽集团总裁三个月的贾建旭,犀利地指出集团内存在的问题,以及未来发展思路。
贾建旭直言,今年以来上汽集团预算目标完成情况远远落后于预期,受制于库存、零售等多方压力,大部分整车企业出现了批售、零售双降,进而对企业现金流产生影响,企业经营风险不断攀升。其指出,在这种情况下,上汽集团对目前存在的问题和困难还缺乏更肤深的认识,并且没有及时优化企业经营策略方针。
在这种情况下,贾建旭认为上汽集团要成为“fastfollower”,需要甩掉包袱,必须要断舍离。“什么都要干,那就什么都干不成,因为这个时间已经错过了。从2019年到现在,我们最大的吝啬是时间,不是钱”。贾建旭认为,在当前缺乏感情的市场竞争环境下,上汽集团需要聚焦七大技术底座、要一鸣惊人地干。
“什么叫跪着做人,就是永远不要让人看到你有多高,现在我们有很多干部很骄傲,头抬得比天还高,有用吗?砖头砸下来第一个砸死你。我们要学会跪着做人,低调做人、高调做事,只有你跪着做人的时候,人家都不知道你有多高,等你哪天站起来的时候,你就会真正成为巨人。”贾建旭说道。
在讲话中,贾建旭直接点名俞经民、朴春旭、付强、薛海涛、吕俊成五位负责销售板块的负责人提出要求。“你们没有熟悉期,你不要说你是新的,你们都不是新人,没有熟悉期。为什么集团挑着你们前线打仗,销售你们没有熟悉期,你们上战场就得把枪抄起来,没有其他选择。”
贾建旭提出,销售人员要懂市场、敢预测、上效能和抓销售,尤其需要学会新营销,要有IP,抓好线上和线下的营销工作。其中,降低获客成本和降低转化率是成功的关键。
贾健旭还多次提到降本重要性。其要求陈君带领的零束科技成为公司“成本与能力中心”,以最好的成本,最好的能力贡献给整车;要求CTO祖似杰要成为最大的销售员,将技术卖给合资企业,以极大的用户分摊成本,让企业更富有竞争力。
对上汽集团旗下各零部件企业,他认为,现在最大(问题)是整车企业和零部件企业之间的博弈。贾健旭提到,零部件和整车要一条心,不要只想着赚钱,而要成为成本与能力中心,把给别人的最好技术和最新解决方案授予给上汽,实现“整零同”。为整车授予最好的成本和能力减少破坏。
与此同时,贾建旭对于旗下几个子品牌也提出了下半年的工作要求。首先在合资品牌方面,贾建旭要求上汽大众要“促油车、稳电车、上奥迪”,即要在赚钱的燃油车要降低销量;亏损的电动汽车要先把品牌顶起来稳着卖,把油车赚来的钱贴给电车;同时明年即将上新车的奥迪必须要上去。
对于上汽通用也是九个字——树信心、求生存、谋发展,这里的树信心包括员工信心、经销商信心和供应商信心。“信心在现在的上汽通用比什么都珍贵,把车卖出,打出一款爆款车型,负面声音就会小很多。”贾建旭说道。
而在自主品牌方面,上汽乘用车要“提效能、理型谱、谋协同”;通用五菱要“品牌向上、单车售价向上、利润向上”;智己要“担创新、强声量、上规模”。同时,贾建旭也希望上汽与奥迪的合作,能够给智己品牌的发展赋能。
贾建旭之所在这个时间节点上,在内部进行“铁血”演说,原因在于上汽集团目前所面临的生产和经营压力。在9月份,上汽集团月销量为33.67万辆,同比下降24.33%,再一次被比亚迪反超。旗下整车公司,除了智己外,全线下跌,其中,上汽通用跌幅最为严重,其9月销量已经从去年10万辆,跌至2.2万辆,影响了上汽集团外围市场表现。
而在新能源转型方面,由于上汽集团体量庞大,其转型难度也相比其他企业更大。在9月份,上汽集团销售新能源汽车超过12.9万辆,同比增长约38%;1—9月份累计销售新能源汽车74.8万辆,同比增长约15%。今年1-9月,上汽集团累计销量为265万辆,同比下降22.02%,同期销量已经达到了274.8万辆。如果接下来的3个月,上汽集团无法在月销量完成反超,比亚迪将终结其在国内连续18年的销冠地位。
(责任编辑:zx0600)