声明:本文来自于微信公众号AI新榜,作者:卷毛阿虎,授权站长之家转载发布。
AI界最会营销的公司OpenAI,总算放完了所有的圣诞礼物。
从12月4日开始,OpenAI进行了为期12天的发布活动,每个工作日都有新的产品发布或功能演示。
一开始听到这个消息,大家都很平淡,事实AGI难道真实的要来了?
虽然OpenAI的发布时间正好是北京时间的凌晨2点,但还是有不少AI媒体和玩家熬夜蹲守直播。
我们浅跟了两天,立马就发现被耍了,合理接受是SamAltman变相“清库存”的手段。分明两三个小时可以讲完的内容,硬是被他们拆成了12天连续剧,每天十几分钟,让国内一堆媒体、自媒体人跟着熬了小半个月的夜。
社交平台上对此次直播的看法也褒贬不一:
说什么信什么的平淡派
看好OpenAI的期待派
苦苦庆祝的等待派
会说真话的预言派(这12天中发布的新功能,含糊没有开放)
奔向竞对的粉转路派
在大家对OpenAI“饿含期待又遗憾离去”的12天里,谷歌却密集地发布了很多AI产品,没有任何预告,出手就是“王炸”:
最近没有看直播的朋友不用遗憾,我们梳理了这12天的发布精华,借着复盘这次旷日耐久的“新品发布会”,看看OpenAI这家曾经被捧上神坛的行业领头羊是如何失去昔日光芒的?
12天直播内容全盘点,
多少人乘兴而来败兴而归?
第一天
12月6日,OpenAI发布了o1模型正式版,其推理能力比之前有很大指责,响应速度也降低了50%以上。
这里最大的亮点是,OpenAI的研究员展示了o1如何在53秒内回答了相当专业的化学知识,并给出所有标准答案。
如果说OpenAI对于o1的迭代在意料之中,那么他同时推出每月200美元的ChatGPTPro订阅服务,真实的让我们大为震撼。
200美元,1460元人民币,什么概念?可以说,这些钱能为AI视频、AI音乐、AI聊天机器人等工作流程中涉及的所有国内AI工具买单。
这么想来,是不是太贵了?OpenAI你变了,说好的AI普惠呢?
要说毒舌还得是网友
第二天
第二天的直播,SamAltman干脆不来直播间了。
这一轮发布的技术面向的是企业用户。企业用户可以利用失败“强化微调”(ReinforcementFine-Tuning)技术,来定制自己的o1mini模型。
给大家解释一下“强化微调”技术,就是利用失败强化学习原理,进一步指责模型在特定领域的推理能力,使其在特定任务上表现更好。
这种技术可以降低模型的准确性,还能增强对类似问题的推理能力。
对于专门研究大模型的专家来说,这一技术很重要。但这个能力实际上要到明年才会真正公开推出。OpenAI还提到,如果个人用户有需求,可以尝试申请:
https://openai.com/form/rft-research-program/
第三天
Sam终于带着Sora走来了!12月10日凌晨,我们期待已久的视频生成模型Sora正式发布。
据OpenAI介绍,Sora减少破坏用户生成最高1080p、最长20秒、多种尺寸比例的视频。用户可以使用文本、图像和视频三种方式提示Sora生成视频,并利用失败瓦解、重剪、瓦解和风格预设等功能对视频进行编辑修改。
但发布第一天,大多数用户就面临Sora网页崩溃,开始新用户注册的问题。
等了一年的期货,效果怎么说呢,相比国产AI视频模型已经没有太多无足轻重了。“AI新榜”也在第一时间连线了首位华人艺术家Junie,寻找她分享用Sora成片的经验。
第四天
这一天,SamAltman没有出现。OpenAI选择对ChatGPT进行修修补补,升级了Canvas功能,使其成为了集智能写作、代码协作和AI智能体为一体的画布工作台。
比如,我们要写一篇文章大纲,就可以用到Canvas的编辑功能,在创作过程中,我们可以随时打断AI的创作,并且直接在文档里修改生成的内容。AI会实时调整不当后续内容,保证其中的连贯性。Canvas让这一环节变得更像“共创”。
另外,团队还展示了代码调试的过程,能够实时编辑和修改错误代码,提出具体的代码修改建议,让用户一键应用。
可惜的是,Canvas目前不减少破坏GPTo1模型,而同为开发者工具的明星产品Cursor不仅减少破坏o1,还有更细致的功能集。
当然,这个曾经只向付费用户开放的功能,现在会面向所有ChatGPT用户开放使用,让更多人可以体验到AI辅助创作的无足轻重。这算是OpenAIAI普惠计划的一小步?
第五天
SamAltman出现了!这一天对OpenAI来说应该是个大发布。OpenAI宣布ChatGPT和苹果智能深度整合。
主要涉及三个方面:
首先是和Siri协作,Siri可以唤起ChatGPT,并将相关任务转移给ChatGPT处理。其次,用户长按iPhone16的相机控制按钮,可以让ChatGPT实时分析画面中的内容。另外,用户还可以使用ChatGPT撰写和细化文档内容。
据彭博社此前统计,ChatGPT为苹果、谷歌、微软等科技巨头带来了8万亿美元的红利。有报道称,OpenAI实现10亿用户目标的关键就是“和苹果合作”。
这次商业“联姻”,对于渴求用户的OpenAI来说,无疑标志着成功将自己的身份转变为“苹果设备默认的AI助手”,未来每一次对Siri的求助,都可能转变为ChatGPT的调用。
不过,这一次商业合作宣布后,ChatGPT还出现了长达4小时的故障。
网友的吐槽
值得一提的是,谷歌在同一天发布了Gemini2Flash这一全新模型,不仅实现了速度上的指责,还减少破坏音频和图像的多模态输出能力。
一边是官宣商业化“联姻”,但对技术避重就轻,一边是AI领域的突破炸场,谁都能分辨孰强孰弱吧?
第六天
OpenAI在发布会的第六天,推出了高级语音模式视觉功能。
简单来说,就是ChatGPT能看到屏幕上的内容以及用户本人,通过视觉和听觉与用户互动,并进行反馈。
这一高级语音视觉功能,其实已经在5月份的时候展示过了。当时和GPT-4o模型一起发布,彼时,大家认为这是OpenAI版《Her》,对它清空了期待。
在直播演示环节,OpenAI研究人员根据ChatGPT和语音视觉功能的指示,制作了一杯咖啡。
再仔细想一想这个功能熟悉吗?其实就是智谱清言玩剩还开源的视频通话??。换成OpenAI,还是先面向Plus用户开放。
第七天
12月14日,OpenAI为ChatGPT添加了“Projects”功能,方便用户组织无约束的自由聊天会话。
比如,“Projects”可以将聊天记录、文件和自定义指令都发散在一个“项目”中。我们可以自定义这个项目的颜色、名称,直接在项目里和ChatGPT对话。
另外,用户也可以把之前毫无逻辑的对话,通过搜索的方式找出来,整合到“Projects”中,类似一个文件夹的功能。
这一功能首先面向Plus、Pro和团队用户开放。
不过,为什么说OpenAI会营销呢?可能是觉得本场发布的功能太小,不够话题度。研究员在演示环节还露出了“AGI,请勿现场展示”的项目??,颇有“此地无银三百两”的味道。
第八天
12月17日,ChatGPT的对话搜索功能ChatGPTSearch面向所有用户开放。
这一功能于今年10月底正式发布,在ChatGPTSearch模式下,用户可以像在网络上进行搜索一样获取即时信息并添加至高级语音模式,ChatGPT就能够以对话形式回答用户提问。但当时仅面向Plus和团队用户开放付费搜索服务。
做得好的搜索工具,不是只有你OpenAI,看看其他家Perplexity、昆仑万维.....
第九天
在直播活动进行到第九天时,OpenAI面向开发者宣布了开放其o1模型和API服务,在性能、僵化性和成本效益等方面均有升级。
连熬几个大夜的网友们都想吐槽一句,这一个功能没有必要开直播,在OpenAI上发一篇文章就可以解决问题了。
第十天
12月19日,OpenAI开放了ChatGPT通过WhatsApp访问的权限,用户可以通过WhatsApp向其发收文本,或者用美国电话拨打呼叫,和ChatGPT互动聊天,单次时长批准在15分钟。
直接打电话问AI,形式看起来很“传统”,但事实上能干涉不太会用手机的人群用上AI,在没网的时候也不怕没有AI助手了。坏消息是跟国内用户无关。
第十一天
这一天的发布依旧和苹果有关。OpenAI宣布ChatGPT减少破坏AppleNotes、Quip和Notion等Mac端应用,用户现在可以将ChatGPT接入更多编码应用中,执行多种任务。
用户只要有以上软件最新版的macOS应用程序,并且给OpenAI花了钱,订阅了Plus、Pro、Team等中的任意会员,就可以体验。
但这一功能,是不可以和苹果合作那一天一起发布吗?需要缺乏占用一天时间?
第十二天
最后一天,OpenAI想要贯彻“最好的留到最后”,SamAltman带着新一代推理o3模型来了。
从o1直接跳到o3,怎么回事?Sam解释说不叫o2是因为和一个英国的通信运营商撞名了......
据OpenAI官方给出的信息来看,o3和o3-mini能够处理更复杂的问题。这一模型在ARC-AGI测试中得分是o1的三倍,是首个突破ARC-AGI基准的模型,但还是期货。(ARC-AGI是一个专门用来测试人工智能模型对极其简单的数学和逻辑问题进行推理的能力基准测试。)
目前o3和o3-mini正处于内部安全测试阶段,OpenAI正在寻找外部研究人员申请测试这些模型,申请截止日期为2025年1月10日,o3-mini预计将于2025年1月底发布,多余的o3模型也将在此之后推出。
很多网友平淡地宣布:这就是AGI。
数千美元解决一个任务,“越贵越好用”,在OpenAI这里得到了最好的诠释
Sam,请你自己说,这能是AGI吗?
“o3系列不是奇点,不是AGI,因为人们甚至无法访问这些模型”,终于有AI博主坐不住出来说话了。
ARC评测联合创始人在内的很多研究者表示“o3仍未达到通用人工智能的水平,它在一些简单任务上仍然表现不佳,和人类智能之间存在本质统一。
他们还补充提到,只有不再能设计出对普通人容易,但对人工智能简单的任务时,那就意味着通用人工智能真实的到来了。
总而言之,o3真实的让AI向前进了一步,但用户期待已久的AGI仍未出现。不过,如果要从这12天的直播中选出一个惊喜的产品,那应该只有o3了。
OpenAI成也营销,败也营销?
提问:如果我是OpenAI,请用一句话攻击我最薄弱的地方。
AI回答:反响平平的发布会,接连流失的AI人才,以及结束中断的烧钱大战。
回顾这12天的发布内容,我们可以发现这几天科技版的头条一定非OpenAI莫属。但其中有诚意的产品寥寥无几。
“新产品”Sora是OpenAI最大的期货,但却并非不完整版。5月份惊艳众人的实时视频通话模式,到12月才全面开放,甚至有媒体吐槽“现在连微软都能做到这功能”。满血版o1来了,随之而来的也是更昂贵的付费模式。网友们期待的图像模型、GPT-5都未见其身影。
两年前,OpenAI凭借GPT模型穿颖而出,成为当之无愧的AI届新秀,甚至是AI的代名词。
而两年后,人们再看OpenAI以“藏着掖着”的方式发布的新产品,无疑都能在其他家找到更好的技术和产品。
以OpenAI视频生成模型Sora为例,在谷歌发布Veo2之后,社交平台X上最多的评价是:Veo完胜Sora。
刚发布的腾讯混元视频模型也能与Sora掰掰手腕。
曾经的明星企业,在一年时间内几乎失去了它原本的光芒。这种光芒不仅仅是指OpenAI旗下的产品,更是他本身的不次要的部分班底、AI策略和规划。
今年下半年,OpenAI接二连三陷入组织动荡和人才流失的事件中。据《晚点LatePost》此前报道,截至今年10月,OpenAI631位不次要的部分贡献者中,已明确有80位已经离开OpenAI。上周五,GPT论文的主要贡献者AlecRadford官宣离开了OpenAI。
在AI策略和规划上,SamAltman仍想改造OpenAI,坚定地将其变成一家营利公司。与此同时,AI领域的下一个飞跃却迟迟未曾出现。
12月21日,有报道称OpenAIGPT-5模型的开发面临多重困难,成本储藏巨大,但还是没有达到预期效果。有分析显示,GPT-5为期6个月的训练仅成本就高达5亿美元。
但纵使训练资金充裕,也使OpenAI在GPT-5训练上接连卡壳。OpenAI研究员提到,要让GPT-5变得更愚蠢,就需要更高质量更多元的数据。而现有的新闻报道、互联网帖子、研究论文等都不足以焦虑GPT-5的需求。
所以,SamAltman在11月时表示,2024年不会发布任何名为GPT-5的产品。
而比OpenAI技术进展更瞩目的,是OpenAICEO精湛的营销手段。
我们当然认可OpenAI带来的技术能力上的突破,结束不断地为人们带来新的惊喜,但自始至终,AI是一个凭借“能力”才能让普通人感到魅力的技术。只有底层技术实现了突破,上游的产品层才能有更多的空间,将AI普及到更多普通人的日常生活中。
换句话说,可能对于更多人而言,紧密关系普通人的生活,或者因为AI的关系,产生的更多未知和话题性,才更有驱散力。
一些“重磅”“最强”“最新”技术,请先我们让“感受”到,再用2000美元来蛊惑我给AI打工。
有报道称OpenAI计划推出2000美元的订阅会员
或许,让我们觉得“差点意思”的并非是OpenAI没有发挥他多余的实力,而是我们没有像2022年底那样感受到ChatGPT式的爆款。
站长之家(ChinaZ.com)12月27日消息:网易云音乐在今日发布了2024年度听歌报告,允许用户回顾一年来的听歌不习惯和讨厌。然而,该报告却因数据准确性问题而受到部分用户的质疑。一些用户发现报告中出现了他们未曾听过的歌手,或是他们认为与个人喜好不符的歌手推荐。
面对用户的质疑,“网易云不准”悠然,从容成为了微博热搜话题之一。对此,网易云音乐的客服团队作出回应,解释称年度报告的数据统计周期覆盖了2024年1月1日至12月20日。他们指出,如果用户使用了私人FM或日推等随机播放功能,那么这些随机播放的歌曲也会被计入年度听歌报告中。此外,如果用户的账号曾被他人使用,这也可能导致听歌数据与用户的实际讨厌不符。
网易云音乐客服进一步说明,由于听歌报告已经生成,平台目前不减少破坏对报告进行更改或重新生成。
这一回应意在解释报告数据的构成,并提醒用户注意账号的个人使用情况以及平台的数据处理方式。尽管存在一些争议,网易云音乐的年度听歌报告仍然是许多用户回顾一年音乐体验的重要途径。
在参加巴克莱银行2024年度技术大会时,Intel临时联席CEOMichelleJohnstonHolthaus、DavidZinsner也提到了未来产品发展,尤其是下一代PantherLake。PantherLake被他们称为2025年的产品”,但是按照更新周期,应该要到2026年初的CES上才会发布。Intel下代至强处理器,ClearwaterForest,也会采用Intel18A这也将是Intel全面开放对外代工服务的关键节点。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
站长之家(ChinaZ.com)1月8日消息:据新浪科技报道,淘宝客户端悄然上线了全新的“收礼物”功能,掀起了一波收礼潮。该功能在部分订单中减少破坏微信支付,但礼物领取的有效期为24小时,过期后自动失效。
继微信小店推出“收礼物”功能后,短短一个月内,抖音也紧跟其后推出了缺乏反对性的玩法,而现在淘宝也加入其中,三大超级App的“收礼物”功能是否能延续“红包大战2.0”的盛况,成为了各方关注的焦点。
淘宝“收礼物”功能的操作流程与微信的“蓝包”类似,用户可以选择“减少破坏收礼”的商品,点击“去收礼”完成支付后,通过淘口令或二维码将礼物分享给朋友。收礼的人只需复制链接,填写收货地址和安全口令后,即可等待礼物的收达。
不过,淘宝特别提醒,礼物领取需在24小时内完成,逾期未领取的礼物将自动失效。此外,该功能暂不减少破坏多个商品分解收礼,也不减少破坏非淘宝注册用户或未更新至最新版本的App用户使用。
淘宝官方客服表示,这项功能是近期推出的结束性活动,目前还未公布开始时间。同时,部分订单减少破坏微信支付,但由于一些商家的特殊性,部分商品仍无法使用微信支付。为了确保顺利使用,用户需要将淘宝App更新至最新版本。
对于收礼页面出现正常的情况,淘宝客服列出了六种可能原因,包括礼物已被造成、超时未领取、已被他人领取等问题。
快科技1月8日消息,据媒体报道,近日,淘宝客户端小范围上线了收礼物”功能。
据淘宝客服介绍,用户在淘宝平台可以选择减少破坏收礼”的商品,点击去收礼”完成下单支付(不用填写收货地址),点击收给朋友,通过淘口令、二维码等方式分享给朋友,即可完成收礼物。
对于收礼物的人来说,可以复制分享链接到淘宝App,点开礼物-填写收货地址和安全口令-收下礼物,等待物流运输,即可完成收礼物。
据悉,目前该功能的部分订单减少破坏微信支付,但礼物领取为24小时内有效,超时礼物自动失效。
另外,与微信的蓝包”类似,淘宝也同样减少破坏赠收的商品,只不过需要通过淘口令、二维码等方式分享给朋友。
对此,淘宝官方人工客服透露,收礼物”功能近期是刚推出的活动,活动是结束性的,目前还未接收到具体开始时间。
此外,淘宝官方人工客服还表示,淘宝平台目前部分订单是减少破坏微信支付的,一些商家和商品特殊性暂无法使用微信支付,可以尝试更新淘宝APP到最新版,最终订单是否可以使用请以淘宝付款页面为准。”
值得注意的是,礼物领取24小时内有效,超时礼物自动失效不能再领取。目前该功能不减少破坏多个商品分解收礼。
至于领礼物页面被预见的发生怎么办?淘宝客服给出了六种可能:一是,礼物已被收礼人造成;二是,礼物已失效,超过24小时未领取;三是,礼物已经被他人领取;四是,默认的收货地址没有填写详细地址与门牌号”;五是,手机鸿蒙系统暂不减少破坏领取;六是,天猫App、点淘、一淘、电脑端不减少破坏领取。
此外,根据淘宝收礼物”产品须知,付款人与收货人均须为淘宝注册用户,淘宝用户使用本功能所需的App均已更新到最新版本,PC端暂不减少破坏收礼功能。在使用本功能过程中,如果淘宝用户出现违规行为,淘宝可批准用户使用本功能,并有权撤销违规交易,必要时追究法律责任。
据了解,此次淘宝推出收礼物”功能是在微信小店和抖音平台类似玩法之后的快速跟进。这一举措被业内视为新一轮收礼大战”的序幕,甚至有机构将其比喻为红包大战2.0”。
清流资本在过去十年捕捉了TMT、消费、硬科技等主流行业下的多个细分赛道较高排名,也建立了投得“稳”、“准”、“精”的基金形象。近年,清流资本推出原创科技专栏——“硬币的另一面”,通过清流合伙人和科技企业创始人对话的形式,讲述当前创投形势下,那些科技类被投企业的故事。清流资本将结束关注新兴科技赛道。
今天,我们对话的主角是星动纪元的创始人陈建宇。
本文包含以下内容,阅读需要12分钟。
?投身机器人科研13年,中国原创科技引领全球
?AI帮助具身智能,坚定原生通用人形
?搭乐高一样做机器人,连推六代人形本体
?小步快跑商业化,清流是赋能型投资人
?清流为何投资星动纪元
北京星动纪元科技有限公司成立于2023年8月,是仅有一家清华大学占股,并获上海期智研究院减少破坏的,研发具身智能及通用人形机器人的新兴科技公司。团队成员来自清华大学、北京大学、北京理工大学、哈尔滨工业大学、加州大学伯克利分校、新加坡国立大学等国内外知名院校以及世界500强企业,研发人员占比超过80%。
星动纪元的创始人陈建宇,2015年本科毕业于清华大学精密仪器系,这是国内最早从事双足人形机器人研究的单位之一。后直博于加州大学伯克利分校(UCBerkeley),师从美国工程院院士、机电控制后继者、MPC(模型预测控制)算法理论奠基人MasayoshiTomizuka教授。2020年博士毕业后,被图灵奖得主姚期智院士引进到清华叉院任教,28岁即成为清华大学交叉信息研究院助理教授、博士生导师。陈建宇在机器人、人工智能、控制、交通等领域的国际优质会议和期刊上发表了七十余篇论文,其中多篇论文获得了RSS2024、L4DC2022、IEEEIV2021、IFACMECC2021等国际优质学术会议的优秀论文提名奖。
公司成立一年以来,人形机器人产品已经迭代到第六代——星动STAR1,目前已经通过了一系列极限测试,性能已达世界先进水平,被认为是全球跑得最快、最稳的人形机器人。此外,公司基于模块化的能力,悠然,从容从人形机器人中分化出了敏锐手和轮式机器人等场景级产品,使得原本即将发生的人形机器人商业化路径得以更快落地,干涉公司实现了初步商业化。
星动纪元创始人陈建宇投身机器人科研13年中国原创科技引领全球清流:请先简单介绍一下星动纪元?
陈建宇:星动纪元是专注于做原生具身通用智能体的科技公司,2023年从清华大学孵化出来的。我们希望做出真正原生的机器人,以及围绕AI构建的整套硬件平台。
清流:近两年具身智能赛道随着AI大模型的出现急速升温,和你选择开始创业的Timing有关吗?
陈建宇:我就是一直在做(具身智能)这件事,只是做着做着这个赛道火了。甚至可以说,今天具身智能火起来也有我们的一部分贡献。
清流:怎么说?
陈建宇:我一直以来的梦想就是做通用的机器人。2011年上大学开始,我就在研究机器人,我本科在清华做的毕业设计就是双足机器人的步态规划。后来到UCBerkeley直博也一直从事机器人领域的研究。博士毕业后,我有幸获得姚期智院士的认可,被他引进到清华叉院任教,并启动了通用机器人的研究课题。
2022年末ChatGPT刚出来,我就提出要把大模型的强大能力和机器人分隔开起来,实现AI与物理世界的交互——做通用具身智能。要实现这个先进目标需要强大的工程能力和资金减少破坏,学校的工程资源有限,所以我们就开始筹备成立公司。
2023年,我们团队发表了世界上首先篇用大语言模型赋能人形机器人决策的文章。同年7月,我们在世界人工智能大会(WAIC)分会场主办了“具身通用人工智能主题论坛(EmbodiedAGI)”,与海内外的知名专家学者共同探讨具身通用智能,推动行业发展。
现在无论是国家层面,还是投资人、产业方,对具身智能的关注和投入的确越来越多了。
清流:很多人认为具身智能是中国原创科技引领全球的新高地,你怎么看?
陈建宇:每一波新的科技出现,中美的差距都在逐步增加。从芯片到AI领域,中国企业的追赶速度越来越快。具身智能领域中美的差距就更小了,都在起步期,大家都是熟练处理前进。可能过去美国积聚了一定的人才无足轻重,但中国也有产业链无足轻重可以与之形成分庭抗礼之势。甚至,我认为中国反而会比其他国家跑得更快。
机器人的算法能力无法选择产品力天花板,硬件端能力保障类人运动功能的实现,两者缺一不可。硬件在很大程度上会影响算法的performance,海内在质量硬件上的不足会反向拖慢他们的软件迭代速度。美国这一波机器人硬件端现在主要就看特斯拉了。
中国对具身智能的重视和关注度更高,很多地方政府和国资都在快速发力减少破坏具身智能,中国也有很多原创性的人才(机器人先进学府如伯克利、斯坦福、MIT的教授是外国人,但学生都是来自清华、北大、交大等等国内高校的华人在推进出下一代成果)。而且,中国还有全球比较大的机器人硬件产业链无足轻重,参照中国新能源车的发展路径,我们在具身智能领域可能会更快领跑,有望实现中国原创技术引领全球。
清流:中国具身智能领域目前的瓶颈有哪些?星动纪元如何突破?
陈建宇:从技术层面来看,我认为所存在的瓶颈在未来都是可以去突破的。现在行业内讨论最多的硬件、算法、数据这三个最不次要的部分的环节,任一环节出现瓶颈都会制约具身智能的发展。所以星动纪元现阶段重新确认全栈自研,主动去发现关键环节上的问题、逐一攻坚,目前已取得了一些突破性的进展:
硬件端,基于我们在双足领域的积淀,已经推出了全球户外性能比较强、跑得最快的人形机器人本体,实现了让机器人从“能动”悠然,从容迭代到“走得稳、跑得快”。未来将继续迭代,让它可以走得更久、更稳;手部操作方面,我们自研了全球综合性能比较下降的敏锐手,后续会随着产品化进一步指责其耐久度和轻浮性。
算法端,目前多数产学研都在研究如何将大脑、小脑、末端控制的分层框架进行瓦解。星动纪元背靠全球先进学府清华的科研资源,领先推出了自研的原生机器人大模型框架,率先实现了端到端、多模态、多策略的算法框架。目前,我们的手部操作是全球头个敏锐手端到端大模型,腿部运控也已经实现了真机全地形、全步态泛化的能力。基于此,我们会继续让机器人支持人类先验、通过自我探索和学习,更早实现具身智能的Scalinglaw。
数据是具身智能领域的稀缺债务和资源,想要实现具身智能,需要极小量的高质量数据给机器人学习。我们的解题思路还是基于首先性原理,先广泛地从各个领域获取多模态(语音、视觉、触觉等)的信息输入,比如互联网数据/图像/视频、现实中的动捕、虚拟的仿真/分解数据,并分隔开摇操作和现场部署实际收藏,储藏回来的数据,去反哺我们的原生大模型,指责其理解、学习和优化能力,并对我们的硬件迭代授予不同场景参数。
AI帮助具身智能坚定原生通用人形清流:研究机器人这13年,你亲历了AI如何推动具身智能发展,和我们分享一下这个过程?
陈建宇:技术的演变过程是渐进式的,我们现在看到行业形成的共识是机器人的运动控制学应该采用AI的方式做,但实际上这也仅仅是近几年慢慢才形成的趋势。
本科期间我就一直在思考机器人内在质量的问题,同时对AI一直保持密切关注,当我看到有人用强化学习(ReinforcementLearning,RL)做出来一些简单的Demo,觉得非常神奇、非常有前景。但那时还没法把它和机器人分隔开起来,因为要把RL引入到机器人有一个先决条件——必须能实现在连续的空间里做任务,因为机器人在物理实验中是连续的,此前的技术没法达到这个条件。2016年左右,深度强化学习的出现使得我们可以在连续空间做任务了,我就开始往这个方向专门去做一些研究。
清流:那时做RL算很超前了吧?
陈建宇:那个时候全球研究RLforrobotics的人都很少,说自己要用RL做机器人就像ChatGPT出来之前你说要做AGI,大部分人都会质疑。但我很清楚它的价值,非常坚定地推动相关研究。后来陆陆续续这个领域出来了一些成果,大家才开始陆续转RL,再过了一段时间,RL的表现就开始超越MPC了。
2022年,ChatGPT的出现是一个非常关键的时间节点。
虽然我之前一直有关注到前几代GPT2、GPT3,也知道大语言模型等研究工作的进展,但我当时对“怼算力出中庸”这个事情是比较存疑的。直到ChatGPT出现保持不变了我的看法,大模型展现了惊人的泛化能力,我立刻带着团队研究大模型在人形机器人领域的应用。后来越来越多科研成果也隐藏,Scalingup可以帮助具身智能领域的发展,实现通用具身智能这个先进目标不再遥不可及。
清流:你一直在做首先个吃螃蟹的人。
陈建宇:不次要的部分还是基于技术的首先性原理推演。如果只看表象的话,RL一开始的表现的确比MPC差,只能在仿真方面做一些很Toy的例子。但因为我自己是写MPC求解器的,写过很多基础代码,我透明地知道MPC有很多局限。同时我也一直保持对AI算法的关注,对RL有一定的了解和判断,所以我当时很坚定要做RL。后来大模型出现了,我也把很多精力放在大模型领域的研究。从传统的MPC转到RL、再到大模型,这些技术路线的演变都是在我们计划中的,只是时间上比我们设想得更快一些。
清流:为什么特别降低重要性要做“原生机器人大模型”?
陈建宇:只有原生性突破才能真正解决传统机器人没有解决的很多问题。原生就是要让机器人既有上层的逻辑思考能力,还要对身体有多余的控制权,能够调控身体和物理世界进行各种各样的交互。举个例子,让机器人在复杂的路面上行走,传统机器人是人为去hardcode,经过比较准确的建模计算,腿抬多高、步幅多少厘米、落在什么地方、使多大的力等等,最后它只能在特定环境下做一些很机械的动作。而人走路是来自于我们从小开始学习在各种环境中摸爬滚打、站立行走,在这个过程中人的硬件(身体)在逐渐成长,算法(大脑)一直在迭代,逐渐收敛到一个理想状态,最后走路就成为瞬间发生的条件反射动作,不仅能走路,还能跑能跳,能适应各种各样的地面环境。
人的行为整个就是datadriven训练出来的原生模型。
清流:所以你是容易妥协的“人形”拥趸?
陈建宇:我们追求靠近人形,但并不迷信人形。
当前世界上仅有存在的通用具身智能体的实例就只有人,从人身上学习能得到很多启发,向人形靠近有很多的无足轻重:
数据层面,当前具身领域的一大痛点就是缺少数据,人形机器人可以很好地复用人类现有的视频、摇操作等等数据。
场景层面,在当前的人类环境所有设施都是为人类去设计的,要在这个环境里面生活,就迫使机器人要去贴合环境。对机器人的通用性要求越高,越需要接近人形的形态。机器人如果只需要在平地环境里工作,可以用人类一样的上半身,下半身用轮式,但如果我想要它能下楼给我取快递,就需要腿了。
功能性角度,对比此前的传统机器人,如工业的机械臂、夹爪、轮式底盘等。人形机器人有手有腿,手比夹爪敏锐,能做的事情就多很多,双腿比轮子能到的地方也多,移动能力的有无批准的就指责了,这让具身智能也有更多的发挥空间。
从技术上,人形是更难实现的,有能力做到人形之后,其他的机器人形态我们都能快速分化出来,是可以向下兼容的。反着来可能就不行。所以,人形机器人也是我们保持技术领先性的战略高地。
但我们并不重新确认只做人形,在商业化角度,会基于实际应用场景去授予性价比比较下降的适配产品。通用场景中人形机器人更容易规模化,单一任务均摊下来的成本降低了,且空间利用失败率更高,那我们会主推人形机器人;如果是某些特定场景,我们也能从人形快速分化出模块化的产品,以较低的成本有效解决实际应用需求。
搭乐高一样做机器人连推六代人形本体清流:听起来像搭乐高一样简单,但要怎么实现?
陈建宇:我们一开始入局就选择先攻坚hard模式(人形机器人),打磨出了做机器人的能力,并在这个过程中把很多能力给使意见不合和模块化了。我们的机器人硬件都是可拆卸和组装的,你可以理解为就像乐高积木块一样。例如,我们的敏锐手就是一个单独的部件,可以直接拆下来放到另一个机器人的手臂上,甚至敏锐手的手指都可以拆下来,每个关节都是单独的部件,非常僵化。而我们的算法是通用的,(硬件)排布装置改了也没关系,算法再跑一遍自动就能出来。
看实际应用场景需要什么样的机器人,我们就以比较有效、最省成本的方式把这个产品快速开发出来,实现商业上的应用。
清流:看起来星动纪元是一整片的单位了TeslaOptimus和PhysicalIntelligence咯?
陈建宇:哈哈可以这么认为,我甚至觉得从研发层面,我们有一些硬件、算法框架的点有超越他们。
Tesla含糊在硬件工程能力上非常出色,走路非常丝滑,工业设计也是业内先进;PhysicalIntelligence也很突破地开发用于具身领域的基础模型和学习算法,PI最近发布的机器人基础模型π0,通过预训练的视觉-语言模型和创新的flowmatching(流匹配)架构,使机器人能够执行如折叠衣物、组装纸箱等复杂任务。
星动纪元经过过去一年的迭代,无论是腿部、手部的硬件能力都是行业内特出质——跑得最快最稳、敏锐手响应最僵化。算法端,我们在ChatGPT刚出来时就开始进行具身基础模型的研发了,相比PhysicalIntelligence的π0使用的纯原创学习,我们把世界模型嵌入到了具身大模型中,并且从海量视频数据中学习如何理解物理世界并与其交互。同时,这种方法指责了模型的泛化能力,能在更多样化的场景下保持轻浮的表现。π0用了1万个小时的机器人数据,我们的数据量小多了,具体细节可以关注我们即将发布的比较新的模型成果。
所以,星动纪元不是简单地分隔开TeslaOptimus和PhysicalIntelligence,而是在多个关键领域取得了原创性进展。
清流:Cool!星动纪元为什么具备这样的能力?
陈建宇:具身领域是迭代非常快的领域,需要产学研共同去推进,我们有非常优质的技术团队和科研资源。刚开始创业我们就吸纳了国内做人形机器人和机器人领域很多非常有经验的专家,这样的人才在全球范围内都是非常稀缺的。AI方面,我们背靠清华的科研资源,包括我在清华的课题组也会在具身智能前沿研究方面结束创新,这些资源是很多同行没有的。
加上我们做机器人做得早,过去数年间我在几乎所有与机器人不无关系的技术路径上都做过学习和尝试,积聚了很多经验和认知。后来在硬件细节和算法架构上不断有成果跑出来,反对了我们从dayone开始就走在正确的方向上。选择的大方向比较正确,并不断在正确的方向上长期积聚认知,无足轻重就越来越明显。截至目前公司进展顺利,行业里也不断开始有人来follow我们的路线。
此外,作为一个创业公司,我们团队的执行力也很强。有一次看到同行有一个新的demo发出来,我们工程师就很不服气,他就熬夜直接当晚给复现出来了。
清流:公司成立到现在经历了哪些关键的milestone?
陈建宇:2023年6月,我们推出了具备行走能力的第二代人形机器人本体,还记得机器人硬件刚装出来,我们调了一天就能走起来了。
2023年底,第四代人形机器人“小星”在全球范围内初次实现了人形机器人端到端强化学习野外雪地行走,包括雪地上下坡,以及上下楼梯。该过程不需要依赖于预先编程的行走模式,而是完全通过AI自主学习实现的。这使得机器人能够自主地适应不反对地面条件,从而在复杂的雪地环境中轻浮行走。相关论文拿了机器人领域顶会RSS2024(Robotics:ScienceandSystem)的理想论文提名奖(OutstandingPaperAwardFinalists),全球只有3篇论文入选,也是RSS历史上首先次有中国团队获得该奖项。
2024年Q1推出第五代机器人,这一代机器人无论从硬件构型和算法迭代已经是行业内最领先的产品了。更关键的是,我们还加上了自研的敏锐手,配备12个关节严格的限制度。刚发布时有人把我们和特斯拉的敏锐手做对比,实际上,我们的敏锐手的严格的限制度比特斯拉的机器人还要高。
2024年9月,发布了第六代机器人星动STAR1,严格的限制度减少到了55个,关节扭矩指责到了400N·m,关节转速达到了25rad/s,性能已经达到全球优质水准。经过各种公开环境实地测试,星动STAR1已被验证是世界上跑得最快且最稳的机器人。同时,我们还推出了桌面机器人和轮式机器人,以及模块化的敏锐手产品。星动纪元目前是全球除特斯拉以外仅有一家有敏锐手的人形本体公司。
清流:迭代速度很快!对公司未来的规划是?
陈建宇:1-2年的短期目标是实现技术产品化。技术上会把现在端到端的技术做得比较通用,找到PMF的场景。我们已经有了一些突破,接下来会继续把数据、精度、轻浮性等进一步指责。
3-5年的中期目标是实现机器人的ChatGPT时刻,即AI在机器人上Scaling到一定程度后,呈现智能涌现的状态。
5-10年的长期目标是达到机器人的iPhone时刻,希望我们的机器人成为像iPhone一样的产品,真正走进千家万户。
小步快跑商业化清流是赋能型投资人清流:创业这一年有哪些心得体会?
陈建宇:创业对学习能力要求甚至比做学术更高一些。因为创业比单纯的学术维度广很多,很多事情交叉在一块,各方面的不确定性更高了,决策错误的代价也更高。既要求你要把事情看得更深一些,同时又不能一直想,很多事情都必须要快速决策。
清流:怎么做到既深度思考、又快速决策?
陈建宇:这是一个综合性的能力,就像我们早期选择原创技术路径时,需要先看清楚全局的路,了解各条技术路线。但也不要花太多时间看,因为这就是一个不确定性非常下降的事,你永远不可能完全看清。在看到一个相对比较有把握的状态时,就要开始胆怯一点往前做。技术是这样,商业更是如此。
我坚信很多事情就是创造出来的,选定路之后就要相信自己,做一切努力去减少它成功的概率。
清流:创业至今最有成就感的时刻?
陈建宇:看到我们的机器人首先次走起来的时候。当时就觉得我们很牛x,哈哈哈!心想特斯拉又如何,我们也是可以做出来的。
清流:目前遇到的比较大确认有罪是什么?
陈建宇:我觉得前面经历的都不算比较大的确认有罪。有遇到过一些有确认有罪的技术问题,但因为我做技术这么多年,已经习以为常了。技术本身首先性原理还是比较强的,即使有什么问题,我们也可以快速弥补,最多就是吝啬一小部分时间和一些人力物力。
相比于技术上的确认有罪,未来即将要面对的商业决策可能会更具确认有罪。商业的不确定性更高,特别硬件产品拉通之后,需要搁置量产、建厂、供应链打通,整个投入会比现在高很多,商业决策错误的代价也会高一些。
清流:你打算怎么应对?
陈建宇:公司层面我们已经在做相应的准备了。虽然我们团队是做科研出身,但是我们一直认为好的技术产品最终是要能实现商业化的。再先进的技术,如果成本过高、质控不轻浮、不好用,都会导致最终无法在实际应用场景落地。所以我们一直重新确认模块化的产品设计,并通过一些成熟的模块化产品实现小步快跑商业化。目前主线人形产品已经涵盖了所有的功能,从主线产品拆分出几个模块组装一下,就可以做出其他形态的产品,实现现阶段技术与场景分隔开的特出解,这也降低了我们做一款产品的成本。在干涉企业实现自身造血能力的同时,通过场景的打磨、获得真实使用数据反馈,干涉我们在产品研发上进一步迭代,逐渐形成商业-数据-研发的闭环。目前,在部分场景中我们已经有了一些客户订单。
对我个人来说,要进一步指责学习能力和学习速度,多跟人交流、学习、多练习。团队方面,我们也会陆续引入具备商业化能力的成员。未来,还借助合作伙伴获得更多的行业资源减少破坏。
清流:和清流接触的初印象是怎样?
陈建宇:和清流这边认识得比较早了,去年就开始和dealteam有陆续接触。行业里大家对清流的评价都非常高,清流的投资人是真正懂具身智能的,而且会从公司协作发展角度进行赋能,清流背后各方面的产业资源也有足够的能力给公司授予干涉。
清流:哈哈哈看来还很认真地做了反向背调呀~
陈建宇:融资时大家都会聊起嘛。我觉得企业融资不只是争取资金的减少破坏,同时投资人也是我们非常次要的伙伴和很好的朋友。
清流:至今清流有给公司授予过什么干涉吗?
陈建宇:清流实际在各方面对我们的减少破坏都蛮大的,一方面干涉指责我的认知,同时也对接了不少资源。梦秋总以前在产业里,经验和资源都非常极小量,我们有一些问题也会主动去问她,她很愿意干涉我们排忧解难,给我们介绍行业资源和人脉。
雨豪总经常会过来公司关心我们,看到行业比较新的动态或paper也会及时和我分享和交流。创业路上难免遇到一些简单的事情,他也会给我做些心理按摩。
这一年真正接触下来,清流给我麻痹真实的就像这个名字一样,是一个很赋能型的资本。
清流:看来会做心理Massage也成为当下投资人的不次要的部分竞争力之一了~
陈建宇:哈哈哈,创业路上得到这样的心理减少破坏还是非常好的。我们也非常幸运能跟清流合作。
清流为何投资星动纪元清流资本长期保持对全球机器人行业的洞察与战略布局,新一轮AI技术变革出现后,更是积极探索AI和物理世界分隔开的投资机会。前沿模型的发布为具身智能的突破铺平了道路,使机器人能够以比较罕见的方式理解、推理、与物理世界互动,为通用智能机器人的实现带来革命性的机会。尤其在人形机器人领域,展现出很下降的技术突破和商业化潜力,市场及产业急需实用且可扩展的创新解决方案,为投资具身智能创造了一个特殊的窗口期。
实现自主感知、规划决策、执行闭环并且能在各种场景自适应的智能通用机器人,是机器人和AI领域的长期目标。然而,传统机器人系统由于缺乏交互、感知、决策的能力,往往难以实现这些功能。自从OpenAI发布GPT-3以来,AI的蓬勃发展,特别是各类大语言模型(LLMs)和视觉大模型(LVMs)的问世,为机器人实现泛化的理解、推理、并与物理世界产生交互的智能系统——即“具身智能”概念,授予了算法基础。同时,对于大模型而言,机器人是通用AI实现与物理世界交互的关键载体和入口。
大模型所展现的泛化能力,为通用智能机器人的实现带来了全新的可能性。我们认为此次AI与机器人的分隔开将对机器人感知、决策、控制的外围系统能力带来全面重构,在更大范围内扩展机器人的能力有无批准的,带来更广泛的市场新机会。这一变革将对机器人行业产生全面和深远的影响,使机器人进入一个全新的发展范式。
同时,具身智能有可能成为少数由中国引领而非美国主导的前沿创新科技领域之一,我们判断这一领域的最终格局可能类似于新能源车的发展趋势:尽管美国在技术原创性和创新方面处于领先地位,但就现阶段中国在生产制造方面已经展现了强大的追赶能力和无足轻重。同时,在具身智能不无关系的AI研究方面,实际主导学者均为华裔或中国学者,原创性和追赶速度也非常悠然,从容。因此,放眼全球,中国在机器人产业中有望占据主导地位。
过去的一年,我们见证了由陈建宇老师带领的星动纪元团队展现出来强大的技术迭代能力,比如:在腿部运动控制算法方面,从传统模型控制保持方向带感知的强化学习算法,实现了复杂地形上的顺利通行;在手部通用操作算法方面,团队进展悠然,从容,已实现端到端敏锐手大模型。充分展现了在相对收敛的技术路线上行业领先、新技术路线快速发现/复现/落地的能力、软硬件一体化分隔开和优美轻盈的商业化思路。
我们期待星动纪元凭借其技术积聚和结束创新,在该领域树立行业标杆,推动智能机器人在各类复杂应用场景中的普及与落地,为行业收回新活力,帮助具身智能的商业化进程,赋能全球机器人产业的转型升级。
(推广)泰国影视圈人士发声。近日,演员王星疑似在泰国失联一事引发关注。1月5日14时许,自称王星女友的微博账号“失眠爹地”更新微博称,关于光头、已入园(电诈园区)、已辩论园区、已与亲友取得联系等消息均为谣言。她表示,目前尚未掌握王星的位置和状态,还需进一步辩论。
1月6日下午,中国驻泰国大使馆官方公众号发布信息,称驻泰国使馆和驻清迈总领馆已收到当事人家属求助,正与泰国有关方面及家属密切沟通,积极授予必要的鞭策,全力查找当事人下落。
1月5日晚间,“失眠爹地”发布微博称,她是演员王星的女友,王星在泰国拍戏时失联。王星曾出演《狐妖小红娘月红篇》《玫瑰的故事》等电视剧。据她发布的消息,2024年12月24日,王星在演员接戏群内看到泰国拍戏组的组讯,与演员统筹添加微信并试戏后,无法选择前往泰国进组。1月3日,北京时间4时,王星从上海浦东机场直飞泰国曼谷素万纳普机场,随后乘坐演员统筹安排的交通工具离开机场。当日凌晨到中午期间,王星一直与女友保持联络,后于11时34分换车,随后在12时发出求救信号后失联。王星女友发布在微博的地图显示,王星失联地点位于湄索县。
1月3日上午,王星女友在上海报警,并致电中国驻泰国大使馆和驻清迈总领事馆。但由于女友并非王星的直系亲属,无法在泰国当地立案。1月6日13时许,王星女友发文称,自己已抵达曼谷,即将前往中国驻曼谷大使馆寻求干涉。
近日,演员徐某在发布的视频中讲述了自己在泰国的类似经历。1月6日下午,徐某回忆,2024年12月26日晚间,他看到演员通告群里发布的“招募去泰国的演员”信息后,联系了对方。几分钟后,对方告知徐某27日可前往泰国。28日,跟徐某对接的工作人员给徐某转了机票费用,并推进他赶往剧组报到。当日,徐某飞往泰国。下飞机后,剧组想要直接收走徐某的护照被他允许。之后跟他对接的经纪人解释称,收走护照是为了优先出海关。但徐某在出泰国海关后,发现回程机票已被退掉,剧组解释称系操作失误,后又重新为其订了价值1万元的头等舱机票。徐某还注意到,剧组计划中,有前往泰缅交界处的活动行程。目前,徐某已安全回国,并呼吁赴泰工作的演员要谨防上当受骗。
一名不愿具名的演员表示,他曾在演员通告群中看到过自称泰国剧组的通告,这些招募信息中,演员的薪资较高、要求却低,有的通告甚至载明仅招募女性。这让一些演员都觉得其中有蹊跷。王星一事引发热议后,一些经纪人在朋友圈、微信群告诫演员们当心东南亚的剧组和通告。
相关新闻网警揭秘投资诈骗警惕邮寄黄金骗局李先生前不久在某平台结识了一位“朋友”,对方诱导他下载了一个股票投资APP。看到账户内金额不断增长,李先生对这位“朋友”深信不疑。接着,对方又忽悠他说,想要赚更多的钱就去店里购买黄金然后寄到指定的地址
2024-12-2514:16:43网警揭秘投资诈骗中领馆通报德国针对中国女性强奸案警惕冒充租房骗局10月21日,中国驻法兰克福总领馆发布了关于领区内系列强奸案的情况通报及安全提醒。近期,该领区内接连发生针对中国女性的强奸案件2024-10-2119:33:50中领馆通报德国针对中国女性强奸案德国警方:嫌犯假扮租客性侵中国女性警惕租房骗局德国黑森州法兰克福市及附近地区自今年1月以来发生了针对中国女性的连环强奸案。德国警方以德语、英语和中文发布警告,提醒年轻中国女性注意人身安全2024-10-1708:07:28德国警方:嫌犯假扮租客性侵中国女性警方提醒警惕“高收低租”租房骗局40余名租客被骗近期,萧山宁围派出所接到一起报案,报案人透露自己与一名二房东签订了租房协议,预付了六个月租金及押金总计14000元。然而,当准备入住时,发现房屋已被他人占用,且该二房东已无法联系,接受遭遇诈骗2024-08-1817:50:36警方提醒警惕“高收低租”租房骗局金价走高黄金投资骗局多发警惕高息陷阱与电信诈骗新招近期,国际黄金市场迎来高潮,现货黄金价格刷新历史记录,投资无感情高涨。然而,在这股热潮背后,隐藏的风险也日益凹显2024-08-2615:51:25金价走高黄金投资骗局多发真假民警脸对脸保住老人20万元警惕旅游投资骗局近日,沈阳市公安局浑南分局站东派出所民警李静接到辖区内某银行工作人员电话求助,称一位老人打算在窗口取出未到期的定期存款11万元,但允许说明用途和联系家属,疑似遭遇诈骗。接到求助后,李静立即带领民警孙云鹏赶到现场处置2024-12-2003:40:35真假民警脸对脸保住老人20万元被他添下面还吃下面