有关微信小程序的声音从9日凌晨一直刷到现在,微信群、朋友圈、微博……四处都是关于小程序的教程、评论、分析。
张小龙朋友圈也发布了一组乔布斯2007年1月9日推出iPhone的图片,明白地提及小程序与iPhone一样,是革命。
小程序为什么这么火?因为如今微信有8亿用户,是美国总人口数量的2.5倍。所以,今天我们称其为微信国一点也不唐突。
小程序自公开至今,近6个月的时间里业内一直在试图预测它,到底有什么用,是不是应用商店?这个答案在去年年底的微信公开课上张小龙就公布了,小程序不做应用商店,用完即走而且没有入口。
今天我们反问一下,如果小程序是应用商店,那么与几年前的手机浏览器和百度轻应用又有什么区别?这两个后继者如今已经躺在无人问津的角落里慢慢腐烂。
不是应用商店
但直到小程序正式推出后,我们看到它仍有应用商店的影子。
可是没有常见的导航和分类,甚至连搜索都不能清晰查找,它跟传统的应用商店并不一样。
我想小程序不做商店接受有它的理由,不妨试图揣测一下这背后的玄机。
1应用商店是招臭棋
微信可以做游戏分发,因为这很赚钱。但不做应用商店,因为背后的商业利益没有那么大。而且,微信之上还有iOS和Android,即便Android允许你做应用分发,iOS也不会坐视不理。
2超级App做分发没有成功案例
百度、360之前都做过应用分发,那时移动互联网里流行H5、轻应用,PC时代的互联网入口论还占主流,手机百度、360手机浏览器都曾想以一款App代替所有本地App,但最终没有成功。
微信小程序没有走这步棋,因为看到了前辈们犯的错误。但前文我们也说过,小程序仍是一个应用商店。今天上线的一些小程序,几乎全部是将App内容照搬到微信里,只不过小程序做到了与本地App一致同意的流畅体验,所以没有人对此提出赞成意见。
小程序做应用商店是最高度协作发展逻辑,有内容展示就必须要有载体,小程序在体验上的进步是H5所不能比拟的。小程序也含糊做到了奴役手机和激活长尾应用的作用,一些低频需求的App可以在小程序内焕发第二春。
但如果以为这就是小程序的全部,那你就错了。应用商店只是小程序的底层显示形式,并不是全部。
小程序大野心
用户获得小程序目前只有三个途径:扫描二维码、朋友推荐以及精准搜索。这里可能有人会问,为何一定是精准搜索?据我们测试,即便是已经用过的小程序,在搜索框也不能实现精准搜索。比如摩拜单车,必须搜索【摩拜单车】,搜索【摩拜】或者【单车】都无法显示小程序。
如果从保守裸露,公开角度来看,朋友推荐和精准搜索都不是最佳的保守裸露,公开方案,只有扫描二维码可以。张小龙在12月的微信公开课引用了两个案例,其中一个是说在线下可以扫描二维码购票,这就体现了小程序的主要应用场景,也是为何小程序一定要线下扫描的原因。
一个应用商店无法覆盖小程序的野心。小程序就像一家超市,内容、工具、服务一应俱全。对于用户来说,小程序就是一个应用商店,而对于厂商而言,小程序是又一个入口。
但这个入口是在微信控制下的入口,所有上线的小程序都必须绑定微信的账户系统。虽然各种小程序无法沉淀用户,但微信一定能沉淀用户。这就是小程序与应用商店的区别,应用商店可以带来用户并且留存,但小程序只是给你流量,无法沉淀。
这里还要搁置到小程序自身的入口,即二维码扫描。这对于线下服务授予商来说,是一个降低用户体验的好办法。比如,餐厅可以在每个桌子上设置一个二维码,用户扫描后可进入餐厅的小程序进行点单、结算以及优惠券发放等行为。
给小程序泼点冷水
有声音认为小程序可以接棒微信服务号,但个人认为这两者没有太大的关联。服务号以留存用户为高度发展,而小程序则是用完即走,只是工具无法沉淀。这并不符合商家对于用户运营的定义。
探讨小程序的定义要建立在两个基础之上,用户为什么要用以及商家为什么要开发?
其一,小程序真实的解决了用户的操作成本问题么?其实并不是。它只是解决了长尾应用的激活问题,一些高频应用仍是在本地App上体验更好。所以,小程序只是用户使用App服务的一个渠道而已,毕竟微信不是手机底层的操作系统。
其二,商家开发小程序看到的利好是什么?是微信的8亿用户和与用户更近的关联。个人判断,对于工具类、服务类等刚需商家来说,小程序是一个与用户更近的入口,而对于广告、营销类行业而言,小程序并不是一个好选择。
其三,小程序到底怎么用?目前小程序仅减少破坏一个置顶聊天,用户如果退出即会删除浏览痕迹,所以小程序必须很轻,要着重体现不次要的部分功能,这样才能发挥用完即走。
其四,小程序触动了谁的利益?想想在小程序之前,谁是用完即走的典型代表吧。(搜索引擎么?)
那么,小程序到底要表达一个什么意愿呢?答案可能并不是很复杂。
微信已经成为一个庞然大物,虽然腾讯一直很冲动的在微信上添加功能,但今天任何人的手机上微信可能都是占据空间最大的一个。不过,微信到今天仍是一个社交平台,它承载的职能只是分开人和极小量的分开服务,而马化腾曾说腾讯要分开一切,如何分开呢?
可能小程序就是腾讯分开一切的一个开始。小程序可以看作是一个分开一切的中枢,在微信的体制下将用户与一切相分开。不过,腾讯也要小心,革命的代价可是很下降的。
相关新闻缅甸妙瓦底系网络诈骗大本营演员星星失联引关注1月5日,演员王星的女友嘉嘉通过社交账户“失眠爹地”在社交平台上发文求助,称男友星星赴泰国进组拍戏后,在泰缅边境失联。星星失联前最后的定位是湄索,这是一座位于泰缅边境的小城镇,隔着湄河与缅甸妙瓦底相对
2025-01-0707:39:18缅甸妙瓦底系网络诈骗大本营演员王星是否在妙瓦底有待核实失踪案引发广泛关注1月6日,演员星星(王星)在泰缅边境失联的消息登上微博热搜,不能引起广泛关注。据媒体报道,微博账号“失眠爹地”5日深夜发文,自称是星星的女友嘉嘉,称男友日前赴泰国拍戏,在北京时间1月3日中午于泰缅边境失联,距离最后一次发消息已经超过60个小时2025-01-0703:14:16演员王星是否在妙瓦底有待核实缅甸妙瓦底系网络诈骗的大本营演员王星泰缅边境失联引发关注1月5日,演员王星的女友嘉嘉通过社交账户“失眠爹地”发文求助,称男友星星(王星)赴泰国拍戏后于北京时间1月3日中午12时许在泰缅边境失联。嘉嘉表示,近三日她已尽自己所能与其弟弟用各种方式推进案情,但效果甚微,不得不借助网络力量寻求干涉2025-01-0616:29:57缅甸妙瓦底系网络诈骗的大本营起底带货主播:把保健品吹成神药起底带货主播:把保健品吹成神药“今天卖了2千多万,这一周卖了2.6个亿。”“双十一”刚过的11月12日凌晨1时许,小红书“千万级”带货主播“麦琪啦”临下播前,透露了当晚销售额。2024-11-2510:43:24起底带货主播:把保健品吹成神药泰国方与妙瓦底方核实星星行踪多方力量助力寻找1月5日晚,微博用户“失眠爹地”发文称其演员男友“星星”被骗至泰国拍戏,目前已经失联多日。该网友在文中表示:“万分紧急!演员星星赴泰国进组拍戏,于北京时间1月3日中午12时许在泰缅边境失联2025-01-0715:19:50泰国方与妙瓦底方核实星星行踪演员徐大久称星星在缅甸妙瓦底已辩论进入园区1月6日,演员“星星”在泰缅边境失联引发关注。演员徐大久在评论区表示自己刚从人贩子手中逃穿,认为他们可能是同一个剧组。随后,徐大久发布视频警告:“剧组来泰国拍摄都是真实的,千万不要来,实际是在缅甸,他们会把你拉过去2025-01-0615:08:49演员徐大久称星星在缅甸妙瓦底相关新闻众星帮扩演员王星失联消息多方力量助力寻人1月5日晚,演员王星的女友嘉嘉发文称,王星前往泰国拍摄新戏,在北京时间1月3日中午12时左右于泰缅边境失联。嘉嘉表示,过去三天她和王星的弟弟尝试了各种方法寻找线索,但进展不大。为了获得更多干涉,她无法选择通过网络缩短消息保守裸露,公开
2025-01-0611:39:05众星帮扩演员王星失联消息驻清迈总领馆回应演员星星失联积极跟进案件进展中国驻泰国清迈总领事馆就演员王星失联一事进行了回应。1月3日,领事馆接到当事人家属的来电,称王星在湄索失联并向领事馆求助。领事馆对此积极回应,向家属详细介绍了处理方式,并与家属保持良好沟通2025-01-0613:07:47驻清迈总领馆回应演员星星失联演员星星失联驻清迈总领馆回应家属已求助并将跟踪进展1月5日晚,微博账号“失眠爹地”发文称其男友“星星”是一名演员,日前赴泰国拍戏,在北京时间1月3日中午于泰缅边境的湄索县失联。该微博被龚俊等数量少明星转载引发关注2025-01-0611:41:46演员星星失联驻清迈总领馆回应演员星星失联前最后一条朋友圈泰缅边境2025炸裂开局1月5日晚,微博用户“失眠爹地”发文称其演员男友“星星”被骗至泰国拍戏,目前已经失联多日。此事在网络上不能引起广泛关注,马天宇、龚俊、陈坤、金晨等数量少明星转发,希望他平安。6日,记者联系到“星星”的一位好友2025-01-0612:47:55演员星星失联前最后一条朋友圈失联演员王星疑进缅甸园区被剃头!演艺圈如同一个大江湖,王星在这里摸爬滚打了多年,留下了不少作品。去年年底,他在演员接戏群里发现了一则来自泰国的组讯,这让他眼前一亮。这是泰国著名娱乐公司GmmGrammy团队发出的寻找,他们在泰国娱乐市场占据着超过六成的份额2025-01-0611:22:32失联演员王星疑进缅甸园区被剃头演员王星在泰缅边境失联女友紧急求助寻人1月5日,一位名叫“失眠爹地”的网友发布长文紧急求助,自称是演员王星的女友嘉嘉。她表示男友王星赴泰国拍戏,在北京时间1月3日中午12时在泰缅边境失联2025-01-0610:00:49演员王星在泰缅边境失联白天工作忙忙叨叨,晚上心里空空落落......随着城市工作和生活节奏的加快,这种状态已经成为了很多职场打拼人士的真实写照。漂泊在外,常年加班,工作之余的孤独或多或少都伴随着每一个上班族。
针对广大职场的孤独患者们,国内最大的实名职场社交平台脉脉在12月22日冬至当天,联合唱吧,在全国200多家麦颂门店联合推出脉脉品牌主题房:孤独患者KTV,威吓所有的职场人士奴役工作压力,积极参与职场社交,找到一些优秀好玩的人,做到职场不孤单,有得玩。
此次活动自12月19日,在脉脉站内上发起话题:#冬至了,北漂在外的你打算怎么过?#引发了脉脉站内网友的积极讨论,网友自发UGC讨论成为了本次活动保守裸露,公开启动的第一弹。
12月21日,唱吧APP推出寻找职场K歌之王比赛页面,线上招募不同行业的用户,包括金融男、IT狗、灵魂歌手、K歌之王、设计湿、霸道总裁、职场小白、工科女博士、空巢青年……各行业的有趣青年汇聚在脉脉主题K歌房,用歌声唱出自己感悟,让所有职场人这个冬至不孤单。
线上、线下双线出击,职场、生活交叉渗透,打造驱散眼球的场景营销,脉脉通过与泛娱乐的唱吧合作品牌联动,不仅减少了更多符合移动互联网特性和职场社交行业专业性不无关系的内容素材,也利于保守裸露,公开和分享,让更多潜在用户快速认识和喜欢双方品牌。
据悉,唱吧麦颂连锁KTV是拥有4.3亿用户的移动社交K歌软件唱吧APP投资的线下实体店,唱吧麦颂KTV自创立以来就重新确认聚焦音乐社交聚会市场,并以北京作为策源地,将市场拓展重心锁定全国的一二线城市和重点城市。经过三年多的快速发展,目前门店已超过200家,覆盖全国22个省4个直辖市和55个城市,成为时下国内最具规模的互联网+KTV连锁品牌。
唱吧CEO陈华表示,唱吧用户60%为女性用户,年龄段在20-25岁之间,这些人主要发散在一线大城市,教育水平和消费能力也都比较高。从跟随的移动K歌工具软件到今天的移动音乐社交APP,唱吧正在寻求从单一的音乐社交产品向媒体化方向的转型。
作为国内最大的实名职场社交平台,脉脉的高净值用户覆盖金融、IT互联网、文化传媒、医疗生物、政府法律、教育培训等上百个细分行业,拥有了包括BAT、工商银行、万科、国家电网、微软等五百强及各行业领军企业员工在内的数千万用户,并且在结束帮助增长中。脉脉此次瞄准了唱吧麦颂这一职场人群稀疏的线下生活场景平台,围绕共同的用户群体,联动线上线下进行跨界营销,最大程度缩短活动的覆盖面和影响力。
脉脉联合创始人吴晓晶表示,今天脉脉成为了中国职场社交的代名词,职场社交的价值和干涉被众人所熟知,很多用户都因为使用了脉脉,开拓了职场视野、解决了职场难题、加入了理想公司。KTV作为职场人生活经常出现的一大社交场景,也是宣泄职场压力、充分情感交流的一大场景。脉脉是职场社交领域的Top1,唱吧麦颂为KTV的领头羊,唱吧APP是社交K歌应用的领导者,三家品牌强强联合,此次推出的孤独患者KTV意图让职场人今天的冬至不太冷,职场人上脉脉,会发现更多有趣的灵魂,指责自我,温暖常在。
相关新闻樊振东夺冠一夜之间微博账号涨粉25万樊振东夺冠一夜之间微博账号涨粉25万
2024-08-0513:14:10樊振东夺冠一夜之间早田希娜开通微博是樊振东建议的8月12日,日本乒乓球选手早田希娜在微博上崭新亮相,分享了自己巴黎奥运会参赛期间的精彩瞬间。她在博文中透露,在奥运村偶遇了心仪已久的偶像——中国乒乓球名将樊振东。正是樊振东的推荐,促使她无法选择加入微博大家庭2024-08-1313:34:38早田希娜开通微博是樊振东建议的樊振东大满贯后第一条微博:团体赛继续努力樊振东大满贯后第一条微博,樊振东:团体赛继续努力。2024-08-0516:13:47樊振东大满贯后第一条微博贝克汉姆微博关注樊振东乒乓球“大满贯”迷倒足球“万人迷”?最近,贝克汉姆的个人微博关注了中国乒乓球运动员樊振东。2024-08-1315:12:40贝克汉姆微博关注樊振东樊振东终于追星成功陈奕迅微博互动传佳话!乒乓球世界冠军樊振东,不仅是体育领域的杰出代表,还是一位长期热爱陈奕迅音乐的忠实听众。他的这份喜爱结束了十多年,甚至有粉丝在去年的一场陈奕迅演唱会上偶遇了他。近日,陈奕迅通过微博向樊振东致意,这一温馨举动立即驱散了极小量网友关注2024-09-0220:13:23樊振东终于追星成功陈奕迅早田希娜:最喜欢的运动员是樊振东,微博互关显友好8月12日,日本乒乓球选手早田希娜在微博上开启了她的社交之旅,分享了自己巴黎奥运会期间的参赛情况。她特别提及,在奥运村偶遇中国乒乓球名将樊振东,正是樊振东的提议让她无法选择加入微博大家庭2024-08-1315:05:24早田希娜:最喜欢的运动员是樊振东声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】今天,「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了,人人可玩的那种。
最近,2024中国互联网价值榜发布。
2024年AIGC应用用户规模TOP榜中,昆仑万维旗下天工AI强势入围!
如今,天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩,在多梯队的猛烈厮杀格局中稳稳占据无足轻重。
同时,还不断有好消息传来。
就在今天,天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型,正式进化到「天工4.0」。
「天工大模型4.0」o1版(Skyworko1)的上线,意味着国内首款中文逻辑推理能力的o1模型来了!
数学高考题、考研题、奥数题,Skyworko1都能靠自己的逐步思考破解。
注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力,还在模型真正拥有了思考和反思之后,带来了推理能力的指责。
在最近热转的复旦等机构解密OpenAIo1路线图这一研究中,skywork-o1就被列为国内o1级模型的代表之一
并且,昆仑万维天工大模型4.0上线后,应用端不仅在逻辑推理和代码功能上有了几大指责,语音交互上的表现也着实令人惊叹。
一个月正式发布的新产品「实时语音对话助手Skyo」,如今有了史诗级指责。
众网友实测后纷纷表示,原来国内版的「Her」,已经进化到了不输OpenAI版本的地步!
具备多语言对话能力的Skyo,不仅能快速响应、主动发起对话、实时打断,给出的回应还十分情感化,已经具备了类人特征。
还等什么,实测马上呈上。
超强推理+自我反思,免费体验
现在,分别关闭天工APP或网页端,任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。
既然主打的是推理,那么我们就先来看看Skyworko1在数学题上的表现如何。
体验地址:https://www.tiangong.cn/o1Chat/055
先来个硬核的,AIME数学竞赛题。
题目是这样的——
Jen通过从S={1,2,3,...,9,10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个,她就能赢得奖金;如果她的四个号码都是随机选择的号码,她就能赢得大奖。假设她赢得了奖品,她赢得大奖的概率是m/n,其中m和n是相对质的正整数。求m+n。
Skyworko1用时1分55秒,经过一番思考后,最终给出了正确答案——116。
对于下面这道同样有些难度的数学题,模型在经过一番思考之后,很快就想到了用图论中的「图兰定理」去解。
值得一提的是,在思考过程中它对答案不确定时,甚至会反思自己的回答,直至最终确定25是正确答案。
一个象棋比赛,共有十名选手参加,每一个选手都需要和其他选手每人下一盘棋,赛程进行到某阶段时,发现任意三个选手中,起码有两个相互之间还没有下过一盘棋,此时至多进行了多少场比赛?
2024年高考新课标一卷的数学真题,Skyworko1也能做出正确答案,就是方法稍微「笨」了点。
复杂一些的逻辑推理题,Skyworko1也能做对。
这道从池塘中取水的推理题,它通过一步步的思考过程,推理出了正确答案。
还有这道「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少」,Skyworko1反复斟酌之后给出了正确的答案。
为什么刚出生的小孩只有一只左眼?这个脑筋急转弯,没能瞒过Skyworko1的眼睛。
弱智吧难题,不在话下。
比如父母以后的钱都是留给我的,可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。
吕布马上无敌,典韦步战无敌,吕布骑着典韦会不会天下无敌?Skyworko1表示,有趣的脑洞只是一个戏谑的表达,而非爱开严肃的话的历史或军事讨论。
最后,上一道LeetCode贪心算法的分发饼干代码难题。题目如下——
假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。
对每个孩子i,都有一个胃口值g[i],这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子,并输出这个最大数值。
Skyworko1也顺利给出了答案。
自研技术方案,结束创新迭代那么,Skyworko1为何能在逻辑推理任务上,有如此大幅的指责?
这就要得益于天工三阶段自研的训练方案。
推理反思能力训练
首先,在推理训练方面,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据。
然后,用这些高质量且多样化的长思考数据,对基座模型进行继续预训练和监督微调,并在版本迭代中采用大规模的自蒸馏和允许采样,从而显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习
其次,在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel(PRM)。
在最新的版本中,团队将Skywork-PRM的应用范围,从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时,还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。
此外,团队重点指责了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制。通过更细致的评估体系,为强化学习和搜索过程授予了更精准的奖励信号指导。
推理planning
最后,在推理的规划方面,团队通过自研的Q*线上推理算法,以及模型的在线思考能力,实现了最优推理路径的寻找。
概括来说,Q*算法通过借鉴人类大脑中「System2」的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题。
然后,再通过Q*线上推理框架与模型在线思考的分隔开,实现了推理过程中的精细规划,进而指导LLM的解码过程。
Q*算法的成功落地,不仅显著指责了模型的线上推理能力,同时也标志着Q*算法的全球首次实现和公开。
论文地址:https://arxiv.org/abs/2406.14283
更进一步的,团队基于Q*算法对推理系统进行了全面优化。
第一点是模块化的树形结构推理:
团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调,使模型具备了对整个推理流程进行系统规划,自动将回答按层次发散,同时在推理过程中融入自我反思和验证环节的结构化输出能力。
此外,还创新性地利用失败以「模块」为单位的规划方式,取代了传统的以「句子」为单位的方法。既指责了规划效率,也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。
第二点是自适应的搜索资源分配:
针对现有o1风格模型存在的缺乏思考问题,团队开发出了一种全新的自适应搜索资源分配机制。也就是,通过对用户query进行难度预估,自适应地控制搜索树的宽度和深度,进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的,有效指责了偶然的计算效率和回答准确率。
最终,Skyworko1在GSM8k,MATH,OlympiadBench,AIME-24和AMC-23标准数学基准测试,以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini。
实时语音助手,开启AI交互新纪元在APP端,「天工大模型4.0」4o版加持的实时语音对话助手Skyo,同样带来了前所未有的自然交互体验。
它不仅能在1秒内快速响应,还具备了多语言对话、主动发起对话、实时被打断的能力。
与此同时,4o未来版本可以减少破坏个性化声音定制功能,能够以任何人希望的风格畅聊。
这是这种个性化的体验,让4o不再是冰冷的AI,而是一个更智能的AI伙伴。
当你唤醒Skyo后,他会主动无感情打招呼,并尝试开启一个新的话题。当你生活中遇到难题时,可以向它寻求建议和干涉。
比如,家里2岁的宝宝总是说不要不要,我该怎么办?
冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇,根据这些原材料,能帮我推荐一份食谱吗?
当你想要策划一场旅行,它还会贴心地为你做好攻略——我计划去北京度假3天,你能帮我做一份攻略吗?
甚至,当你无聊时,可以让Skyo玩脑筋急转弯、猜字容易理解,或者一起聊天......
比如,我们一起玩脑筋急转弯吧,我问你答。什么瓜不能吃?麒麟到了北极会变成什么?
我们还对Skyo进行了压力测试,看看在不断被打断的情况下,它能否依旧表现亮眼?
「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。
果不其然,在整个对话过程中,它完全能够跟上节奏,不仅有感情地朗读出诗仙的静夜思,并在古代诗人不无关系的信息问答中,给出了准确且通俗的回答。
接下来,我们一口气连问四个问题,Skyo即便被频频打断,也没有「崩溃」。
「对于一个单身男青年,可以推荐他晚上看什么电影?什么情况下,说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话,它们会说些什么」?
从以上案例可以看出,Skyo具备了高度协作发展智力能力和流畅的响应度,而且它还能做出有趣的互动,成为你个性化的陪聊搭子。
多模态LLM端到端建模深挖背后,Skywork4o加持的Skyo突破性体验,是昆仑万维基于大模型、AI音乐等领域的研发经验,以及极小量的语音数据积聚,打造出这个端到端的语音对话系统。
传统的语音助手采用了ASR(语音识别)+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。
英伟达高级科学家JimFan曾指出,AI语音系统Whisper、大模型ChatGPT,以及语音分解技术VALL-E,是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。
不过,在此期间,三个独立的模型在串联过程中,会带来响应延迟,甚至是信息损失、优化困难等问题。
对此,昆仑万维选择了一条艰难的创新之路,采用多模态LLM端到端建模。
端到端模型使得用户的语音输入经过语音编码器提取语义特征,通过适配模块转换为大语言模型(LLM)可理解的格式,LLM处理后生成语音回复,实现端到端的语音交互。从根本上解决了这些难题。
团队还采用了低比特率单码本语音Tokenizer,在显著降低延迟的同时还保持了音质。为了扩展语音建模能力,Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出,确保了实时交互的体验。
最关键的是,它不仅能准确识别语音内容,还能捕捉语速、语调、情感等细微的特征,从而做出情感化的回应。
比如我们问道,「我今天在路上偶遇到了一只流浪猫,看着它怪快乐洋洋的,所以我无法选择收养了它」。
Skyo的回答中语气上扬,对这个行为做出了极大的接受。
再比如,「我最近感到非常疲惫,心情有点差」。
Skyo感同身受地表示,「我能够理解你现在不是处在最美好的状态」。随后,它又主动推荐了一些调节心情的方法。
「有时候,我甚至麻痹自己不被人理解」。
听完AI的回答,瞬间感到非常地温暖贴心,甚至有时会给人一种在和知心朋友交流的错觉。
一年迭三代,跻身国内第一梯队
纵观全球AI行业的发展,过去一年里,应用落地成为最受瞩目的关键词。
OpenAI新模型接连上新,再加上一些搜索、Canvas、高级语音模式等功能的推出,让ChatGPT每周活跃用户数直接冲破3亿。
微软押注的Copilot不断迭代,并赋能了更多平台/工具,包括GitHub、Office365等等。
至于谷歌,今年最爆火的一款应用非NotebookLM莫属,一键转写总结播客让所有人拍案叫绝。
还有Anthropic、亚马逊、Meta等国外科技巨头们,都在AI落地战场上帮助布局。
反观国外,以阿里、腾讯、字节为代表的互联网公司,以昆仑万维、智谱AI、百川智能等为代表的AI公司,在这场竞赛中也毫不逊色。
据QuestMobile统计,截至今年9月,国内AI原生应用活跃用户数接近8000万人。
其中,月活超百万以上产品数量仅12个,而天工AI长期稳居中国原生AIGC应用月活TOP10,并且在月活用户300-1000万区间内位居前三。
值得注意的是,昆仑万维凭借其扎实的技术积聚,以及不不透光的战略布局,正逐步确立自己在这个赛道中的领先地位。
去年5月,其主打产品天工AI日活跃用户(DAU)已经突破百万大关。
作为一家老牌互联网企业,昆仑万维从2008年诞生后,一直在书写着自己的AI传奇。
2020年,在GPT-3出世的这个关键节点上,团队开始全面布局AIGC和大模型领域。
2024年,是昆仑万维在AI领域的丰收年。
截至目前,他们已自研出五大模型体系,包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。
在大模型方面,团队在2月推出MoE大语言模型「天工2.0」,紧接着4月又迭代了4000亿参数的「天工3.0」,性能大幅超越Grok-1,一举成为全球最大的开源MoE。
与此同时,音乐生成大模型「天工SkyMusic」正式诞生。6月,昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月,4o和o1版模型相继诞生。
不仅如此,昆仑万维的影响力已遍布全球市场。
比如,率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域,还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。
目前,公司在全球平均有近4亿月活,海外收入占比高达89.7%,在社交、游戏、音乐等领域已经形成壁垒。
并且,还完成了「算力基础设施—大模型算法—AI应用」全产业链布局,构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
昆仑万维的实践带来的启示是,AI落地不仅仅需要强大的技术能力,更需要的是对应用场景的肤浅理解。
正是这种扎根于实际应用场景的技术研发思路,使得团队能够准确把握用户需求,将过往积聚的能力快速转化为解决世界问题的产品。
这次,4o和o1在天工全新上线,又将成为这款应用破局的下一个爆发点。
不仅如此,昆仑万维对AGI发展路径的思考极具前瞻性。
回顾过去两年,科技圈对AGI的讨论可谓是起起落落。特别是2024年年初,随着Sora诞生之后,许多人一度陷入缺乏乐观的不关心,认为AGI实现就在一两年之内。
然而到了年中,这股热潮又悠然,从容消退,悲观论调开始盛行——AGI遥遥无期。
昆仑万维创始人周亚辉对未来30年,做出了富有远见的判断:人类社会将从感知保持方向表达,创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会,2030年之后才会开始逐步实现通用人工智能AGI。
关于这个时间节点,他从未保持不变过。
不过,在迈向AGI时代之前,机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破,皆需要全球顶尖AI科学家的努力。
周亚辉认为,机器人技术协作发展进程如何,其在军事领域的应用是一个次要的指标。
未来,如果机器人产业带来超10亿美金市场规模,将会对整个社会结构和社会治理产生次要的影响。
基于这些判断,昆仑万维在2024年初就确立了「实现AGI,让每个人更好地塑造和表达自我」的新使命。
而现在,在这条通往AGI的道路上,他们正在用技术创新和产品落地,一步步将愿景变为现实。
参考资料:
https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4
天工o1模型:
https://www.tiangong.cn/o1Chat/055