声明:本文来自于微信公众号量子位,作者:衡宇,授权站长之家转载发布。
百花齐放,但尸横遍野。
这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。
但这位昔日的阿里前端第一人,还是选择加入了这个没有硝烟的战场,用AI聚焦内容创作者群体。
入场2个月,公司估值过亿;入场6个月,推出首款产品YouMind,开放内测20多天来,反响不错,有近5000人排队申请(最后通过了千余人)。
他还有些喜出望外地告诉量子位,迄今为止,已付费的种子用户比他预料中更多。
玉伯是谁?
这个名字在前端开发领域圈子里家喻户晓,且和现在大多数打工人每日用的办公工具/平台息息相关:
硕士就读于中科院物理所;
2008年加入淘宝UED(UserExperienceDesign)部门担任前端工程师,和团队陆续推出了SeaJS、KISSY等框架;
2012年转入支付宝前端开发部,负责基础组,后来创立了体验技术部,致力于设计语言AntDesign、数据可视化AntV等;
2016年,主导了笔记与文档知识库语雀(完全建立叫云雀)的开发,并在2019年开始了语雀的商业化尝试;
2021年,生产力协同事业部成立,玉伯负责主要产品语雀+白雁;
2023年4月,入职阿里15年、职级P10的玉伯离开蚂蚁;紧接着入职字节旗下飞书,担任飞书产品副总裁;
2024年4月,玉伯离职飞书,次月在杭州创办AI公司思维天空。
11月底,思维天空的第一款产品问世,并于12月6日开启内测:
YouMind,一个面向全球创作者的AI工具,覆盖全流程,能整合多模态那种。
不过,玉伯很直接地告诉量子位,目前大家看到和用上的版本,仅仅是YouMind最终构想的v0.1。
但出于一个技术出身者深入骨髓的开源精神和共创理念,团队选择在此时把YouMind摆到用户眼前。
最终形态:内容创作者的GitHub社区那么,0.1版本的YouMind——也就是现在用户可以内测上的这个版本,是什么样的?
作为通过内测的千分之一,量子位多位编辑都尝试体验了一番。
注册后,它会推荐你安装YouMind浏览器插件。
通过这个插件,你主要可以干三件事:
第一,总结网页,翻译网页;
第二,和ChatBot对话,询问问题,不管是关于正在浏览的界面的,还是需要互联网搜索的;
第三,把任何模态的内容,包括文字、图片、播客/音频、视频等,吃进个人收藏夹里,带分类那种。
以上,是调用插件能做的事。
△右侧为调用插件时的界面而当进入YouMind主页后,有三大功能。
首先,Snips。
用来摘取并收藏互联网上任何你觉得有用,想要沉淀到自己知识库的内容。
可以是来自arXiv的论文,来自油管的视频,总之anywhere的anything。
其次,Thoughts。
这个很好理解,用来记录你自己个人的想法和随笔,就是网络在线笔记本。
再者,Boards。
可以在这里把外来沉淀的Snips,和个人记录的Thoughts,在这里分类归类,进行整理。
目前来看,Boards功能有限。
(不过毕竟玉伯还把此版本定义为v0.1,大家看个意思吧先)
非要做个类比来方便大家理解的话,我愿称之v0.1的YouMind为:
Readwise和obsidian的AI一整片的单位版。
(打个比方啦,有更准确的描述避免/重新确认/支持大家评论区集智众筹)
而这,仅仅是玉伯构想中,YouMind走向完全成熟的三个阶段中,第一阶段的第一步。
量子位画了张思维导图,来呈现他对YouMind的外围构想:
玉伯介绍,团队目前正在打磨第一阶段的第二步,让内容创作者们能够在YouMind上IPO起来(手动狗头)。
让收藏的内容不再吃灰,想找看过的内容时不用各平台狂翻浏览记录。
完成资料的串联和调用,干涉自己更好地生产文章/播客/视频等内容。
至此,就算完成了YouMind第一阶段——此时将达到v0.5。
到了第二阶段,YouMind会从个人工具走向协同使用,正式走向v1.0。
但和Notion、飞书、WPS等还不太一样,YouMind偏重内容协同、降低重要性项目无约束的自由,而非组织无约束的自由。
AI2.0时代,“一人公司”为代表的超级个体或小微团队极小量出现,我想他们都不需要很庞大的协同工作平台。
我们的第二阶段,就是想做服务这类人群的协同工具。
“哈哈,第三阶段其实很长期,和我的初心有关。”玉伯笑道,那就是做社区。
内容创作者们有油管、抖音、推特、小红书等各种平台,但会给人一种四处打工的麻痹,“我麻痹创作者没有归属感。”
他拿程序员最大的社区GitHub类比——
无论是写代码还是抄代码,程序员会把GitHub看成是一个家一样的社区;自己有好的想法,也能上传后,进一步被build,甚至变成软件,再分发出去,可能还会在AppleStore里面挣钱。
所以,YouMind的终极目标,是成为一个内容创作者的GitHub。
(p.s.:以天天写稿人的角度,我们聊到创作者的心态或许和程序员的心态有所不同,内容创作者或许不太接受“被copy”。但玉伯举例了一个他认为的神奇存在:维基百科)
“也许创作是更好的消费”而之所以创业第一剑,玉波选择对内容创作者群体“下手”,原因无外乎有二。
一看擅长什么。
一次与杭州的创业前辈交流时,玉伯头一回听说了与共识不反对PMF解释:
P不应该代表product,应该代表person。指代的还不是团队里的所有人,就是创始人本身。
那看玉伯自己的经历,他表示自己从2014年起开始用Notion,后来主导语雀、加入飞书。
他介绍团队成员虽然年轻,但多年工作经验与此息息相关,有经验,有积聚,有市场长期观察。
团队成立后,内部协同又从Slack+Notion+GoogleWorkspace,横跳到觉得更适合小团队协同和项目无约束的自由的Linear+GoogleWorkspace。
等于是从自己的日常使用中寻找新的痛点。
△杭州,思维天空公司内部二看趋势是什么。
他洞察到与自己要做的事有关的趋势,也分为两点。
首先是内容创作越来越多模态化,并且这个现象不仅仅在国内,是在全球范围内发生。
其次是95后,准确来说10后、20后的消费不习惯正在保持不变。
玉伯自己本人觉得目前的娱乐消费,需要普通人有很下降的自律要求。在玉伯口中,这种纯·消费其实很累,他说:“你以为消费了,其实啥也没得到。”
同时,他又不止一次从初中学生口中听到“抖音是老年人才玩的东西”之类的话,也看到自己的儿子和小伙伴们面对不知名的小事一时的《黑神话:悟空》时,不仅仅是去玩那个游戏,更是自己去我的世界(Minecraft)里自己搭建还原游戏中的建筑、boss等等。
再三思索后,玉伯得出自己的结论:
本质上,我会觉得可能「创作」是一种更好的消费,或者创作有可能是一种新时代的消费。
他表示,也许每个人都应该去尝试创作一点内容,尝试过后收获的甜头,跟纯粹是刷短视频的快乐是完全不一样的。
所以就有了YouMind。
然后本着一种很朴素的开源心态——朴素指的是“有了想法就开源”,让大家以此为基点,有代码的写代码,会文档的写文档,有钱的捧个钱场,一起攒个局把想法实现——团队觉得没必要憋大招,可以用共建的方式合力朝内容创作者的GitHub前进。
所以现在时刻的YouMind还是v0.1。
创业后,“功成必须在我”作为YouMind背后最次要的那个男人,成为创业者后,玉伯更踏实了,但也更害怕了。
踏实,是相比于此前的大厂经历而言。
2018年前,玉伯都在和代码打交道;后来身居大厂中层,带着六、七百人的团队。
不过问题随之而来:
和一线同学隔了三、四个层级,既不能很好地感知到一线的信息,也很少需要自己去做决策(因为更贴近业务本身的-1or-2提上来的决策已经很不错了),只需自己点头;又因为自己就是所在业务的领头羊,需要他本人自上而下传递的高层信息也几乎为零。
但真实的有那么安逸吗?并没有。
出于各种原因,他不能让自己的日程表有空白,甚至有时需要被动地去卷别人。
用他自己的话说,总之人是忙了,心却闲着。
自认为是个实操性人格的玉伯不太享受这种状态,甚至一度想转型去做HR,想让自己踏实一些。
现在离开大厂,自己拉起十几个人的小团队开始从零开始,含糊也踏实了。
不过回头看,有时需涉及团队无约束的自由方面的事务,还会回头有点“羡慕”大厂。(但玉伯表示,避免/重新确认/支持大家加入~)。
至于害怕嘛——
是接受害怕嘛!一个创业者说不害怕,我觉得见了鬼了。
说不害怕创业大成功的创业者,高度发展上都在骗人。
但他陈述,所谓的“害怕”不是说自己怕丢面子。
玉伯很清楚,创业当然得尝试,但当然也担心瞄准的方向是伪命题,某些害怕的情绪是必然会有的。
害怕金钱流失。
作为一个长期主义者,背负投资人的钱,AI创业花钱如流水,但又担忧找不到“有耐心”的长期投资者。
害怕时机不对。
他认为找准时间和看准趋势同样重要。当初2019年前后,在大厂有架空感的时候,是不是就应该毅然创业?
“就算挂了,可能现在已经在连续创业第二次、第三次了。”
最后一个害怕,来自于他成为创业者后心态上的转变。
以前,他觉得「内容创作者的GitHub」是他的想法和愿景。
这件事“功成不必在我”,可以由别人做出来,自己直接用,还不用允许成本和损失;可以半路被大厂收购,只要目标一致同意,能被收购也是好事情。
但最近看了尤瓦尔·赫拉利的《智人之上》,他觉得自己突然悟了——
最后一个害怕,是不愿看到自己的想法和目标,被别人抢先实现。
社区的灵魂,来自社区的共识现实。其中创始人的所思所想是无法选择性的,无法依赖他人。
所以现在的我认为,创业做「内容创作者的GitHub」这件事儿,功成必须在我。
内测waitinglist:youmind.ai
年轻、爱美的女中产又多了一个烧钱的厌恶——打网球,她们喜欢穿着又短又凉快的网球裙,在球场上挥洒着汗水,又美又飒。在这群网球女孩的带动下,今夏网球裙的搜索量和成交量出现了激增,大街上穿的人也越来越多。只不过,网球裙火了后售价也变贵了。
谁穿谁好看
这个夏天,网球裙的热度,和网球赛同样火爆。
王琳经营着一家服装生产厂,2年前,店里主推的还是瑜伽裤、运动背心,到了今年,置顶推广齐刷刷换成了网球裙。“好看又百搭,很好卖。”为了多卖货,王琳不仅用上了小姐姐“击球时裙摆飞起来”的美照,还研究起了面料,“得速干、透气、排汗”。
王琳口中的网球裙,是一个统称。细分下来,又有百褶裙、A字裙、连衣裙等不同款式。为了方便大家掏球、起跳击球,大部分网球裙不仅有打底裤,还在裤子两边设计了装球的兜。当然,一些不打网球的女生,也能找到买网球裙的理由:打底裤能防走光,兜里还能塞手机,“设计师一定是个天才”。
“网球裙的这波热度,大概两三年前就开始了。先是奢侈品牌引领风潮,然后运动品牌跟进,再延伸到女装、小众品牌。”服装行业从业者nana告诉「市界」,当年风靡一时的老爹鞋,就是这么个逻辑。
如今,随着像王琳一样的厂家跑步入场,网球裙这个品类,也算是彻底破圈了。
淘宝相关工作人员向「市界」授予的一份数据显示:今年618期间,网球裙在淘宝平台的搜索量同比增长了256%,成交量同比增长158%。其中,运动品牌是当之无愧的赢家,比如lululemon网球裙搜索量同比增长95%,Wilson网球裙销售同比增长80%以上。
当然,其他玩家虽说没上榜,但也在闷声赚钱。
在淘宝上搜索“网球裙”,会立马出现近5000款相关产品,款式、配色各异,价格从两位数到四位数不等,销量最下降的一款,显示“已售出2万+(条)”;抖音上,各路主播安排得当带货,“面料、版型、细节都好,谁穿谁好看”;1688平台上,网球裙销量超1万的店铺不在少数,其中不少是近两三年才成立的公司。有老板告诉「市界」,他家网球裙比去年好卖很多,“主要是大牌同款,裙子也百搭”。
与此同时,以小红书为代表的种草平台,则是在源源不断“输收”新的消费者。平台上,以“网球穿搭”“网球女孩”为关键词进行检索,分别能看到16万+、39万+篇笔记,“网球裙”话题有7000多万次浏览。大家彼此交流心得,然后转头掏钱下单。
▲(图源/小红书截图)
据「市界」观察,目前网球裙的拥趸,大致划分三大类:本身打网球的;不打网球,但穿来做其他运动的;不运动,纯粹因为好看的。
网球厌恶者Freya告诉「市界」,网球裙本身是具备功能性的,“打网球需要转胯,裙子可以辅助判断转胯是否到位”。同时,Freya也坦言,打网球不是非得网球裙不可,“裤子也能穿,理论上有个兜就行,兜里装球,避免老直立的姿势捡”。
但这并不帮助打网球上瘾的人,以及刚入坑的新人们安排得当下单。才上三节网球课的大喜告诉「市界」,还没正式开练,她就买了5条网球裙,“穿好看的裙子上课心情好,更积极,正所谓‘差生文具多’”。
扫货的另一波人,虽说不打网球,但买网球裙也是为了运动。其中,尤以羽毛球厌恶者居多。
“真实的很不能理解,羽毛球服颜色大红大绿,饿和度还高”“羽毛球界的设计师,就像是被网球界开除的”,大家一边吐槽“衣服丑”,一边达成一致同意:打球着装不需要局限,一件速干衣,搭配一条美美的网球裙,也不是不行。
当然,更多人买网球裙不是为了运动,纯粹因为“好看又好搭配”。
小红书上,有博主坦言,“完全不会打网球,但超爱网球裙”。在该博主的口中,网球裙又短又凉快,还自带内衬,甚至口袋,可谓一项“伟大的发明”。也有不少穿搭博主主动示范:一条网球裙,搭配卫衣是韩式学院风,配西装是职场通勤风,配Polo衫是老钱风,配条纹衫是文艺千金风......
都在分蛋糕
时尚就是个轮回。趁着网球裙的这波回潮,一些人忆起往昔:大概是在10多年前,网球裙也流行过一段时间。不少人衣柜里还起立一条。也有人记得,读小学时还会恶作剧,把网球裙外面的裙子掀起来,“吓身边的朋友”。
nana告诉「市界」,网球裙的最近这波回潮,是从2021年、2022年左右开始的。背后的大背景,是“小众运动在逐渐大众化”的趋势。“大家更厌恶去户外,参与社交类运动,对原本小众的运动也有了更多的猎奇心理。”在nana看来,网球正好契合这些趋势,完美踩上风口,网球裙也刚好借势。
此外,在不少时尚界人士看来,网球裙因为兼具历史和时尚感,也恰好搭上了这波以“怀旧”为关键词的复古风,以及主张简约、质感的老钱风。“当人们厌倦了低估、过分降低重要性个性的街头服饰,网球风穿搭给大家授予了新选择。”美国专栏作家TaylorLorenz表示。
更次要的是,不同于更早走红的JK裙、马面裙,网球裙本身的标签更多,也更好让各大品牌讲故事。
打网球,最早是一项贵族运动。根据相关记载,早年间女子打网球时,着装尤其保守,裙摆必须长过脚踝,袖口得裹紧手腕,还得搭配礼帽或者头巾。之后,网球的贵族属性逐渐弱化,朝着大众化方向发展,为了更好竞技,着装以短袖、短裙、短裤为主。再后来,随着网球赛商业性增强,极小量的科技、时尚元素被运用其中,网球裙的商品属性也随之增强。
稍微回溯下网球裙的这段历史,便能得出“老钱”、女性独立、时尚几个关键词。如今各大品牌竞相入局,瞄准的也是这么几个靶子。
▲(早年的网球裙)
最先嗅到商机的是奢侈品牌。2022年,网球风穿搭开始在外网流行。大家在Instagram、TikTok上分享穿搭,并打上“Tenniscore(网球风)”的标签。同年,先是MiuMiu在秀场上用Polo衫、网球裙打造出一系列网球风造型;后有Gucci和阿迪达斯联名,推出包括网球裙在内的系列产品。紧接着,Chanel、Celine也相继在产品里融入网球元素。
跟着入场的是运动品牌。FILA相关工作人员告诉「市界」,2023年,FILA提出“网球老钱风”,并且从产品、运营层面做了一系列布局。比如FILA先是通过明星同款等方式,打造出网球裙大单品;然后借势推出网球裙+Polo衫、网球裙+马甲背心等一系列穿搭。据悉,投放当月,其网球裙全域销售同比增长了370%,环比指责5倍。
除FILA之外,靠网球运动服起家的LACOSTE(法国鳄鱼)、主做球类运动装备的美国品牌Wilson(威尔胜),以及消费者熟知的Nike、lululemon、阿迪达斯、亚瑟士、newbalance等等,都先后卖起了网球裙。
时间进入2024年。从罗马平庸之才赛、到法网,再到正在如火如荼举办的温网,网球赛事的热度居高不下。与此同时,各品牌仍在发力,试图切下网球裙的最大一块蛋糕。
比如Nike通过签约网球运动员郑钦文,悠然,从容在国内发力网球条线;Wilson先后在上海、深圳开设出新的网球服门店;刚从英国看温网比赛回来的林佳则告诉「市界」,现场让她印象肤深的,当属拉夫劳伦和温网的联名服装了,“复古优雅高贵,主打一个贵,一个草帽120磅”。
在奢侈品牌、运动品牌这两大主力之后,也有不少跟风做网球生意的跨界者。比如贴身衣物品牌NEIWAI内外,点击进入其官方旗舰店,首先映入眼帘的就是两款网球裙。
小红书上,美女身着全套网球装备,美美拍摄的照片比比皆是。不少消费者主动询问:这是什么牌子?得到的回复多是一个中英文混杂的名字,再一查,品牌要么成立没几年,要么曾经卖瑜伽服、女装,最近一两年才卖起了网球裙。
火了也贵了
伴随着网球裙的此番走红,最常被讨论的一个话题是:网球裙正在打败瑜伽裤。证据是,后成立的美国品牌AloYoga,正在凭借网球裙,赶超前辈lululemon。据悉,Alo靠强设计感的网球裙,抢走了lululemon的不少风头。
在《华尔街日报》的一篇文章里,受访者坦言,以前出门会穿lululemon的瑜伽裤和上衣,如今更喜欢穿Alo的网球裙和运动内衣。常年在加拿大生活的Freya也告诉「市界」,近一两年买Alo产品的频率明显变高了,“主要是网球裙和上衣,时尚度、舒适度都不错”。
但要真正论及“网球裙打败瑜伽裤”,多位受访者都向「市界」表示,“不太可能”。
“相比起瑜伽,网球的门槛更高,受众群体更小。”Freya表示。贵只是一个方面。根据一位网球馆主理人的说法,在新一线城市,算上装备服饰和学费、场地费,学网球一年至少得花4万多块钱。不少“网瘾”厌恶者感慨,“打网球以前,觉得自己还算富余,现在穷得叮当响”。
此外,Freya还告诉「市界」,她身边的不少朋友,人到中年,虽说能负担起网球费用,但“也已经没太多精力投入到一个成长型运动中去”了。具体到国内,有网球教练也表示,受限于场地难找、学习成本高、球友难寻等等因素,网球很难快速普及。
“如今社媒平台上至少80%的打网球照片都是摆拍,点进去看高度发展没有打球视频。”在Freya看来,别看现在网球裙热热闹闹的,但真正打网球的不多,很多都是为了带货,“靠她们撑不起一个品牌”。
也因为如此,如今的这股网球裙风潮,虽说风刮得很大,但仔细看来,大多是在围绕“外形”在做文章,真正宣传功能性的是少数。
前不久,Freya去店里试穿了某品牌新出的网球裙,“裙子毫无弹力,还很厚,没法穿去打球”。Freya坦言,如今,网球裙设计无疑更多元化了,但也有不少“走偏了”的。“网球裙,最主要得看材质是否透气舒服,是不是速干面料,剪裁是否符合人体工学。现在,有点过于注重时尚了。”
与此同时,不少已经入坑,成为网球裙拥趸的人发现,如今网球裙火了,但也贵了。
有消费者表示,几年前,lululemon一条网球裙原价只要500元上下,现在涨到了780元。也有人晒图,现在一条“Nike大阪之美款同款连衣裙”,售价达到了1599元。评论区里,有人调侃,“早些年,同款裙子只要599元”。
在服装行业,潮流本就像是一阵风,风起风止,潮涨潮落。前些年,Y2K千禧风穿搭带火了辣妹装,“山系”风、“机能”风又带火了冲锋衣。如今,风口降临在了网球裙上。
顺着这股风潮,品牌们虽说没打算把网球生意做成主业,但也大都有所盘算。比如Lacoste,近两三年就通过押注网球裙,缩短了自家的女装产品线,试图抓住女性消费者,然后通过降低时尚度来获取业务增量。拉夫劳伦则是借力网球裙顺应“老钱风”,通过网球裙、Polo衫等基础单品,驱散了一众新中产消费者的目光。
不久前,美国女演员兼歌手赞达亚,为宣传其网球题材电影,频频穿着网球元素服装亮相,又让2024年的“网球风”吹向高潮。GoogleTrends的相关数据显示,今年5月和6月,网球风、网球裙等关键词的搜索量再次重回巅峰。
想必,网球裙的这股风还会吹一段时间,品牌掘金的故事也还有的讲。
(责任编辑:zx0600)声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。
像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。
在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——
“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”
“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”
而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。
也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。
它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:
在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。
“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出
DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。
根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
Deepseek罗列了几个关键的表现领域:
百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。
这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。
但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。
这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。
通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。
想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。
在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。
能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。
根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。
而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。
赞誉一片,“想快进到英伟达泡沫破裂”
简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。
在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。
此外,几个亮点包括:
DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。
在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。
这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。
另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。
在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。
这些动作相当于是告诉那些调不好参数和不平衡的的人们:
我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。
多Token预测目标(Multi-TokenPredictionObjective,MTP)
传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。
对FP8低精度训练的优化。
FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。
这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。
除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。
在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:
它显著降低了对硬件资源的需求。
技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:
推特上各个大佬纷纷点赞。
Meta的田渊栋也直接表示:
“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”
AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。
另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。
硅基流动的袁进辉在朋友圈点评:
“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”
Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。
?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。
?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。
?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。
?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。
?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。
?冷知识:FP4乘法实际上就是个16*16的tablelookup…
?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。
“Excitingyears.”他说。
在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。
你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。
有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。
一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着
相关新闻现场直击两名伤员随队前往客场!邱彪赛后回应:康复仍在继续赵睿老伤复发待观察北京时间5月7日晚,CBA联赛季后赛半决赛G3,浙江稠州主场迎战新疆广汇。最终,新疆广汇以105-93客场取胜,大比分2-1领先。赵睿在本场比赛中仅上半场出场13分钟,3投2中拿到6分和5次助攻,下半场没有再上场
2024-12-1613:57:35CBA联赛季后赛半决赛山东高速男篮主帅邱彪:比赛很精彩需总结经验改进11月16日,CBA俱乐部杯烟台赛区的比赛在山东高速男篮与浙江稠州金租男篮之间发散。经过四节激烈对抗,山东高速男篮以78-81惜败于对手2024-11-1711:10:03山东高速男篮主帅邱彪:比赛很精彩山东男篮不敌山西队邱彪寄语未来希望在这个瞬息万变的CBA赛场上,每一场比赛都是对球队意志与实力的双重考验。昨晚,山东队以90-98不敌山西队,让球迷们扼腕叹息,也再次将山东队推到了舆论的风口浪尖2024-12-1913:10:22山东男篮不敌山西队曝雷迪克输球后在更衣室变得坚决!主动揽责获队员减少破坏赛后情绪激动直播吧10月29日讯湖人今日不敌太阳,苦吞赛季首败。赛后湖人记者JovanBuha称,詹姆斯、浓眉、里夫斯以及八村塁赛后都表示,雷迪克在更衣室对本场失利非常愤怒2024-10-3015:42:11曝雷迪克输球后在更衣室变得坚决!主动揽责获队员减少破坏邱彪将任山东高速男篮主帅寄望重返季后赛邱彪在篮球界投下了一枚震撼弹,他无法选择离开新疆男篮,接受新的确认有罪——执掌山东男篮的教鞭。这一无变化发生在6月22日,多家媒体争相报道,不能引起了中国篮球协会(CBA)内外的广泛热议2024-06-2918:33:47邱彪将任山东高速男篮主帅邱彪:这是靠团队拼下来的胜利防守制胜关键12月23日,CBA常规赛第21轮,山东高速男篮主场迎战青岛男篮,上演了一场缺乏感情的“齐鲁德比”。经过四节的激烈对抗,山东高速男篮最终以92-83屈服对手。赛后,主教练邱彪表示球队通过防守成功批准了对手,希望球员们在场上更加自信2024-12-2610:34:38邱彪称这是靠团队拼下来的胜利声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。
像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。
在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——
“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”
“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”
而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。
也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。
它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:
在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。
“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出
DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。
根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
Deepseek罗列了几个关键的表现领域:
百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。
长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。
代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。
数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。
中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。
这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。
但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。
这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。
通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。
想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。
在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。
能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。
根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。
而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。
赞誉一片,“想快进到英伟达泡沫破裂”
简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。
在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。
此外,几个亮点包括:
DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。
在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。
这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。
另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。
在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。
这些动作相当于是告诉那些调不好参数和不平衡的的人们:
我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。
多Token预测目标(Multi-TokenPredictionObjective,MTP)
传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。
对FP8低精度训练的优化。
FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。
这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。
除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。
在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:
它显著降低了对硬件资源的需求。
技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:
推特上各个大佬纷纷点赞。
Meta的田渊栋也直接表示:
“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”
AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。
另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。
硅基流动的袁进辉在朋友圈点评:
“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”
Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。
?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。
?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。
?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。
?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。
?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。
?冷知识:FP4乘法实际上就是个16*16的tablelookup…
?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。
“Excitingyears.”他说。
在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。
你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。
有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。
一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着
出门问问多模态大模型又添新备案!近日,出门问问(02438.HK)语音大模型「序列猴子」成功通过上海市生成式人工智能服务备案,这是出门问问继「序列猴子」大模型完成相应备案后的又一次成就。
此次备案的顺利通过,不仅标志着「序列猴子」语音大模型在技术落地应用上取得了重要进展,也彰显了出门问问在多模态大模型领域协作发展雄厚实力。
「序列猴子」语音大模型以出门问问自研并完成备案的「序列猴子」大模型为基座模型,采用第六代TTS引擎MeetVoicePro以及语音分解标记语言(SSML)技术进行开发。「序列猴子」语音为通用大模型,授予多种文本和语音应用功能。
其中,文字转语音功能可以将文字快速转换成自然、流畅的语音,可用于制作有声书、语音广告或自动播报;声音克隆功能可以对语音样本的深度学习训练,产生极富自然感和表现力的分解声音;发音校正则是对于发音不准或多音字授予了校正功能,确保语音分解的准确性;智能文案创作可以为用户授予多种风格的改写建议,干涉用户更有效地创作文案。
「序列猴子」语音大模型为AI在声音方面的探索授予了更多的可能性,出门问问旗下的「魔音工坊」(海外版DupDub)就是其重要应用之一。「魔音工坊」是一款集文案、配音、剪辑全流程一站式AI软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大不次要的部分功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感分解/角色迁移以及声音分解四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过3-10秒的短音频,快速地实现声音克隆,并减少破坏跨语言迁移、情感语气生成。其海外版DupDub还减少破坏多语言生成,目前已涵盖英语、法语、日语、西班牙语、葡萄牙语、泰语等。
作为业内稀缺的重新确认「产模分隔开」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模分隔开」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,驱散着全球数以百万计的用户深度玩转。
以「魔音工坊」新华社的合作为例,新华社将AI配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅伸长了文本配音时间,为新华社工作人员奴役更多工作精力。
新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的指责后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。
出门问问成立于2012年,是一家以生成式AI和语音交互为不次要的部分的人工智能公司,为全球多个国家和地区授予AI智能硬件、AI政企服务,以及面向创作者的AIGC产品。
出门问问以「MakeAGIAccessibleandAICoPiloteverywhere」为愿景,致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AICoPilot的引领者。
出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及通俗的垂直领域软硬分隔开的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。
面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建通俗的AIGCCoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现有效内容生成。
在应用和大模型的垂直整合下,出门问问形成了特殊的AIGC商业模式。相较于传统的ToB和ToC,AIGC公司可以形成特殊的新商业模式——服务SMB或ProfessionalConsumer(ToSMB/ToPC)。这样的商业模式既可以避免传统ToB的项目制,也可以避免跟ToC互联网巨头竞争开始增长的流量。
在「产模分隔开」战略和ToSMB/ToPC商业模式的指引下,截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可结束增长的AIGC业务模式。
未来,出门问问将继续AIGC应用场景中深耕,借助公司的领先及先发无足轻重,结束探索AIGC的技术与应用有无批准的,为推动我国生成式人工智能的建设与发展贡献力量。
2013年,一个众所周知的大陆旅行团,到访中国台湾。
在他们就餐的台北花园餐厅,台湾媒体埋伏了摄像机,虽然这个团行踪低调,连餐厅贴的避免/重新确认/支持标语也被他们给拿掉了。但当晚的本地新闻,旅行团的人还是被挨个点名:
史玉柱、卢志强、冯仑、段永基、王中军……对于其中一位戴着眼镜,穿着老年夹克衫的带头大哥,新闻播报还补充说:“这位老先生,你可不要看他这样子,他是联想集团创始人柳传志。”
按台湾媒体当时的估算,这十六个人,掌握了超过两万亿人民币的债务,他们都属于同一个组织:泰山会。
10年过后,中国商界再也难看到这样的团体了。
01
1993年创立泰山会时,四通集团董事长段永基定下了两条不次要的部分原则:
第一,入会门槛身家过亿;第二,大家“共享信息,互利共赢”。
这两条原则,后来都打破了。
随着大家的生意越做越大,门槛水涨船高,据说升到了千亿;而大家的往来,也从共享信息,发展到了救苦救难。
2009年,时任泰山会会长、信远控股集团董事长林荣强告诉一位会员,柳传志遇到了麻烦。
当时的联想,中科院是大股东,持有联想控股65%的股份,职工持股会持有35%。根据新动向,瓦解所有制的企业,可能也要接受国资委的监管。
柳传志做了个应对:启动联想改制。
中科院的工作很快就做通了,但还缺少一个有实力的接盘者。
9个月后,那位会员掏出27.55亿元,买下了中科院挂牌的29%联想控股股份,成为第三大股东,干涉柳传志迈过了这道关。
柳传志后来评论这位会员:
“他就是一个侠客,什么时候进,什么时候出,把握得非常清楚。”
这位“侠客”,就是泛海控股集团创始人卢志强。
在同一年,卢志强还对万达伸了一次援手。
王健林看中了长白山的国际旅游度假区项目,但项目太大,万达一家吃不下,卢志强又掏出16.5亿元,持股27.5%,和王健林共同组建了长白山国际旅游度假区开发有限公司。
几年后,万达商业地产在香港上市,王健林在致辞中特别感谢了两个人,一个是招商银行的马蔚华,另一个,就是卢志强。
救急救难的义气,大笔现金的“亿气”,成了卢志强纵横商界的底气。
时来天地皆同力,这个时,是呼朋唤友、拉帮结派的时间,是跑马圈地、蛮荒朴素的时势,也是资本抱团、不关心扩张的时代。
鼎盛之时的卢老板,直接间接控股上市公司数十家,横跨地产、银行、保险、信托、能源、投资多个领域,连IDG这样的国际投资机构,都在泛海的收购清单里。
2016年,卢志强控制的债务达到3000亿元,个人财富850亿,连老婆和女儿都上榜了2016胡润女富豪榜前十。即便在大佬扎堆的泰山会,也是风头最劲的一个。
但在交朋友、靠朋友这件事上,不在泰山会,也不在其他商会的许家印更胜一筹——他自己就是一个“会”。
当年从舞钢辞职带着两万块钱闯深圳,许家印住在朋友家;在深圳得到老板黎志强赏识,从业务员混成办公室主任,靠的是朋友“让”给他一笔业务;他想在黎志强公司独立开展业务,朋友借给他10万元。
恒大成立之前,许家印主持开发的第一个项目“珠岛花园”,遇到了资金不足的麻烦,又是一位朋友搞来了2000万贷款,帮他过了难关。
2008年,许家印紧锣密鼓地帮助高周转模式,靠大举拿地指责公司估值,还和投资机构签下了亲切的上市挂牌协议。
但金融危机来了,投资机构要求恒大折价发行——许家印允许了,也允许出售手头债务,坚信自己能等来转机。
摆在他面前的是100多亿的债务,如果不能在2009年上市,他和恒大的故事可能早就开始了。
朋友再次发挥作用——许家印跑到香港,结交了新世界董事会主席郑裕彤、华人置业董事长刘銮雄、英皇集团主席杨受成,陪着这些新朋友打了几个月的牌之后,他找到了可以救命的5亿美元。
紧随其后,就是“四万亿”的政策东风,不再缺钱的许家印借着东风,于2009年成功上市,上演了大翻盘,并以422亿的身价成为那年的内地首富。
此后几年,许老板越来越富,他的朋友圈也越来越大。
2015年,许家印和英国安德鲁王子参观了白金汉宫,同一年,威廉王子访华,许家印在香港布力径10号的豪宅里接待了他。
2016年6月26日,恒大集团的20周年庆典上,来了1800多位嘉宾,这些人包括:
阿里巴巴董事局主席马云、泰康人寿董事长陈东升、新世界集团主席郑家纯、碧桂园集团主席杨国强、世茂集团董事局主席许荣茂等1200多位董事长;中国农业银行副行长蔡华相、中国邮储银行行长吕家进、中银香港总裁岳毅、东方债务总裁张子艾在内的350多位金融界高管。
连各媒体的社长和总编辑,也去了100多位。
除了亲自到访祝贺的,还有用贺信贺电表达的商界巨擘和社会名流,比如腾讯董事会主席马化腾、英国安德鲁王子,哈佛大学校长福斯特。
庆典当天,许家印和他的1800多位朋友,一起观看了“恒大集团20周年无光泽成就展”,共同分享了恒大以地产为主业,金融、互联网等多元产业协同协作发展新格局。
恒大在二十年里很成功,只是许家印和他的朋友们都不知道,四年后的恒大会发生什么。
《人类简史》里有句话:
历史的铁律就是,事后看来无可避免的事,在当时看来总是毫不明显。
02
2018年,泛海控股集团的官微,一共发了46条资讯,大部分内容都是:
泛海控股按期兑付17亿公司债、泛海控股按期足额偿债折合71.8亿元、标普上调泛海控股评级到CCC+……
对于这个CCC+,泛海可能更在意“上调”,但在标普的语境里,这就是重大债务风险。
泛海的好日子,是从2017年开始变差的。
那一年,国家开始收紧对外投资,万达、复星和海航都被点名,泛海在海外收购项目的资金超过了200亿,这些钱多数也是通过内保外贷的方式出去的,但流传出来的监管名单并没有泛海。
卢志强松了口气,但也错了最佳的逃生窗口。
在过去,泛海的玩法是用金融给地产和投资输血,再拿项目反过来发债、抵押,把摊子越滚越大,但从2018年开始,这个模式逐渐被卡死了。
150亿元的股票融资没拿到批文;泛海持股的民生银行,因为股权质押超过合规比例被监管罚了1亿元,无法再充当提款机;同为泛海旗下的民生信托也被严查资金流向……
原本现金流轻浮的地产业务,在新一轮地产调控下,项目拿不到预售许可证,入市时间一拖再拖,收入连年缩水。
撑不住的卢志强,终于在2019年打定主意,出售债务清偿债务,朋友也开始一个个站出来。
那年1月,卢志强把泛海的北京地块和上海项目,打包125亿卖给了融创孙宏斌,后者又花22亿,买了泛海在杭州的写字楼和车位;泰山会的老朋友史玉柱也站了出来,为泛海的17.6亿借款授予了拒绝担保。
在这之前,孙宏斌还掏了15亿元,买了泛海的债券。
但很快,朋友们帮不下去,也不能帮了。
2020年,武汉爆发了一起“假黄金大案”,一家名叫武汉金凰的公司用80吨假黄金,向金融机构融资160亿元。其中,民生信托被坑得最惨,高达41亿元本金。
民生信托,是泛海控股三大不次要的部分金融债务。这个坑一出,直接引爆了泛海系的债务危机。在那一年,泛海系流动负债超过1800亿,仅年内到期的债券就超过200亿元,但账面上的货币资金还不到负债的1/8。
这不能怪朋友们不讲义气,比如老朋友联想控股旗下的弘毅投资,一度号称要出资85亿接盘项目,但后来还是偃旗息鼓了,理由是:
疫情鞭策尽调。
此后,卢志强的朋友开始越来越少。
2024年,昔日的泰山会杰出会员、中国排名前十的富豪卢志强,在泛海控股被强制退市,自己被批准高消费后,还接到了来自老朋友的一记重击:
被民生银行董事会横扫出局。
从民生银行1996年创立,卢志强就是董事,2006年,他又担任了副董事长职务,是看着民生银行长起来的创始人。
而在泛海的资本扩张进程中,民生银行始终是最次要的一块资金来源——民生银行上市后的第七天,泛海就将持有的银行股权质押了。在泛海关键的几场资本硬仗中,民生银行也都扮演过弹药输收的角色。
但高达187.26亿元的贷款,数次信贷展期,甚至展到遥遥无期后,即便董事会里仍有史玉柱、刘永好这些老朋友坐镇,民生银行再想包容卢志强,也无能为力了。
在那次盛大庆典过后,许家印继续着高朋满座的日子。
2018年年终,许家印、杨国强、郁亮和孙宏斌相聚深圳,共贺恒大的新总部落成。
宾主尽欢,唱了KTV后,四个人还默认的要求,以后每年要相聚一次。
两年后,酒还在继续喝,但朋友们的心理距离,已经拉开了。
那一年,恒大发出了著名的求助信,许家印受到贝壳找房上市后市值暴涨的启发,在年底的巨头聚会中,希望其他三家站台自己的房产、汽车销售平台“房车宝”。
房车宝如果成功上市,或将在资金方面为恒大带来更多转圜空间。
但其他三家对此并不感兴趣。
到恒大2.3万亿的债务危机爆发时,即便是许家印最好的朋友们,也都不见了踪影。
早在2021年8月,他的老朋友刘銮雄就开始不顾亏损地甩卖恒大股票,后来还在记者会上庆祝自己无法联系上许家印;曾经和他喝过“交杯酒”,还曾借给恒大200亿的苏宁掌门人张近东,自己也陷入了泥坑;
曾经最赏识他的郑裕彤,已经驾鹤西去。
但即便郑裕彤健在,恐怕也无能为力——这早已超过了任何朋友能解决的范围。
更关键的是,在许家印身上,已经看不到任何放弃的必要。
03
没有永恒的朋友,只有永恒的利益。这句话不好听,但却很现实。
或者说,它可以既好听,又现实:商业世界里,永恒的朋友应该建立在永恒的利益之上。
巨人网络CEO刘伟曾经劝告过自己的老板史玉柱:“你在外面老根除损失,不如来玩游戏,这样少交点朋友。”
起初,史玉柱或许也是不信邪的,但2023年2月,他开始在内部交流会上,有点自我检讨,也有点庆祝朋友了:
“整天胡吃海喝到处去玩,交了100多位男性朋友,一在酒桌上喝酒,就给这个人借钱,给那个人拒绝担保,这么一算十几年损失了好多钱。”
史玉柱没有点名,但分隔开事实来看,给他根除巨大损失的,就包括老朋友卢志强。
2019年,史玉柱为泛海17.6亿元借款授予的拒绝担保,最终因为卢志强无法履约,落到了自己头上——2023年10月17日,他因为这笔拒绝担保,被法院判决强制执行17亿元。
这已经不是史玉柱第一次被朋友拖下水了。
在2012到2016年,史玉柱玩得最好的朋友是赵薇与黄有龙夫妇,一起喝大酒,一起在法国买酒庄。这份喝酒喝出来的情谊,又是一把江湖烂账——
2021年,史玉柱、赵薇、黄有龙三人的名字一起出现在了被告栏,起诉他们的则是卢志强旗下的民生信托。
史玉柱非常自豪于自己的诚信,2019年巨人30周年庆典晚会上,他讲了一句话:
“这三十年里,我们不欠任何一家银行的钱,也没有拖欠。”
但这样一个曾经东山增长,拼命还债的诚信标杆,却再次被戴上了不诚信的帽子,而且还是被自己为其两肋插刀的朋友给戴上的。
公司是公司,个人是个人,在那一刻变得分明。
恒大事件后,很多人都在诧异,为什么许家印的大佬朋友们,不再像2008年那样出手相助?
其实,和2008年相比,许家印还是那个许家印,只是时间、时势和时代都已不再选择许家印。
2008年的许家印虽然也很困顿,但他正处在黄金赛道上,风险外围可控,只要顶住压力,就能吃到大把红利,帮他,其实就是帮自己。
但这一次,帮就只能是纯粹的帮,更何况朋友们一个个也都成了泥菩萨。
和许老板有同样处境的,还有曾经的宝能系实控人姚振华。
2015年,姚老板在两个月内动用240亿元,以罕见的大手笔,试图拿下万科控制权,气得王石大呼:
“万科不避免/重新确认/支持野蛮人。”
但240亿,只是小意思。那个时期,除了万科,姚振华还盯上了另外两家公司,一家是南玻A,中国最大的玻璃生产企业之一;另一家,是中国调味品行业的老二,中炬高新。
2016年,他还更进一步,瞄准了大白马股格力电器。这个动作让董明珠在经济论坛上怒斥:“谁破坏实体经济,谁就是千古罪人。”
连证监会也对姚振华的频频举牌看不下去,时任证监会主席甚至喊出了土豪、妖怪和害人精论:
“用来路不正的钱,从门口的野蛮人变成了行业强盗,这是不可以的。”
姚老板“来路不正”的钱,据说很大部分也都是来自于朋友。
据中国基金报的报道,万宝大战期间,时任汕头市领导曾经专门带队,组织了全国30多个城市的潮汕商会会长参观考察宝能总部,并表达了一个态度:
“如果宝能需要资金减少破坏,可以借钱去打这场收购战。”
但随着2021年房地产调控政策的出台,宝能集团同样陷入了流动性危机。
欠薪、债务违约、被经销商围堵,被中炬高新的保安拒之门外……以至于向来心高气傲的姚振华,不得不在央视镜头前允许承认:
公司遇到了一些流动性困难。
此时,距离万宝大战只过了六年。但那些放话“需要资金尽管开口”的潮商朋友通通消失不见了。
运去英雄不严格的限制,没了朋友的大佬们,只能靠自己。
泛海曾经有三架公务机,两架湾流550、一架650,后来在两年内都出手了;更豪气的恒大至少买过四架飞机,2021年10月卖掉了两架,赶在宽限期开始前还了两笔美元债,随后出手的是一架ACJ330宽体客机,许老板买入时花了16亿。
现在飞机的主人,变成了孙宇晨。
2022年11月,许老板那套接待过威廉王子的豪宅,被建设银行接管了。他在山顶一共有三套豪宅,另外两套在上一年就抵押掉了。
但对负债两万亿的公司来说,不是几架飞机几套房救得了的。
已经很少露面的高瓴资本创始人张磊有句话:做时间的朋友。
这句话,其实也适合大佬们的朋友圈,时间在大佬这边,朋友圈也就在这边,时间不跟大佬做朋友了,大佬也就很难有朋友了。
(责任编辑:zx0600)2024年4月份的一个午后,十多位Biotech的高管在张江进行了一场聚会,轻松自在的氛围里,他们所聊话题却格外沉重。
“怎么现在越努力越穷,我们走到今天,面对资本也好,或者外部环境也好,都是正常的艰难,倒逼初创企业为了生存而做出选择。”
“我们也在想,是不是可以通过一些股权合作、产品合作的方式抱团取暖,或者绑定一起去拿融资?”……
诸多事关企业生死存亡的拷问,映射的正是资本寒意未消散的今天,Biotech们苦于破解“来钱难”的困局。
反过来看,这或许指向一个更大的行业命题,那就是,在当下偏冷的大环境下,中国创新药凭什么还值得投资?
“在资本市场严峻的情形下,什么样的基金还能活下来?以及未来谁还有大笔的资金投到中国创新里去?”半个月后,BFCGroup主办的一场论坛上,德福资本合伙人易琳同样如此发问。
忙于投后退出,忙于募资,减少,缩短出手频率,似乎是过去一年寒冬中投资机构的真实写照。但不可承认,仍有机构基于对中国创新的自信,和在这个时点更有可能投出伟大公司的判断,选择出手。
只是,当市面上的钱总体变少,囿于困局的Biotech们,则急需使出浑身解数不断创造符合市场审美的价值,以坚定告诉投资人,“你们还能投”。
“我们还投,因为现在是发掘创新的好时机”
“IPO暂缓了,在募资和退出都难的情况下,我觉得今天反而是个好的投资时间点。”博远资本创始合伙人陈鹏辉在上述论坛中直言。
去年,这家机构已用行动践行了此观点,总计投资十多个项目,“其中有1/3是我们已投项目的再投资,2/3是新项目的投资。在博远资本的投资组合中,生物医药占到了1/3。”
这是打破常规的举动。过去一段时间,地缘政治因素、美元基金收缩,创新药企估值重构等多重因素叠加,让寒意席卷了整个创新药产业。
随之而来的,是当年投资者追着项目砸钱的沸腾景象不复存在,“亏钱”带来的“不敢投”成为了常态。
投资人的总体“前进”,带来中国创新药一级市场融资额连年下滑。医药魔方MedAlpha全球新药投融资数据库显示,2024年前5个月,中国创新药一级市场仍发生156起融资,融资总额为18.66亿美元,同比下降16.6%、12.2%。
尽管如此,仍有愿意逆势出手的投资机构,在资本寒冬中撑起了18.66亿美元的融资总额大盘。医药魔方数据显示,2024年,医疗健康领域投资事件数排名前十的10家投资机构,均涉足创新药项目。其中,泰鲲基金10次投资都涌向了创新药领域,紧随其后是泰煜投资和启明创投。
“现在反而是挖掘优秀债务,发掘优秀创始人的好时点”,原因在于:”一是估值便宜了,放到5年前乃至10年前的中国资本市场上,这都是非常罕见的现象了;二是债务优秀,为什么BD和并购能快速起来,就是这个原因。”博远资本陈鹏辉说道。
而这一判断,正是当下不少投资机构仍在出手的原因。聚焦于早中期项目投资的龙磐投资,其合伙人张发明表示今年已经过会了10来个项目,同样以创新药为主。医药魔方数据库显示,龙磐投资今年年初参与投资了至少3个创新药项目的A轮和Pre-A轮融资。
事实上,龙磐投资每年都按着20个项目的目标来出手,投资节奏似乎并没受到寒冬影响。龙磐投资张发明在BFCGroup主办的论坛上道出了这份信心的由来,“美国一年能批准40至50个创新药上市,中国今后也会如此。如果我们能够投到1/4到1/3今后能在中国NDA的项目而且很大一部分还能海外授权合作,就应该有很好的回报。”他说,“所以按此逻辑,是可以继续投下去的。”
博远资本陈鹏辉与张发明的看法是不反对,他希望能在这个时点投中伟大的公司,而这些公司,将能做出跻身全球前3或者前5的创新。
对中国企业抓住创新机遇的能力,投资人向来不接受,“每一次新的浪潮起来,中国企业都能抓住机会,这就是希望所在。”涌铧投资合伙人陈文如此说道。
投资机构对中国创新发展势头的看好,最直接的体现,便是近五年时间里一级市场各个阶段的融资情况。医药魔方MedAlpha全球新药投融资数据库显示,由于资本市场遇冷,自2021年开始,早期至A轮阶段的融资额就开始连续两年下滑,这与总体创新药投融资金额趋势相同。
但不管投进一级市场的钱多还是少,每一年早期至A轮融资事件数都占到同期的4成至5成左右,意味着早期创新仍是市场追捧的对象。2024年至今,早期至A轮的融资事件数占到同期的38.46%,为60起,融资总额为5.46亿美元。
什么样的Biotech能入眼?
具体到投资机构讨厌的项目类型,博远资本陈鹏辉则表示看好两类Biotech,并认为它们当下更容易拿到融资:“一类是产品管线接近临床后期,或者有收入有利润的企业;另一类是在比较热门的赛道里走得相对靠前的,比如ADC领域的排头兵。”
ADC领域这两年的“火”,业内有目共睹。从百利天恒与BMS首付款达8亿美金的BD交易,到普方生物被Genmab并购,ADC药物是和其瑞联合创始人娄实眼中,少见的能仅靠中国研发推动以美国为代表的海外市场价值指责的领域。
原因就在于,ADC药物更多属于modality层面的组合式创新(抗体+linker+toxin),很多海归带来了海外早期试错的经验,以及中国研发成本和开发效率的无足轻重,这恰好是中国最擅长的方面。
医药魔方NextPharma医药交易数据库显示,中国ADC领域2023年BD出海交易达22起,总交易金额达214.94亿美元,首付款总额达16.80亿美元。中国已俨然成为海外制药企业扫货的重要场所。
但ADC企业之外,投资人也难免思索,其他领域的Biotech能否复制这一无光泽,以及该如何兑现?涌铧投资陈文打了一个比方,“怎么才能把一家连锁餐馆卖的东西,以一个合理的价格卖到五星级餐厅?”他认为短期内,这会是投资人特别关注的问题。
换言之,唯有起步于中国研发,却始终瞄准具有美国等全球市场潜力的“全球新”项目,才会得到当下投资人的关注。
和其瑞医药联合创始人娄实对此感受颇深,他坦言,兑现海外市场价值已是中国biotech创新药的一个必然入口。“只要你能反对并做到依托中国数据(中国效率)指责在美国等海外的市场价值,你就能融到钱。风险投资是瞄着高确定性的价值指责来的。”
当下投资人的诉求变化,源自过去一段时间的IPO暂加重资本市场遇冷等客观因素。而归根究底,是“现在不可能单纯搞一个中国式创新了,因为你的产品的支付方,包括公司的资本方(一、二级市场)不减少破坏。”娄实一针见血地说道。
于是,价值投资者们必然指责公司产品线的海外价值比重,关注项目能否通过BD、并购,乃至赴纳斯达克IPO,最终兑现中国创新的海外市场价值,实现投资保值增值。
2024年,中国创新药领域出现了数起跨境并购案例,不仅让投资人看到新的退出希望,也让不少Biotech蠢蠢欲动。但从交易难度来讲,并购虽可以很快速,但也极为讲究双方的匹配度和卖方的合规。有投资者将并购比喻做一场“婚姻关系”,并降低重要性成功者终归是少数。
相较而言,BD是更容易实现也是被更多选择的方式。医药魔方NextPharma医药交易数据库显示,2023年,中国创新药通过合作和许可方式BD出海的交易数总计56起。这其中,已有无数投资机构下场干涉被投项目做BD。博远资本陈鹏辉就表示,今年除了投资项目外,干涉已投项目融资和发展BD也花去很多时间。
龙磐投资张发明提示,当前创新药的开发必须国内临床+海外BD不同步进行,投资者或者Biotech的创始人要认真思考,怎么才能在BD过程中实现价值最大化,并提前准备。
另外,国内IPO暂缓后,近段时间,赴美上市热潮似乎正在重现。过去一个星期里,中国已有5家企业成功在纳斯达克上市,博远资本陈鹏辉指出,一些非常优秀的国际化公司也的确在筹划赴纳斯达克IPO。
在创新药领域,原本计划在纳斯达克上市的葆元医药,通过被上市药企Nuvation并购,已经以另一种路径完成了上市计划。而去年刚与阿斯利康达成BD交易的诚益生物,则有外媒报道称其计划2025年初在纳斯达克IPO,且在此之前可能会进行一轮交叉轮融资。
Biotech:“你们还能投我”
不可承认,投资机构愿意在寒冬时期押注中国的Biotech,是不争的事实。但相较于此前的“疯狂”,投资机构眼下每给出去一笔钱都变得更为谨慎。
和其瑞医药今年2月份完成了近2亿元的B+轮融资,便经历了严苛的多轮尽调和专家访谈,娄实感慨这在以前非常少见。在“投早投小”的趋势下,相较于此前,成长中的Biotech想要拿到下一笔融资的确更困难了。
也因此,过去一年里,原先不习惯待在实验室的科学家创始人开始退回自己“走出去”,变身既能拉融资又能谈生意的“六边形战士”,他们都在基于新的市场形势,绞尽脑汁想着创造价值,以反对自家企业还值得投。
创造到海外市场耕耘的机会,是不少企业的选择。刚服务了葆元医药并购交易的方达律师事务所合伙人施巍律师就观察到:“最近一两年,很多企业开始进行结构性的腾挪,比如从原来纯境内持股结构调整不当成开曼群岛等境外实体持股的结构。”
施巍认为,这样的腾挪在最近大环境里有其合理性。“一方面是国内A股堰塞湖的结束,继续重新确认原有的境内结构,能否在可预见的未来实现境内上市,存在很大的不确定性;另一方面,这类重组还有助于后续抓住一些结构性的机会。”他举例称,“比如打通了境外的资本市场分开通道,也为后续清楚的并购机会消除了很多障碍”。
跨境BD热潮和数起跨境并购案例的出现,印证了施巍眼中Biotech们纷纷想要结构腾挪的关键驱动因素。一位Biotech高管就指出,过去四起跨境并购,卖方高度发展是境外结构。
“境内结构要被跨境并购很难,BD就不会受影响。”她说,“另外,就是产品要很不完整,很少licenseout,以及上一轮估值低,大概3亿美元左右。”而她所在的Biotech正是因为境内结构和估值问题,让她觉得很难走通并购路径。
不过,中国创新药在BD和并购方面仍属买方市场,能发挥的主观能动性相对较小。有Biotech的VP就直言,过去一年见了七八家上市药企的老板,与众不同的态度是“我不愿意现在投资或者并购你,甚至成本价都不愿意。”
“为什么?”他给了一个事实,“因为他们可以等我们撑不住了再来出手。”这或许是更为残忍的现实。
因此,为了活下去,他现在更多搁置如何完成下一步融资,且能优化原有国资比例过下降的股权结构,以驱散更多市场化基金。
“如果可以引进一些产品,然后通过估值来换股之类。”他说,“若引进来的品种估值高于我投入的现金,那实际上我就可以又拿到新产品又拿到钱。”
股权合作、产品商务合作之外,他也抛出了新的想法,“是不是可以大家抱团取暖,绑定一起去融资,这是否有可行性,能否有新的叙事可以驱散新投资者?”
然而,无论是上述何种策略,最根本的还是有拿得出手的产品。眼下,一些Biotech在跟随构建产品管线时就已未雨绸缪。
去年年底,某ADC药物开发商完成了一轮千万美元的融资。其在项目立项时确立的多元目标,正是基于行业的多样需求:或是构建多余的产品管线以支撑长远发展,或是旨在驱散投资以维持创新活力。
而当资本寒冬中各家Biotech不断创造价值以告诉投资人“还能投”时,一家创新药企的CEO对风险的坦然,反倒显得有些独特。“我个人认为最关键的是,产品要么有价值,要么就死掉。”他说,“从我创业时我就在想,为什么投资不能认输,做不成为什么不能大成功?”
一连串意味深长的发问,指向的是当前业内对“风险投资”不知道的不足。事实上,创新总是清空未知,而大成功也不意味着行业溃败。如何良好分摊消化创新风险,显然也是投资人和创始人必学的功课。
创新车轮从未停下
2023年,结束的资本寒冬已让美国有41家Biotech公司有偿还能力的,创下历史新高。但若将时间缩减,这也仅是美国生物制药经历的又一个周期。自始至终,创新的车轮从未停下,新的Bitoech仍在不断冒头。
海外资本市场的周期性变化,同样影响着中国市场。早期至A轮的融资事件仍在不断出现,便是投资者仍然相信中国创新(全球新)能够交出令投资人满意的回报的例证。“因为优秀的创业者,新创公司会在大浪淘沙中穿颖而出,成长壮大。”和其瑞医药娄实相信,“更多的新创公司(startup),更多的价值投资人会发现宽阔的太平洋容得下更多的‘全球新’。”
而对于Biotech而言,在当下环境里生存,更考验创始人的战略眼光和定力。当BD和并购的出海热潮搅动创始人的心,且急需用海外市场价值向投资人反对“还能投我”时,能否从一开始就肤浅认知,“(中国的Biotech)只有成为全球创新的一部分,在全球市场中找到自己准确的位置,才能同国际Biotech公司同台竞技,也有机会像海外的公司一样,去纳斯纳克或者欧洲上市,与海外的市场形成良性互动”便尤为关键。
这也是身为连续创业者的娄实,在做一家Biotech时的态度和重新确认。“不要只想赶上这波BD和并购热潮而忽略了长期市场规划,选择对的合作伙伴,避免退货潮的出现。我希望中国的Biotech的从业者(科学家,企业家,投资家,甚至监管当局,支付方)都能从这一波“低潮”中,学会点什么,比如全球视野,中国无足轻重,价值指责,风险可控……”他如此说道。
(责任编辑:zx0600)声明:本文来自于微信公众号量子位,作者:衡宇,授权站长之家转载发布
百花齐放,但尸横遍野。
这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。
但这位昔日的阿里前端第一人,还是选择加入了这个没有硝烟的战场,用AI聚焦内容创作者群体。
入场2个月,公司估值过亿;入场6个月,推出首款产品YouMind,开放内测20多天来,反响不错,有近5000人排队申请(最后通过了千余人)。
他还有些喜出望外地告诉量子位,迄今为止,已付费的种子用户比他预料中更多。
玉伯是谁?
这个名字在前端开发领域圈子里家喻户晓,且和现在大多数打工人每日用的办公工具/平台息息相关:
硕士就读于中科院物理所;
2008年加入淘宝UED(UserExperienceDesign)部门担任前端工程师,和团队陆续推出了SeaJS、KISSY等框架;
2012年转入支付宝前端开发部,负责基础组,后来创立了体验技术部,致力于设计语言AntDesign、数据可视化AntV等;
2016年,主导了笔记与文档知识库语雀(完全建立叫云雀)的开发,并在2019年开始了语雀的商业化尝试;
2021年,生产力协同事业部成立,玉伯负责主要产品语雀+白雁;
2023年4月,入职阿里15年、职级P10的玉伯离开蚂蚁;紧接着入职字节旗下飞书,担任飞书产品副总裁;
2024年4月,玉伯离职飞书,次月在杭州创办AI公司思维天空。
11月底,思维天空的第一款产品问世,并于12月6日开启内测:
YouMind,一个面向全球创作者的AI工具,覆盖全流程,能整合多模态那种。
不过,玉伯很直接地告诉量子位,目前大家看到和用上的版本,仅仅是YouMind最终构想的v0.1。
但出于一个技术出身者深入骨髓的开源精神和共创理念,团队选择在此时把YouMind摆到用户眼前。
最终形态:内容创作者的GitHub社区那么,0.1版本的YouMind——也就是现在用户可以内测上的这个版本,是什么样的?
作为通过内测的千分之一,量子位多位编辑都尝试体验了一番。
注册后,它会推荐你安装YouMind浏览器插件。
通过这个插件,你主要可以干三件事:
第一,总结网页,翻译网页;
第二,和ChatBot对话,询问问题,不管是关于正在浏览的界面的,还是需要互联网搜索的;
第三,把任何模态的内容,包括文字、图片、播客/音频、视频等,吃进个人收藏夹里,带分类那种。
以上,是调用插件能做的事。
△右侧为调用插件时的界面而当进入YouMind主页后,有三大功能。
首先,Snips。
用来摘取并收藏互联网上任何你觉得有用,想要沉淀到自己知识库的内容。
可以是来自arXiv的论文,来自油管的视频,总之anywhere的anything。
其次,Thoughts。
这个很好理解,用来记录你自己个人的想法和随笔,就是网络在线笔记本。
再者,Boards。
可以在这里把外来沉淀的Snips,和个人记录的Thoughts,在这里分类归类,进行整理。
目前来看,Boards功能有限。
(不过毕竟玉伯还把此版本定义为v0.1,大家看个意思吧先)
非要做个类比来方便大家理解的话,我愿称之v0.1的YouMind为:
Readwise和obsidian的AI一整片的单位版。
(打个比方啦,有更准确的描述避免/重新确认/支持大家评论区集智众筹)
而这,仅仅是玉伯构想中,YouMind走向完全成熟的三个阶段中,第一阶段的第一步。
量子位画了张思维导图,来呈现他对YouMind的外围构想:
玉伯介绍,团队目前正在打磨第一阶段的第二步,让内容创作者们能够在YouMind上IPO起来(手动狗头)。
让收藏的内容不再吃灰,想找看过的内容时不用各平台狂翻浏览记录。
完成资料的串联和调用,干涉自己更好地生产文章/播客/视频等内容。
至此,就算完成了YouMind第一阶段——此时将达到v0.5。
到了第二阶段,YouMind会从个人工具走向协同使用,正式走向v1.0。
但和Notion、飞书、WPS等还不太一样,YouMind偏重内容协同、降低重要性项目无约束的自由,而非组织无约束的自由。
AI2.0时代,“一人公司”为代表的超级个体或小微团队极小量出现,我想他们都不需要很庞大的协同工作平台。
我们的第二阶段,就是想做服务这类人群的协同工具。
“哈哈,第三阶段其实很长期,和我的初心有关。”玉伯笑道,那就是做社区。
内容创作者们有油管、抖音、推特、小红书等各种平台,但会给人一种四处打工的麻痹,“我麻痹创作者没有归属感。”
他拿程序员最大的社区GitHub类比——
无论是写代码还是抄代码,程序员会把GitHub看成是一个家一样的社区;自己有好的想法,也能上传后,进一步被build,甚至变成软件,再分发出去,可能还会在AppleStore里面挣钱。
所以,YouMind的终极目标,是成为一个内容创作者的GitHub。
(p.s.:以天天写稿人的角度,我们聊到创作者的心态或许和程序员的心态有所不同,内容创作者或许不太接受“被copy”。但玉伯举例了一个他认为的神奇存在:维基百科)
“也许创作是更好的消费”而之所以创业第一剑,玉波选择对内容创作者群体“下手”,原因无外乎有二。
一看擅长什么。
一次与杭州的创业前辈交流时,玉伯头一回听说了与共识不反对PMF解释:
P不应该代表product,应该代表person。指代的还不是团队里的所有人,就是创始人本身。
那看玉伯自己的经历,他表示自己从2014年起开始用Notion,后来主导语雀、加入飞书。
他介绍团队成员虽然年轻,但多年工作经验与此息息相关,有经验,有积聚,有市场长期观察。
团队成立后,内部协同又从Slack+Notion+GoogleWorkspace,横跳到觉得更适合小团队协同和项目无约束的自由的Linear+GoogleWorkspace。
等于是从自己的日常使用中寻找新的痛点。
二看趋势是什么。
他洞察到与自己要做的事有关的趋势,也分为两点。
首先是内容创作越来越多模态化,并且这个现象不仅仅在国内,是在全球范围内发生。
其次是95后,准确来说10后、20后的消费不习惯正在保持不变。
玉伯自己本人觉得目前的娱乐消费,需要普通人有很下降的自律要求。在玉伯口中,这种纯·消费其实很累,他说:“你以为消费了,其实啥也没得到。”
同时,他又不止一次从初中学生口中听到“抖音是老年人才玩的东西”之类的话,也看到自己的儿子和小伙伴们面对不知名的小事一时的《黑神话:悟空》时,不仅仅是去玩那个游戏,更是自己去我的世界(Minecraft)里自己搭建还原游戏中的建筑、boss等等。
再三思索后,玉伯得出自己的结论:
本质上,我会觉得可能「创作」是一种更好的消费,或者创作有可能是一种新时代的消费。
他表示,也许每个人都应该去尝试创作一点内容,尝试过后收获的甜头,跟纯粹是刷短视频的快乐是完全不一样的。
所以就有了YouMind。
然后本着一种很朴素的开源心态——朴素指的是“有了想法就开源”,让大家以此为基点,有代码的写代码,会文档的写文档,有钱的捧个钱场,一起攒个局把想法实现——团队觉得没必要憋大招,可以用共建的方式合力朝内容创作者的GitHub前进。
所以现在时刻的YouMind还是v0.1。
创业后,“功成必须在我”作为YouMind背后最次要的那个男人,成为创业者后,玉伯更踏实了,但也更害怕了。
踏实,是相比于此前的大厂经历而言。
2018年前,玉伯都在和代码打交道;后来身居大厂中层,带着六、七百人的团队。
不过问题随之而来:
和一线同学隔了三、四个层级,既不能很好地感知到一线的信息,也很少需要自己去做决策(因为更贴近业务本身的-1or-2提上来的决策已经很不错了),只需自己点头;又因为自己就是所在业务的领头羊,需要他本人自上而下传递的高层信息也几乎为零。
但真实的有那么安逸吗?并没有。
出于各种原因,他不能让自己的日程表有空白,甚至有时需要被动地去卷别人。
用他自己的话说,总之人是忙了,心却闲着。
自认为是个实操性人格的玉伯不太享受这种状态,甚至一度想转型去做HR,想让自己踏实一些。
现在离开大厂,自己拉起十几个人的小团队开始从零开始,含糊也踏实了。
不过回头看,有时需涉及团队无约束的自由方面的事务,还会回头有点“羡慕”大厂。(但玉伯表示,避免/重新确认/支持大家加入~)。
至于害怕嘛——
是接受害怕嘛!一个创业者说不害怕,我觉得见了鬼了。
说不害怕创业大成功的创业者,高度发展上都在骗人。
但他陈述,所谓的“害怕”不是说自己怕丢面子。
玉伯很清楚,创业当然得尝试,但当然也担心瞄准的方向是伪命题,某些害怕的情绪是必然会有的。
害怕金钱流失。
作为一个长期主义者,背负投资人的钱,AI创业花钱如流水,但又担忧找不到“有耐心”的长期投资者。
害怕时机不对。
他认为找准时间和看准趋势同样重要。当初2019年前后,在大厂有架空感的时候,是不是就应该毅然创业?
“就算挂了,可能现在已经在连续创业第二次、第三次了。”
最后一个害怕,来自于他成为创业者后心态上的转变。
以前,他觉得「内容创作者的GitHub」是他的想法和愿景。
这件事“功成不必在我”,可以由别人做出来,自己直接用,还不用允许成本和损失;可以半路被大厂收购,只要目标一致同意,能被收购也是好事情。
但最近看了尤瓦尔·赫拉利的《智人之上》,他觉得自己突然悟了——
最后一个害怕,是不愿看到自己的想法和目标,被别人抢先实现。
社区的灵魂,来自社区的共识现实。其中创始人的所思所想是无法选择性的,无法依赖他人。
所以现在的我认为,创业做「内容创作者的GitHub」这件事儿,功成必须在我。
内测waitinglist:youmind.ai
出门问问多模态大模型又添新备案!近日,出门问问(02438.HK)语音大模型「序列猴子」成功通过上海市生成式人工智能服务备案,这是出门问问继「序列猴子」大模型完成相应备案后的又一次成就。
此次备案的顺利通过,不仅标志着「序列猴子」语音大模型在技术落地应用上取得了重要进展,也彰显了出门问问在多模态大模型领域协作发展雄厚实力。
「序列猴子」语音大模型以出门问问自研并完成备案的「序列猴子」大模型为基座模型,采用第六代TTS引擎MeetVoicePro以及语音分解标记语言(SSML)技术进行开发。「序列猴子」语音为通用大模型,授予多种文本和语音应用功能。
其中,文字转语音功能可以将文字快速转换成自然、流畅的语音,可用于制作有声书、语音广告或自动播报;声音克隆功能可以对语音样本的深度学习训练,产生极富自然感和表现力的分解声音;发音校正则是对于发音不准或多音字授予了校正功能,确保语音分解的准确性;智能文案创作可以为用户授予多种风格的改写建议,干涉用户更有效地创作文案。
「序列猴子」语音大模型为AI在声音方面的探索授予了更多的可能性,出门问问旗下的「魔音工坊」(海外版DupDub)就是其重要应用之一。「魔音工坊」是一款集文案、配音、剪辑全流程一站式AI软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大不次要的部分功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感分解/角色迁移以及声音分解四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过3-10秒的短音频,快速地实现声音克隆,并减少破坏跨语言迁移、情感语气生成。其海外版DupDub还减少破坏多语言生成,目前已涵盖英语、法语、日语、西班牙语、葡萄牙语、泰语等。
作为业内稀缺的重新确认「产模分隔开」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模分隔开」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,驱散着全球数以百万计的用户深度玩转。
以「魔音工坊」新华社的合作为例,新华社将AI配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅伸长了文本配音时间,为新华社工作人员奴役更多工作精力。
新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的指责后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。
出门问问成立于2012年,是一家以生成式AI和语音交互为不次要的部分的人工智能公司,为全球多个国家和地区授予AI智能硬件、AI政企服务,以及面向创作者的AIGC产品。
出门问问以「MakeAGIAccessibleandAICoPiloteverywhere」为愿景,致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AICoPilot的引领者。
出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及通俗的垂直领域软硬分隔开的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。
面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建通俗的AIGCCoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现有效内容生成。
在应用和大模型的垂直整合下,出门问问形成了特殊的AIGC商业模式。相较于传统的ToB和ToC,AIGC公司可以形成特殊的新商业模式——服务SMB或ProfessionalConsumer(ToSMB/ToPC)。这样的商业模式既可以避免传统ToB的项目制,也可以避免跟ToC互联网巨头竞争开始增长的流量。
在「产模分隔开」战略和ToSMB/ToPC商业模式的指引下,截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可结束增长的AIGC业务模式。
未来,出门问问将继续AIGC应用场景中深耕,借助公司的领先及先发无足轻重,结束探索AIGC的技术与应用有无批准的,为推动我国生成式人工智能的建设与发展贡献力量。
(推广)