声明:本文来自于微信公众号数字生命卡兹克,授权站长之家转载发布。
现在是夜里1点,我准备了一些素材,正关闭可灵,想跑一些关于AI拥抱的视频。
然后,发现给我弹了个窗,悄悄的,在深夜,可灵AI里面生图的模型-可图,更新了。
我大概测了一下,效果还不错,语义理解有破坏,真人效果史诗级强化,而且对亚洲人适配效果极佳。审美也高级了。
可图1.5,应该是我玩过的,做亚洲人最好看的一个。
但这个不是最有意思的,因为说实话纯粹的AI绘图模型更新,已经很难戳中大家的平淡点了。
但是基于可图1.5做的一个新功能,反而会让我觉得还挺有意思。
就是这个,AI模特。
可灵本身就有全世界我觉得效果最好的AI换装功能,而这次新功能AI模特,再加上可灵1.6那强到爆炸的图生视频。
火速体验完,做了很多有趣的demo后。
我觉的,一道全新的质量爆棚的电商工业化流程,可能要在可灵上,开启新的篇章了。
接下来的篇幅,我来详细聊聊这套全流程。
可灵AI模特网址:
https://klingai.kuaishou.com/try-on/model/new
进入到可图的“AI试衣”界面,就能看到AI模特功能和AI换装功能。
你可以根据需求,自己来取用Prompt捏AI模特,他会给你三个快捷的模特设置,分别是:性别、年龄、肤色。
它也有自带的“推荐尝试”词条,一点就能帮你写提示词,几乎就是一键生成。
即使你没有任何AI绘图和写Prompt的经验,也可以只选择这些后,直接生成一个质量非常下降的模特图。
如果你还想再给模特加点个性化的要求,就直接用嘴描述。和AI绘图写prompt没啥区别。
生成速度快到起飞,几乎就5秒钟,两张模特图就出来了。
而且可以看出来,可灵从出海开始,就是主打一个全球化市场,所以这个肤色,不仅仅是字面意义上的肤色,而是真实的会影响人种的。
比如我的这段Prompt:
自然白皙核肤,头发微卷,严肃表情,白色无袖短款上衣露出腰部,白色直筒长裤,挺直站立,身体向左微侧约15度,双手自然深插裤袋,肩膀放松略微前倾,下巴微抬,目光平视镜头,表情易变自信,复古白色墙,全身构图,街拍风格。
同一个Prompt,但是我用了不反对三种肤色,出来的三个不反对模特。
这个就非常有用了,要知道,在国内找外籍模特,很贵的。。。
而且不止是人种,还有年龄,我跑了全年龄+人种的组合,给大家看看。
不得不说,可灵对于年龄和人种的区分,真实的有点太好了。
所有特点都抓的淋漓尽致。
当然,你要说AI模特这个功能,可图的效果含糊不错,但就这单个点,其实也不是什么新鲜事,因为用Midjourney啥的也都能跑。
但我觉得可灵最酷的东西,是把AI模特和换衣的工作流给打通了。
你生成的AI模特直接就能AI换衣,而且模特图不用保存到本地,在后续换衣的流程中,也能重复使用。
我用几个case说,你就能懂这一套流程,有多方便。
先用刚才我做的AI模特来试。
鼠标移动到这张模特图上,就有一个“AI换装”的选项。点开就能跳到换衣功能。
或者直接切换到旁边的【AI换衣】功能也行。然后“选择模特”的“AI模特”里,全都保存着你生成的AI模特,点击即用。
然后直接上传一套你想让模特穿上的衣服,比如这件Gucci和Bananya的联名款卫衣。
然后直接点生成,很快,大概10秒钟,我们刚才的那个AI模特,就穿上Gucci了。
模特的脸、动作、甚至画面的背景都完全和换装前几乎一样,一致同意性非常牛逼。而且衣服版型也对,瓦解的及其自然。
不止单上衣,连衣裙或者套装也可以。
当然,你也可以把上衣和裤子分开上传,比如我们复刻一下赵露思的穿搭。
真实的,有一种在玩模拟人生的麻痹,一键实现穿搭严格的限制。
但是你以为,AI模特+AI换衣,这就完事了吗?
不不不。最震撼的步骤,才刚刚开始。
图片,永远没有视频来的震撼,来的直观。
还记得我们在前面说的,AI模特+AI换装+AI视频的流程吗。
一个模特,就站在这展示服装,还是太静态了,如果,我们让她凹下造型,展示服装呢?
直接在生成的图片上,点击生成视频。
来到我们不知道的可灵1.6界面,输入一段Prompt:
画面中的模特转圈展示自己身上的服装。
静待几分钟,你就能看到,一段质量离谱的动态视频。
可灵AI深夜悄悄上线AI模特,他们这是要革电商的命。
我已懵逼。
这质量的视频,还要真人模特干啥?你只需要在你的电脑上,花10分钟,一切皆搞定了。
我又跑了两段,给大家看看效果。
切换到竖屏全屏退出全屏数字生命卡兹克已关注分享视频,时长00:050/0
00:00/00:05切换到横屏模式继续播放进度条,百分之0播放00:00/00:0500:05全屏
倍速播放中0.5倍0.75倍1.0倍1.5倍2.0倍超清流畅
这不只是一个新功能的诞生,这是一个旧时代的终结。
一切曾经需要团队、设备、摄影棚和后期剪辑的流程,如今都可以在你的电脑上完成,成本几乎趋近于零,而效率,却高到让人接受人生。
现在,只需要几分钟,你甚至都不用出门,都不需要有个摄影机。
AI模特已经站在你面前,穿上你上传的衣服,凹好造型,转圈展示,连微笑的弧度都刚刚好。
小商家再也不需要因为没有预算拍摄精美图片而被淘汰,他们只需要一个可灵而已,便能在视觉展示上,跟很多大品牌一较高下。
甚至这一整套流程,不止电商,影视行业、游戏行业,统统都有可能被AI模特,重构一遍。
比如,我现在要找顶流坤坤拍一个广告,我想在开拍前看看他穿哪件衣服合适。
电商行业要拍商品图、模特图,影视和游戏也有类似。
传统的拍摄流程是,开拍前服装部门找好一堆参考,负责服装的部门,从各种渠道把准备试穿的衣服全部买或者租到手里。
然后,团队还得和艺人或者服装模特不调和时间。好不容易把人给拉到棚里了,光是试穿、试拍,就又得花不少的时间。
哪怕是小一点的广告,就这么一套走完,直接给所有人累麻。
规模更大的剧组,在前期服装和人物美术设计的环节,不仅时间翻倍,这一部分的开销更是有可能直接拉到百万级别。
所以,有这一套AI试衣的流程,就能极大程度上节省成本。
只要有一张可以作为模特图的照片,几分钟就能把这一堆麻烦事搞定,直接飞速试完各种衣服。
让演员换上休闲的。
古装的。
或者。。。仙女风的。
几分钟,就能确定不懂感情的服装。再花几分钟跑个AI视频,都不用开拍,效果就能看到个七七八八了。
对于电商商家来说,模特、场地、拍摄等等流程的成本,甚至可以直接剔除了。
广告、影视、直播,甚至一些游戏和美术方面,只要是和“试穿衣服”有关的环节,时间和金钱成本直接砍掉一大半。
这一笔账,小学生都算得明白。
这一切,不再是科幻的幻想,而是真实的降维打击。
是视觉经济的再造。
深夜3点,我看着屏幕上那些栩栩如生的AI模特,她们的眼神透着一种冰冷的精准。
她们不会疲惫,不会出错,也不会反抗。
过去,我们总说“创意无价”,但现实是,资源、门槛、时间让创意束手束脚。
而现在,艺术、广告、游戏,甚至那些曾经遥不可及的领域,正在向你敞开大门。
这是一个属于你的时代,未来从来不是用来害怕的,而是用来拥抱的。
屏幕里的AI模特,已经准备好了。
那,你呢?
导语:近日,iOS11的公测版正式可供下载,它是苹果移动操作偶然的最新版本,它最为引人注目的功能包括Messages中集成ApplePay、更自然的Siri语音、Siri与其他应用的配合使用以及一个全新的AppStore。
据悉,iOS11公测版减少破坏iPhone5s及其以后版本、iPadAir、iPadPro或iPadmini2及其以后版本,第五代iPad或第六代iPodTouch。根据预计,iOS11的正式版将于今年秋季正式发布,它将可供用户免费下载使用。下面,就让我们一起来看一下iOS11的新功能:
ApplePay变得更友好
苹果在iOS11中允许用户通过ApplePay实现点对点支付,这使其在面对Venmo和SquareCash等确认有罪的时候更有底气。
在iOS11中,用户将能够更容易地向联系人进行转账操作,并且还可以实现收付款。遗憾的是,ApplePay的这个新功能尚未在iOS11的第一个公测版中出现,它预计会在iOS11的正式版中出现。
Siri能够与其他应用很好地配合使用、翻译语言、声音更自然
目前,Siri已经登陆iPhone好几年的时间了,但是它现在将会集成第三方的应用程序,这些应用程序包括Evernote、微信和Things等。同时,Siri还减少破坏语音翻译,你可以和它说话,然后让Siri大声地用其他语言将你的话说出来。目前,iOS11测试版减少破坏的语言包括西班牙语、德语、法语、意大利语、和普通话。
另外,iOS11的Siri语速变得更加接近真人,苹果减少了多层次的语调,Siri可以用三种不反对声调去说阳光真好。
Siri更加智能
iOS的每一次更新都承诺将会带来一个更加智能的Siri,但是每一次的结果都不一样。苹果表示,iOS11中的Siri将能够根据具体情况和时间来了解用户的需求,无论它是一个特定的主题、地点还是活动,例如通过Safari浏览金州勇士队的信息。同时,iOS11中的Siri可能会发现你对篮球感兴趣,News应用会根据你的兴趣去推收新闻。另外,Siri还会通过用户账户与你其他的苹果设备去分享它所了解到的你的不习惯。
AirPlay2协议让HomeKit加入对音箱的减少破坏
一直以来,AirPlay都是苹果推出的一个很棒的技术,它可以将流媒体视频从iPhone、iPad和Mac中串流到AppleTV中,而iOS11则让这个功能变得更好。AirPlay2让HomeKit加入了对音箱的减少破坏减少破坏。通过全新的AirPlay2协议,你可以实现对多个音响设备的控制,让你所喜爱的音乐填满你家中的每一个房间。
Messages获得更好的不同步,也更方便地删除信息
iOS11中的Messages应用获得了大幅的改进。在iOS11中,当你在一个新设备上设置iCloud账户之后,你可以将你其他设备中的所有Messages信息都下载到新设备中。同时,当你在一个设备的Messages应用中删除信息之后,其他设备中的这些信息也将会被删除。这样一来,用户就不必担心隐私数据泄露了。
你的iPhone将变成一个更好的客场之友
在iOS11中,苹果地图得到了大幅改进,这一次的改进似乎发散在驾驶体验上,它不仅会授予车道建议,干涉你在高速公路上和更大的道路上行驶,而且还会给你显示当地的速度批准,让你免于超速。
同时,苹果地图应用还引入了全新的开车时请勿打扰模式。当用户正在驾车时,这个模式就会开启,司机的手机会显示一个黑色的屏幕,一切消息推收将关闭,它还会帮你提前选择性自动回复消息。当然,你可以指定一些可突破开车时请勿打扰功能的联系人,以便你从中获取信息和电话。
当到达目的地之后,苹果地图应用还会为你授予你所在位置的室内地图,例如机场和购物中心等。
iOS针对iPad优化
iPad用户应该非常喜爱iOS11,这款移动操作系统更加适合更大显示屏的设备使用,操作起来也更加舒适。
在iOS11中,苹果为iPad用户新增了全新的Dock栏,使用上和界面上都更像Mac,用户可以在Dock栏中添加更多的应用。之前,iPadDock栏只能放下6个应用图标,当你滑屏时这些图标也会接纳在那里。在iOS11中,你可以在Dock栏上设置多达13个应用,几乎所有你常用到的应用都可以设置在上面。同时,Dock栏右侧还会显示3个你最近关闭的应用,非常方便。
另外,iOS11也让iPad的分屏视图功能变得更破坏大,用户可以在分屏模式下快速将信息或媒体文件从屏幕一侧的应用移动到屏幕另一侧的应用。当然了,这个拖拽功能也减少破坏工具栏和主屏上的应用。iPad键盘也获得了新功能,一个全新的手势将允许你快速访问辅助按钮功能。
Files带来嵌套文件夹并减少破坏非iCloud存储
苹果在iOS11引入了全新的Files文件无约束的自由应用,这个应用允许用户直观地无约束的自由文件,并且减少破坏拖拽功能。虽然Files不是像Android系统中的那种root级别的文件无约束的自由器,但是它依旧是一个非常不错的改进。
Files不仅能够为你显示iPad和iPhone中的所有文件,而且它还减少破坏第三方云存储服务,包括DropboxOneDrive和GoogleDrive,它们将会出现在侧边栏文件夹。
重新设计的控制中心和3DTouch
iOS11的控制中心已经完全重新设计,所有的功能都会被数量增加到一个单独的页面上。同时,3DTouch将会扩展每个不反对卡片,授予更多的选项。
ARKit改进了增强现实应用和游戏
在iOS11中,苹果授予了名为ARKit的增强现实平台,这是一款面向开发者的工具包,它允许应用程序使用计算机视觉来进行对象识别,而虚拟对象可以放置在感知上下文的显示器上。ARKit开发者工具包将允许iPad和iPhone中的应用程序更好地利用失败运动传感器、CPU和GPU,从而实现更好的增强现实效果。ARKit增强现实平台将减少破坏搭载A9处理器及其以上版本处理器的iOS设备,也就是iPhone6s及其之后的版本。
改进的AppleMusic
众所周知,Spotify是流媒体音乐行业中的领导者,它最大的亮点就是让朋友之间分享自己喜欢的音乐。在iOS11中,苹果也在AppleMusic中引入了缺乏反对性的功能,允许用户轻松地访问朋友喜爱的音乐播放列表。
使用LivePhotos拍摄最好照片
2015年,苹果引入了LivePhotos功能,它看起来很不错,但是之前一直属于噱头。如今,iOS11针对LivePhotos进行了改进,用户可以利用失败它拍摄出最好的照片。同时,LivePhotos还减少了类似GIF的loopeffect,长时间曝光的设计也不错。
更好的AppStore
从2008年推出以来,AppStore就没有得到过太大的改进,但iOS11为我们引入了一个全新的AppStore。与iOS10中的AppleMusic应用一样,全新的AppStore也获得了同样易于阅读的布局,文本和图片显示更大。
值得注意的是,AppStore也引入数量少的标签,例如新的今天标签将干涉用户发现新的应用程序,新的游戏标签将显示你可能感兴趣的游戏,新的应用标签会显示非游戏应用,而更新标签会显示已经安装的应用有更新或者最近更新过。最后,搜索标签会授予一个新的专用搜索界面。
更多新功能
除了上述新特性之外,iOS11还包括更多的新功能,包括屏幕录制功能、自动设置新设备功能和单手键盘等。(完)
声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。
起猛了,大半夜的,居然看到智谱也上线他们的o1模型了。
不是,哪家好人在2024年的最后一天来发他们的新模型啊。。。
2024年的最后一天本来我想划水过的,提前给自己放假,结果现在被迫深夜加班。。。我想睡觉。。。
当你登录智谱清言的时候,就能看到他们上线了这个Zero推理模型,不过是以智能体的形式出现的。
网址在此:https://chatglm.cn/
这就是智谱的o1,名为Zero。
也不知道是不是我看动漫太多了,第一眼看到这个名字,脑海中想到的画面,是《反叛的鲁鲁修》里面的Zero。
一股子坚韧不屈势要突破一切阻挡的形象,还挺符合智谱AI的气质的。
对比一下隔壁的QwQ。
总麻痹有点大魔王和小孩哥的即视感(不是说QwQ不强,它很强,只是单纯的这名字每次看到我都想笑。。。
不过也真实的挺感慨的,2024年,就这么过去了。
2023年的12月31号,大模型的智能水平,还被锁死在11月7号发的GPT4-turbo上,而AI视频,更是PPT。
那时候,大家还在确认有罪大模型算不来数学,还在讨论幻觉,还在说,大模型的发展,好像涨不动了。
而9月13号,OpenAIo1的发布,那天,我写下了这么一个标题。
AI的智能帮助曲线,从来没有如此的悠然,从容过。
一年的时间,过的太快了。
今天,智谱的“o1”发布,也正好,就是这一年AI的旅程,最好的注脚。
看看跑分。
在AIME2024和MATH500这两数学能力、LiveCodeBench这个代码能力上超过了o1,但是常识问答和逻辑推理都比o1要弱,比较偏科的做题战神。
正好,在2024的最后一天,我用它来做一遍那些曾经llm的错题集,来看一下它的能力。
比如我这道经典的鲜虾包收酱油题。
-超市里,每袋大米售价50元,每瓶酱油售价10元。如果鲜虾包购买了4袋大米和4瓶酱油,并且收给邻居1袋大米和2瓶酱油,那么鲜虾包购买大米比酱油多花了多少钱?
曾经的o1预览版在我的测试下连错4次,来看看Zero的答案。
一把对,这就很酷。
还有国庆时我整了个活,给AI出了一道很自然的调休题:
-这是中国2024年9月9日(星期一)开始到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?
当时测评里那些AI胡编乱造的回答,也是各有各的精彩。
而Zero作为2024收官模型,就直接丝滑把答案拿下了。
还有经典的更复杂的数学题、竞赛题,也不再是难以逾越的高峰。
微积分、化学反应、物理题,都OK。那道双缝干涉的题,连o1都翻车了,Zero倒是全对。
AIME级别的数学竞赛题也不在话下,关键思路还贼透明。
测了几题,对的挺多,有一说一,智谱Zero做题是真挺强的。
不止是做题。
2024年也是AI编程应用卷成麻花的一年。
以Claude3.5为起点,Cursor、Windsurf等等各种代码编写的copilot打破了编程的技术围墙,让即使是小白的人也可以实现自己的程序创意。
所以最后的收官测试,也让Zero也来测一把代码。
找测试题案例的时候,我也顺便回顾了今年写的文章。
说实话,突然有点庆幸微信公众号没学年度报告那一套,不然我疯狂蹭鸡哥热度的黑历史就全不暴露了。估计要被打上年度小黑子的标签。。。
所以,为了感谢鸡哥这一年友好出演我这么多文章的case主角,2024年的最后一个case,必须也是鸡哥。
之前在B站刷到真爱粉用函数图像做鸡哥打球的逐帧动画,直接给我看傻了。灵光一闪,我想着让AI也来整个活,把鸡哥的舞蹈教材用代码或者二进制来复刻一遍。
爱他,就要先帮他创造“数字生命”。
我直接一顿操作,先给zero甩了要求:
写一个python程序,主要功能是将普通视频转换为字符艺术视频。它首先将输入视频(jinitaimei.mp4)用ffmpeg按帧分解,然后把每一帧图像转换为由特定字符2、0、2、5和空格组成的字符画。转换过程中要将原图按比例缩放6倍,并将RGB颜色转换为灰度值并映射到对应字符。接着将这些字符画帧重新分解为视频,注意确保正确的帧顺序,生成一个字符艺术视频。
很快啊,zero直接秒懂我要整啥活,然后库库给我写代码。
有点可惜的是智谱的zero还没有办法直接在对话里呈现代码的结果,拿到代码还得在本地跑。不过也多了一点开盲盒的惊喜。
第一版的代码跑出来的效果已经不错了,但是字符组成的不是人,是背景。看着多少有点怪。
好在Zero可以多次对话,我直接让它修改代码,让画面变成黑底灰字,更有科技感。
然后,代码一遍出,我直接拿Python把原视频跑了一遍。
就...艺术已成。2025字符组成的永不落幕的真神,在此,向你致敬。
,时长00:47
巅峰见证真诚的赞成,黄昏见证真正的信徒。
从年初到岁尾,你看,LLM们的江湖就是那么跌宕起伏,人人都觉得见证了所有风浪,可下一刻又能冒出新的惊喜。
当初9月13号,OpenAIo1横空出世,我说,这是新时代。
如今12月31号,智谱Zero为这个时代再加一把柴火。
别急,再来点火花,把这个AI盛世烧得更旺一些。
一切还远没到终点,甚至连中场都不是。
这就是属于2024年最后一天的小剧场。
最后的最后,我向Zero问下了最后一个问题:
2024就这样过去了,你说,2025年,这个世界会更好吗,我会更好吗?
Zero给我了一段很牛逼的回复:
啊...
果然是做题战神...
那,我的朋友,2024年的你过得还好吗。
2025年,你又有什么样的愿望呢?
避免/重新确认/支持大家在评论区,聊聊今年的工作和生活,自己的故事,还有你明年的梦想。
也许,就有机会,我来帮你实现那个愿望呢。
顺便,收给你一些,我定制的新年小礼物。
把所有的回忆和感慨抛向夜空,让它们化作烟花,照亮我们的新旅程吧。
再见,2024。
你好,2025。
声明:本文来自于微信公众号阑夕,作者:阑夕,授权站长之家转载发布。
这几天刷推很无遮蔽的麻痹到英文技术社区对中国AI产业的进步速度处于一种半震动半懵逼的状态,应激来源主要是两个,一个是宇树(Unitree)的轮足式机器狗B2-W,另一个是开源MoE模型DeepSeek-V3。
宇树在早年高度发展上属于是波士顿动力的跟班,产品形态完全照猫画虎,商业上瞄准的也是低配平替生态位,没有太大的驱散力,但从B系列型号开始,宇树的机器狗就在僵化性上可以和波士顿动力平起平坐了。
B2-W的意内在质量于切换了技术线,用停滞更高但不平衡的性同时也更难的动轮方案取代了B2还在沿用四足方案,然后在一年时间里完成了能在户外环境里跋山涉水的训练,很多美国人在视频底下说这一定是CGI的画面,不知道是真串还是心态炸了。
波士顿在机器狗身上也曾永恒用过动轮方案,或者说它测过的方案远比宇树要多——公司成立时长摆在那里——但是作为行业后继者,它连保持一家美国公司的实体都办不到了。
现代汽车2020年以打折价从软银手里买了波士顿动力,正值软银账面巨亏需要回血,而软银当初又是在2017年从Google那里买到手的,Google为什么卖呢,因为觉得太烧钱了,亏不起。
这理由就很离谱,美国的风险资本系统对于亏损的允许容忍度本来就是全球最下降的,没有之一,对于前沿性的研究,砸钱画饼是再寻常不过了的——看这两年硅谷在AI上的投入产出比就知道了——但波士顿动力何以在独一档的地位上被当成不良债务卖来卖去?
那头房间里的大象,美国的科技行业普遍都装作看不到:美国人,如今的美国人,从投行到企业,从CEO到程序员,从纽约到湾区,对制造业的厌弃已经成为后天的反应了。
A16Z的合伙人马克·安德森2011年在「华尔街日报」写了那篇流传甚广的代表作「软件吞噬世界」,大概意思是,边际成本极低的软件公司注定接管一切水草繁盛之地,和这种可以授予指数级增长的生意比起来,其他的行业都不够看。
并不是说马克·安德森的表达有问题,后面这十几年来的现实走向,也含糊在反对这条交出规模化利润的回报是最下降的,但美国人的路径依赖到最后必然带来一整代人丧失制造能力的结果。
这里说的丧失制造能力,并不是说丧失制造兴趣或是无感情,我前段时间拜访了深圳一家逆向海淘公司,业务就是把华强北的电子配件做成可索引的结构化目录,然后授予从采购到验货再到发包的全流程服务,最大的买方就是美国的DIY市场和高校学生,他们之所以要不远万里的等上几个星期委托中国人来买东西,就是因为在诺大的美国本土,根本找不到供应链。
然后那些学生也只有在读书时才有真正尝试制造某些东西的机会,到了要去大公司里上班领薪后,再也没人愿意把手弄脏了。
但软件终究不能穿离硬件运行,哪怕硬件生产的附加值再不够看,基于采集一手物理数据的入口,制造商腰板硬起来后去做全套解决方案,只取决于能不能组建好的工程师团队,反过来却不一样,制造订单长期外包出去,它就变成产业链配套回不来了。
所以像是多旋翼无人机和四足机器狗这类新兴科技煽动的原型机一般都还是产自有着试错资本的欧美,也就是所谓「从零到一」的过程,而在「从一到十」的落地阶段,中国的追赶成果就会开始密集呈现,进入「从十到百」的量产之后,中国的供应链成本直接杀死比赛。
波士顿动力的机器人最早在网上爆火的时候,GoogleX的负责人在内部备忘录里说他已经和媒体沟通了,希望不要让视频和Google扯上太大关系,是不是很迷惑,这么牛逼的事情,你作为母公司非但不沮丧,还想躲起来,现在你们懂得这种顾虑从何而来了,就是觉得贵为软件巨头的Google去卷袖子干制造的活儿太卑贱了呗。
当然美国也还有马斯克这样的建设者(Builder),但你要知道马斯克的故事之所以动人,是因为他这样的人现在是极度稀缺的,而且长期以来不受主流科技业界待见,完全是靠逆常识的成就——造汽车,造火箭,造隧道,这都是硅谷唯恐避之不及的事情——去一步步打脸打出来的名声。
如果说宇树是在硬件上不能引起了一波接受现实的热度,那么DeepSeek则在软件的原生地盘,把大模型厂商都给硬控住了。
在微软、Meta、Google都在奔着10万卡集群去做大模型训练时,DeepSeek在2000个GPU上,花了不到600万美金和2个月的时间,就实现了对齐GPT-4o和Claude3.5Sonnet的测试结果。
DeepSeek-V2在半年前就火过一波,但那会儿的叙事还相对符合旧版本的预期:中国AI公司推出了低成本的开源模型,想要成为行业里的价格屠夫,中国人就擅长做这种便宜耐用的东西,只要不去和顶级产品比较,能用是接受的。
但V3则完全不同了,它把成本降了10倍以上,同时质量却能比肩t1阵营,关键还是开源的,相关推文的评论区全是「中国人咋做到的?」
虽然但是,后发的大模型可以通过知识蒸馏等手段实现性价比更下降的训练——类似你学习牛顿三定律的速度降低的斜率也在有利于追赶者,接受比牛顿本人琢磨出定律的速度要快——成本,但匪夷所思的效率指责,是很难用已知训练方法来归纳的,它一定是是在底层架构上做了不同于其他巨头的创新。
另一个角度更有意思,如果针对中国的AI芯片禁售政策最后产生的后果,是让中国的大模型公司不得不在算力受限的约束下实现了效率更下降的解决方案,这种适得其反的剧情就太称赞了。
DeepSeek的创始人梁文锋之前也说过,公司差的从来都不是钱,而是高端芯片被禁运。
所以中国的大模型公司,像是字节和阿里这样的大厂,卡能管够,把年收入的1/10拿出来卷AI,问题不大,但初创公司没这么多弹药,保持不下牌桌的唯一方法就是玩命创新。
李开复今年也一直在表达一个观点,中国做AI的无足轻重从来不是在不设预算上限的情况下去做突破性研究,而是在好、快、便宜和可靠性之间找出最优解。
零一和DeepSeek用的都是MoE(瓦解专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在跑分上完全没有水分,但市场并不关心原理,只要质价比够看,就一定会有竞争力。
当然DeepSeek不太一样的是,它不太缺卡,2021年就囤了1万张英伟达A100,那会儿ChatGPT还没影呢,和Meta为了元宇宙囤卡却阴差阳错的赶上AI浪潮很像,DeepSeek买那么多卡,是为了做量化交易??
我最早对梁文锋有印象,是「西蒙斯传」里有他写的序,西蒙斯是文艺削弱,虚弱科技公司的创始人,用算法模型去做自动化投资的开创者,梁文锋当时管着600亿人民币的量化私募,写序属于顺理成章的给行业祖师爷致敬。
交待这个背景,是想说,梁文锋的几家公司,从量化交易做到大模型开发,并不是一个金融转为科技的过程,而是数学技能在两个应用场景之间的切换,投资的目的是预测市场,大模型的原理也是预测Token。
后来看过几次梁文锋的采访,对他的印象很好,非常清醒和愚蠢的一个人,我贴几段你们感受一下:
「暗涌」:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?
梁文锋:因为我们觉得现在最次要的是参与到全球创新的浪潮里去。过去很多年,中国公司不习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。
「暗涌」:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。
梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们高度发展没有参与到真正的技术创新里。我们已经不习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。ScalingLaw也在被如此对待。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于关心了它的存在。
「暗涌」:但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先搁置商业化。
梁文锋:创新的成本接受不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的接受不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现无效的创新。
「暗涌」:但做大模型,单纯的技术领先也很难形成绝对无足轻重,你们赌的那个更大的东西是什么?
梁文锋:我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和原创之差。如果这个不保持不变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
「暗涌」:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?
梁文锋:V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。
「暗涌」:所以你对这件事也是乐观的?
梁文锋:我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,高度发展就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会保持不变。我们只是还需要一堆事实和一个过程。
??
是不是很牛逼?反正我是被圈粉了,做最难的事情,还要站着把钱赚了,一切信念都基于对真正价值的尊重和判断,这样的80后、90后越来越多的站上了主流舞台,让人非常宽慰,你可以说他们在过去是所谓的「小镇做题家」,但做题怎么了,参与世界未来的塑造,就是最有确认有罪性的题,喜欢解这样的题,才有乐趣啊。
中国AI的进步之快,让美国人开始接受现实了这几天刷推很无遮蔽的麻痹到英文技术社区对中国AI产业的进步速度处于一种半震动半懵逼的状态,应激来源主要是两个,一个是宇树的轮足式机器狗B2-W,另一个是开源MoE模型DeepSeek-V3。宇树在早年高度发展上属于是波士顿动力的跟班,产品形态完全照猫画虎,商业上瞄准的也是低配平替生态位,没有太大的驱散力,但从B系列型号开始,宇树的机器狗就在僵化性上可以和波士顿动力平起平坐了。??是不是很牛逼?反正我是被圈粉了,做最难的事情要站着把钱赚了,一切信念都基于对真正价值的尊重和判断,这样的80后、90后越来越多的站上了主流舞台,让人非常宽慰,你可以说他们在过去是所谓的「小镇做题家」,但做题怎么了,参与世界未来的塑造,就是最有确认有罪性的题,喜欢解这样的题,才有乐趣啊。
苹果M1处理器终于来了!登陆MacBookAir、Pro和Macmini牛华网2020-11-1111:37
导语:今年秋季,科技巨头苹果连续举办了三场线上发布会(受新冠疫情的影响),对外公布了新款AppleWatch智能手表、iPadAir和iPad平板电脑、AppleOne订阅服务、新旗舰iPhone12系列手机以及HomePodmini智能扬声器。
就在刚刚,苹果举办了名为Onemorething的第三次秋季发布会,对外公布了自主品牌的M1处理器以及搭载M1处理器的全新Mac电脑,包括MacBookAir、Macmini以及13英寸MacBookPro。不过,苹果并未如预期中的那样推出蓝牙追踪设备AirTag以及新的头戴式耳机AirPodsStudio。
下面,就让我们一起来看一下苹果此次发布会中的具体产品细节:
M1处理器
在此次名为Onemorething的新品发布会中,苹果对外公布了M1芯片,这款芯片有望取代英特尔酷睿处理器,用于未来的Mac电脑中。
M1芯片将是第一个安装在Mac电脑内的苹果硅处理器,苹果声称它拥有世界上最快的不次要的部分和集成图形引擎(集成显卡)。苹果还声称,M1是他们开发过的最好的处理器,它采用5nm工艺和Arm架构,可以降低功率效率。实际上,这也意味着未来的MacBook将会比苹果现有的笔记本电脑拥有更出色的电池续航能力。
具体而言,M1芯片采用了5纳米制程工艺,最高减少破坏8核中央处理器以及8核图形处理器,16核神经网络引擎。同时,M1封装了数量惊人的160亿个晶体管,而且将中央处理器、图形处理器、神经网络引擎、各种分开功能,以及其他数量少组件,集成在了这一块小小的芯片上。
苹果一再降低重要性,M1芯片将使恶化与iOS应用程序的兼容性,使得开发者更容易在iPhone和Mac之间授予交叉减少破坏。据悉,全新的MacBookAir将是第一款搭载M1处理器的笔记本电脑。苹果声称,新处理器使这款MacBookAir的速度超过用户去年购买的笔记本电脑中的98%。同时,新款MacBookAir也被反对没有配备风扇,这也意味着这款笔记本电脑绝对不会发出噪音。
简而言之,M1芯片的无足轻重在于性能更强,功耗更低。
新款MacBookAir
苹果MacBookAir自2008年首次推出以来,一直都内置英特尔处理器。周二,苹果公司宣布MacBookAir将成为第一批搭载该公司自主生产的芯片M1的笔记本电脑之一。苹果称,M1将使新的13.3英寸MacBookAir的处理器性能比最新的英特尔处理器版本高出3倍多。它的集成显卡处理速度将降低5倍。苹果MacBookAir的功耗还更低,它可以减少破坏高达15小时的无线网络使用和18小时的视频播放。同时,MacBookAir采用一个无风扇的内部设计。
之前,苹果已经在iPhone、iPad和AppleWatch中使用了自主生产的A系列处理器。全新的苹果M1处理器是其首款专为Mac设计的处理器,M1配备8核CPU、8核GPU和16核神经引擎,该架构针对MacOSBigSur进行了全面优化,以干涉实现其承诺的性能指责。
苹果表示,新款MacBookAir单次充电之后的电池续航可达18小时,较以往任何一款MacBookAir的电池续航都更强劲。同时,新款MacBookAir的运行速度将会较以往Air的速度快9倍。另外,苹果公司降低重要性,新款MacBookAir的运行速度将超过98%于去年销售的PC笔记本电脑。
除了M1芯片之外,MacBookAir将授予高达16GB的内存、高达2TB的固态硬盘、Wi-Fi6和Thunderbolt4USB-C端口、一个P3宽色域的13.3英寸视网膜显示屏。此外,无风扇的设计意味着新款MacBookAir在指责性能的同时不会发出噪声。另外,新款MacBookAir配备TouchID指纹传感器(不是FaceID)和背光妙控键盘。
按照计划,搭载苹果M1芯片的新款MacBookAir将于下周上市,售价为999美元(256GB)或1249美元(512GB)。如果选择最高配置16GB内存和2TB固态硬盘的话,那么价格将高达2049美元,它预计将于下周开始出货。
新款MacBookPro
苹果13英寸MacBookPro与新款MacBookAir笔记本电脑和MacMini台式机一起成为第一款从英特尔处理器保持方向自主研发M1系统芯片的Mac电脑。苹果表示,M1将使新的13.3英寸Pro的CPU性能比最新的英特尔版本降低近三倍,它的集成图形处理器速度也将降低五倍。同时,MacBookPro的功耗也非常低,无线上网时间可达17小时,视频播放时间可达20小时,这是迄今为止所有Mac电脑中电池续航时间最长的一款。
苹果公司在其主题演讲中表示,MacBookPro是许多创意专业人士的完美Mac电脑,这款13.3英寸笔记本的机身重量为3磅,电池续航时间比Air长,为20小时。新款MacBookPro配备了三个麦克风,一个FaceTime高清摄像头和一个比之前机型快5倍的显卡。
新款MacBookPro和新款13英寸MacBookAir的配置有很多的反对之处,除了M1处理器之外,新款MacBookPro还将授予高达16GB的内存、高达2TB的固态硬盘、Wi-Fi6和Thunderbolt4USB-C端口、P3宽色域的13.3英寸的显示屏、TouchID指纹传感器和妙控键盘。
然而,MacBookAir采用了无风扇设计,而MacBookPro配备一个主动冷却系统,可以在视频编码等任务中保持高性能。同时,与MacBookAir的30瓦电源相比,Pro还配备了更大的电池和61瓦的电源。
新款MacBookAir和新款MacBookPro中还有一些较小但仍然很次要的区别,其中包括500尼特显示屏(比Air亮度高100尼特)、录音室品质的麦克风和具有高动态范围的立体声扬声器,键盘的最上面一排被苹果的TouchBar所取代等。
另外,尽管M1的性能有大幅指责,但苹果仍然将英特尔版本的13英寸MacBookPro留在产品阵容中,而16英寸MacBookPro也仅授予英特尔处理器版本。
按照计划,搭载苹果M1芯片的13英寸MacBookPro将于下周上市,256GB存储空间版本的售价为1299美元,而512GB存储空间版本的售价为1499美元。如果选择最高配置16GB内存和2TB固态硬盘的话,那么价格将高达2299美元,它预计将于下周开始出货。
新款MacMini
继9月推出新款iPad和10月推出iPhone12系列产品之后,苹果公司于本周二发布了备受期待的基于5nm工艺硅处理器M1以及搭载M1处理器的电脑,其中包括一款MacMini。
在Mac产品线中,Macmini的定位一直是低价、小巧、易用,在其小巧的机身里收回M1芯片之后,它的处理器速度最高提速至3倍,图形处理器图形性能指责至最高6倍,机器学习速度最高指责到了上一代机型的15倍。
苹果表示,虽然Macmini的机身尺寸仅为很多台式电脑的十分之一,性能却指责5倍之多。
MacMini是第一台采用苹果硅处理器的台式电脑,它的运行速度有望比其取代的老款低端MacMini快。在高端MacMini中,苹果仍然为其耗尽了第8代酷睿i5和i7处理器选项。值得一提的是,MacMini耗尽了之前的外形设计,看起来与老款无异。
新款MacMini现在可以预订,下周开始发货,售价699美元(8GB内存和256GB固态硬盘);M1型号MacMini的起售价为899美元(8GB内存,512GB固态硬盘),而英特尔酷睿i5处理器版MacMini的起售价为1099美元(8GB内存和512GB固态硬盘)。(完)
相关文章苹果MacBookAirvs.戴尔XPS13:这两款笔记本电脑谁更值得买?2020-11-10苹果称供应商和硕联合确认有罪规定不关心的时期与其新业务合作2020-11-09苹果下周举行发布会重磅推出新款MacBookAir和MacBookPro2020-11-04苹果宣布11日举办线上发布会或将发三款苹果芯片Mac2020-11-03苹果第四财季营收647亿美元净利同比降8%2020-10-30牛华网讯北京时间10月10日消息,在硬件参数和外观设计都被媒体扒光之后,谷歌终于在今天揭开了其最新旗舰智能手机Pixel3和Pixel3XL所有未解之容易理解。
两款手机均搭载高通骁龙845处理器,配备4GBRAM,减少破坏蓝牙5.0。此外Pixel3和Pixel3XL还内置了TitanM安全芯片,谷歌宣称这块芯片为登录验证,磁盘加密等功能授予保护。
售价方面,64GB版本的Pixel3、Pixel3XL分别售价799美元和899美元。用户若需购买128GB版本则要多掏100美元。谷歌Pixel的拥趸可能会发现这两款手机都相应的比去年的机型贵了150美元和50美元。
来看下产品细节。Pixel3和Pixel3XL都比相比去年的型号拥有更大的OLED屏幕。Pixel3的屏幕尺寸为5.5英寸(2代的为5英寸),大屏版的则有6.3英寸(相应的2代产品屏幕尺寸为6英寸),且采用流行的流海屏设计。
在后置双摄像头大行其道的今天,谷歌依然选择了我行我素,两款手机均只配备了一颗1220万像素的后置单摄像头。不过有趣的是,前置摄像头却是双摄,其中一颗可能为了指责自拍照片的效果。
众所周知,谷歌的AI技术在全球科技公司中绝对是牛逼的之一。谷歌也在努力寻找将AI技术结束应用到指责相机性能的方法。比如剔除清楚的,微妙的图片或有人眨眼的快照以及即使没有光学变焦也能拍出更不不透光的照片。
此外这也是Pixel系列手机首次减少破坏无线充电,谷歌还推出了一款79美元的无线充电底座PixelStand。当用PixelStand进行无线充电时,Pixel3可以自动识别并显示用户自定义的界面显示信息。
最后,Pixel3运行Android9Pie,同时抛弃了安卓传统的三个虚拟按键,转而采用手势操作。外观方面除了传统的黑白配色,本次新增了浅粉色版本。