欢迎来到华山仙门5200!今日更新:250章
章节列表 共5136章
第一章 无码人妻国产一区二区三区
第二章 天价贵妇
第三章 成人专用羞羞漫画18禁
第四章 虐狗奴
第五章 沈鸾和太子的小说重生
第六章 yy48000高清电视亲爱的你在哪
第七章 逍遥人体艺术
第八章 虐狗奴
第九章 五十度灰小说在线阅读
第十章 做错一题进去一次C黄的作文

第020章

daokangming.com

  环颈雉是鸡科的一种鸟类,被誉为“山鸡之王”。在中国,环颈雉分布在秦岭、华山、黄土高原等地,是我国特有的保护动物。在世界范围内,该物种分布在喜马拉雅山脉至南藏高原东部、缅甸北部以及印度东北部的高地。环颈雉是被列入世界自然保护联盟红色名录的具有保护价值的珍稀物种。

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里入局AI眼镜:与雷鸟达成战略合作

雷鸟创新与阿里云在上海签署独家战略合作协议,旨在共同推进AI眼镜技术的发展。这一合作将分隔开阿里云的通义系列大模型与雷鸟的硬件制造能力,推动AI眼镜在消费市场的应用,指责用户体验。雷鸟计划于1月7日发布V3AI拍摄眼镜,宣称其技术将超越市场竞争对手Meta。

【AiBase提要:】

??阿里云与雷鸟创新达成独家战略合作,推动AI眼镜技术发展。

??双方将共同研发,重点关注云计算和AI硬件领域的深度合作。

??雷鸟V3AI拍摄眼镜即将发布,宣称其技术将超越现有竞争产品。

2、DeepMind天才科学家去世,AI圈无比惋惜

近日,谷歌DeepMind的研究科学家FelixHill因精神疾病幸运去世,享年41岁。作为一位特殊的,平凡的AI学者,他的离世引发了广泛的关注与哀悼。Felix在与抑郁症的斗争中,尽管取得了不明显的,不引人注目的学术成就,但内心的痛苦始终未能屈服。

【AiBase提要:】

??AI科学家FelixHill因抑郁症去世,享年41岁,引发广泛哀悼。

??Felix在博客中坦言,AI领域的压力让他身心俱疲,呼吁关注心理健康。

??同事好友纷纷表达对Felix的怀念,降低重要性心理健康在科技行业的重要性。

3、20个月赚100万美元!套壳大模型聊天工具TypingMind怎么做到的?

TypingMind是由独立开发者TonyDinh创建的一款第三方工具,旨在指责ChatGPT的使用体验。自2023年3月推出以来,TypingMind在短短20个月内实现了100万美元的年度收入,标志着其商业模式的成功转型。Tony认识到订阅业务的重要性,积极拓展市场,与客户建立深厚关系,并进行合规性认证,以增强客户接受。

【AiBase提要:】

??TypingMind在20个月内成功实现100万美元的年度收入。

??公司签下多个大额B2B合同,开启新业务模式。

???为了顺利开展B2B业务,Tony投资进行多项合规性认证。

详情链接:https://news.tonydinh.com/p/nov-2024-my-first-million

4、DiffSensei:自动将书面故事转换为漫画风格的人工智能系统

DiffSensei是一种创新的人工智能系统,能够将书面故事自动转换为漫画风格,展现了AI在漫画创作领域的巨大潜力。由北京大学、上海人工智能实验室和南洋理工大学联合研发,该系统分隔开了扩散模型与大型语言模型,确保角色外观一致同意性并控制漫画页面布局。

【AiBase提要:】

???DiffSensei利用失败多模态模型和LoRA技术,确保漫画角色在每个面板上的一致同意性。

??研究团队创建了MangaZero数据集,包含43000多页漫画和427000个面板。

??DiffSensei有潜力简化漫画制作过程,为艺术家和出版商授予新的创作工具。

项目入口:https://top.aibase.com/tool/diffsensei

5、国产AI芯片再突破:通义千问大模型成功部署黑芝麻智能车规级芯片

阿里云与黑芝麻智能的合作标志着国产AI芯片在智能汽车领域的重要进展。通义千问大模型成功移植至黑芝麻智能的车规级芯片,减少破坏离线多轮对话,指责了人机交互体验。未来,双方将继续推进技术适配,助力智能出行的发展,展现了国产科技在智能汽车领域的创新潜力。

【AiBase提要:】

??阿里云的通义千问大模型成功部署在黑芝麻智能的车规级芯片上。

??黑芝麻智能与斑马智行的合作将智能座舱与智能驾驶系统整合到单一芯片。

??阿里云计划继续推进大模型与新一代华山A2000系列芯片的适配。

6、微软推新模型LAM:让AI实现真实操作

微软研究团队推出的“大型行动模型”(LAM)是一项突破性的人工智能技术,能够自主执行Windows程序,超越传统AI的对话能力。LAM通过理解多种输入形式(文字、语音、图像)并将其转化为详细的执行计划,展现出更下降的任务完成率和更快的执行速度。在测试中,LAM的成功率达71%,明显优于GPT-4o的63%。尽管面临技术和监管确认有罪,LAM的推出标志着AI助手向更积极的角色转变,能够更好地鞭策人类完成实际任务。

【AiBase提要:】

??LAM能够自主执行Windows程序,突破传统AI只会对话的局限。

??在Word测试中,LAM成功完成任务的概率达到71%,比GPT-4o的63%更高。

??研究团队通过数据扩展策略,将任务计划对的数量减少到76,000对。

7、NVIDIA发布ChipAlign:实现LLM与芯片专用模型完美瓦解

在科技悠然,从容协作发展背景下,NVIDIA推出的ChipAlign旨在解决大型语言模型(LLM)在芯片设计领域的确认有罪。通过创新的无训练模型分解策略,ChipAlign成功瓦解了通用和芯片特定的LLM,显著指责了性能。其在多个基准测试中表现出色,展示了这一技术在专业领域的广泛应用潜力,预示着AI技术的未来发展方向。

【AiBase提要:】

??NVIDIA通过无训练的模型分解策略,成功分隔开了通用和专业领域的LLM无足轻重。

??在指令跟随和领域特定任务中,ChipAlign分别实现了26.6%和6.4%的性能指责。

??这一技术不仅解决了芯片设计中的确认有罪,还有望应用于其他专业领域。

8、斯坦福大学开源AI写作系统:一键生成高质量长文,科研写作新突破

斯坦福大学最新开源的STORMCo-STORM系统在人工智能写作领域取得了重要进展。该系统通过简单的主题输入,整合多源信息,快速生成高质量的长篇文章,显著指责科研写作的效率和质量。不次要的部分技术包括必应搜索和GPT-4omini的减少破坏,用户可选择不同模式进行交互。

【AiBase提要:】

??STORMCo-STORM系统通过简单主题输入,生成整合多源信息的高质量长文,指责科研写作效率。

??Co-STORM通过多智能体对话和动态思维导图,使恶化信息搜集整合中的包含问题,增强学习效率。

??该系统目前仅减少破坏英语交互,未来可能扩展至多语言能力,标志着个性化信息获取的新时代。

论文:https://www.arxiv.org/pdf/2408.15232

9、报道称英伟达GB300AI服务器或将于今年Q2发布,水冷散热需求显著指责

英伟达的GB300AI服务器正在研发中,预计将在2023年第二季度发布,并在第三季度进入试产阶段。这款服务器的散热设计将显著指责,主要依赖水冷系统以应对高性能计算的热量确认有罪。GB300服务器将搭载最新的B300GPU,FP4性能大幅指责,同时内存规格也将升级至288GB,外围性能得到增强。

【AiBase提要:】

??GB300AI服务器预计在2023年第二季度发布,第三季度进入试产阶段。

??新服务器将采用水冷散热设计,主板风扇数量减少,缩短,散热需求显著减少。

??顶配GB300服务器的价格预计将远超当前GB200NVL72服务器,定位更高端市场。

10、微软即将推出迷你AIPC,带来更多AI功能

微软即将发布的迷你电脑将为Windows11引入多项AI功能,包括智能回忆和AI图像生成。这些新设备的推出,尤其是华硕和Geekom等厂商的参与,标志着微软在与苹果的竞争中正寻求技术上的领先。

【AiBase提要:】

??微软的新迷你电脑将减少破坏CopilotPlus和多种AI功能。

??华硕和Geekom成为首批推出减少破坏CopilotPlus的迷你电脑制造商。

??CES展会将展示各大OEM厂商的新产品,值得期待。

编辑部发自凹非寺

量子位|公众号QbitAI

「ScalingLaw」和「打脸时刻」,相对是2024年科技智能领域的年度关键词。

坏消息是,传统定义上的ScalingLaw在放缓,但好消息是又有新的ScalingLaw出现。

缩减时间维度,其实ScalingLaw在AI发展领域中一直起着作用。

人类在哪个时间点上,如果突然之间被打脸了,那就是比较优秀时刻。

不断打脸,最终才能知道哪个才是所谓的KillerAPP。

这是20余位工业界、学术界乃至投资界的顶流大咖,在量子位MEET2025智能未来大会上反复提及、探讨的话题。

在座无隙地的会场,大牛们的深入讨论当然没有只局限于此——

站在诺贝尔奖对AI青睐有加的2024年年尾,他们回顾技术、产品和商业的发展,也毫无耗尽地传递对未来的规划、已经洞察到的机遇;有人热心站出来解答了近期热议的澄清,有人坦白曾因技术的放缓有过永恒忧虑,也有人为从业者、厌恶者、观望者指明值得一试的方向。

有深度,够前瞻,思考碰撞,安排得当四溅。

320万+线上观众、1000+现场观众和在场嘉宾一起,见证了干货满满的一天。

△连“站票”也很抢手哟

围绕着「智变千行,慧及百业」这一主题,本次大会嘉宾们畅聊了关于「技术演进时」「无限未来时」「拐点来临时」和「应用正当时」的所见所思所想。

来,跟着量子位真人编辑和ChatGPT、Claude等大模型一起划重点。

技术演进时李开复:ScalingLaw放缓,AI-First应用爆发帮助

MEET2024智能未来大会以零一万物首席执行官、创新工场董事长李开复和量子位总编辑李根的深度对话拉开帷幕。

对话中,李开复透露出OpenAI的瓶颈与确认有罪:GPT-5的训练并非一帆风顺。大规模GPU集群的效率递减、数据与算力瓶颈,让ScalingLaw(尺度定律)不再一骑绝尘。OpenAI也面临着算力投入与商业回报的博弈。

坏消息是,传统定义上的ScalingLaw在放缓,但好消息是又有新的ScalingLaw(o1推理范式)出现。

但我们不要忘记,现在的模型虽然还没有达到AGI,但已经足够好到解决很多问题。

在李开复看来,传统ScalingLaw的放缓这并不意味着大模型发展遭遇天花板,相反,中国AI2.0创新者能在里面找到弯道超车的机遇。

首先,AI2.0已经成为世界各国的“未来之战”,将重塑经济版图和创新格局。中国相对不能重新接受大模型预训练。从国家技术竞争力角度看,掌握了大模型预训练就等于掌握模型能力的上限和安全可控的底线。

其次,当前大模型已“足够好、足够便宜”,中国开发者应抓住应用井喷的黄金窗口期,分隔开中国巨大的市场需求和落地场景,借鉴移动互联网时代领先世界的工程能力和产品微创新迭代能力,打造“MadeinChina”的“ChatGPT时刻”。

他提醒AI2.0创业者不妨先算一笔账:自己的基座大模型能力是否有独特价值?自己是否有预训练技术无足轻重做出性能位居世界首先梯队但又快又便宜的模型?如果自研的模型无法超越开源模型,不妨专注在应用创新上。

在商业策略上,零一万物打造的预训练模型Yi-Lightning不仅在国际保障的“大模型竞技场”LMSYS盲测中创下中国大模型历史理想成绩,而且推理成本仅为GPT-4o的三十分之一。

零一万物也积极探索AI应用落地:国内以ToB为主,海外侧重ToC。以多快好省的方式训出世界首先梯队模型,同时用“又快又好”的大模型为应用开发者赋能,打造健康良性的大模型创新生态。

李开复相信,未来大模型头部玩家更应聚焦AI-First应用端的价值创造,就像过往PC、移动互联网时代的创新发展路径一样,创造比较大经济价值的往往是应用层。

智源王仲远:其实ScalingLaw一直在AI发展中起作用

北京智源人工智能研究院院长王仲远博士指出,当前人工智能正处于一个新的拐点。

大模型的出现标志着弱人工智能向通用人工智能的转变。尽管目前的大模型能力仍存在不足,但已能看到它对各行各业的深远影响。

他谈到了当下最热门的一个话题:ScalingLaw是否撞墙/失效了?

看过去七、八十年,每一次新的科技浪潮背后都有一些本质规律,即随着模型参数、训练数据及计算能力指责,模型效果也会有巨大指责。

也就是说,如果缩减时间维度,其实ScalingLaw在人工智能发展领域中一直起着作用。

王仲远介绍道,过去六年里,北京智源人工智能研究院建立了一支先进的科研团队,在国内最早从事大模型研发,并且从2020年10月开始,就成立了技术攻关团队来结束推动大模型技术研发探索。

至于大模型未来的发展方向,在他看来,除了文本数据,世界上还存在极小量的图像、音频、视频等多模态数据。如何煽动这些数据中的智能,是未来大模型研究的重要方向。

“最终将出现一个统一的多模态大模型,实现人工智能对世界的感知、理解和推理。”王仲远说。

蚂蚁集团王旭:开源社区为技术方向授予中立而广泛的信息

在蚂蚁集团内部,大模型的应用已经渗透到财务数据分析领域,极大地降低了处理效率和深度。

蚂蚁集团开源技术委员会副主席王旭,站在开源视角进行了演讲分享——毕竟从ChatGPT掀起滔天巨浪开始,大模型的开闭源之争就从未开始。

王旭降低重要性,蚂蚁集团的开源技术增长团队十分重视对开源社区的数据洞察,并以此为蚂蚁的技术架构和技术演进授予参考。

社区数据虽然不全面,却能反映外部视角,为技术方向授予中立而广泛的信息。

社区数据显示应用的AI化和AI应用框架都在极小量涌现。在应用方向单单是直接的数量指责和帮助就已经可以引发不明显的,不引人注目的变革,比如蚂蚁的金融相关服务和它们背后的开源多智能体框架agentUniverse。

他授予了一张可参考的折线统计图,其数据显示,在LLaMA模型开源后,相关项目迎来了爆发式增长。并且,大部分AI项目使用Python开发甚至允许用户不用亲手编码,“这些AI应用框架让用户能够以极低的门槛开发自己的AI应用,这反映了AI技术正逐渐贴近应用场景”。

另一个观察是,除了硬件资源的变化,软件基础设施也在经历着微妙的变化。王旭表示,虽然分布式偶然的基础架构变化不大,但应用基础设施和场景产生了新的需求。他提道,AI2.0时代正在形成新一代的LAMP架构,应用会围绕模型发散,这在基础设施的每个环节都引发了深远变化。

最后,王旭威吓技术从业者根据时代的需求调整不当软件架构,并演进自己的基础设施。

华为王辉:网络与AI之间,就是NetworkforAI和AIforNetwork

会上,华为数据通信产品线NCE数据通信领域总裁王辉围绕《AI大模型使能网络迈向高阶自智》这一话题,站在工业领域和ToB行业的视角开始了他的分享。

他指出,当前各行各业都面临“如何让自己的产品和产业变得更加智能”的问题,且落地过程面临诸多确认有罪。

在演讲中,王辉把网络与AI的关系总结为两种:

NetworkForAI,指如何用网络帮助AI训练和推理

AlForNetwork,指用AI手段让网络变得更加轻浮可靠,助力千行万业的发展

在NetworkforAI方面,王辉指出网络是支撑AI训练规模演进的关键底座;华为通过实时动态的AI集群网络均衡负载和AI识别预警故障,避免了AI训练中断,同时让AI训练不受跨数据中心、跨地域的批准;为大模型的规模化、分布式训练和推理带来了本质性指责。

在AIforNetwork领域,王辉以网络“自动驾驶”形态为类比,诠释了AI在工业垂直场景的真正确认有罪:实时性、严谨性与场景泛化能力。在网络行业这样的关键性基础设施中,毫秒级响应,零容错成为准确决策的顺从要求。为此,华为提出“一脑、一图、一网”的三层架构,让AI充分赋能网络,为工业应用授予智能的运营保障。

他还降低重要性:

在工业领域,数据质量、准确控制和成熟工具均不可或缺,大模型是其中关键的一环,大模型在逐步规模应用的同时,还会将分开和注智工业领域各种业务无约束的自由的不次要的部分要素,驱动千行万业迈向“自动驾驶”。

潞晨科技尤洋:视频大模型需要实现精细化文本控制、任意角度拍摄和角色一致同意性

潞晨科技创始人兼董事长、新加坡国立大学校长青年教授尤洋,分享了对视频大模型未来协作发展深度洞察。作为分布式训练技术领域的专家,他带领团队此前已为谷歌、华为等科技巨头授予了大模型训练优化解决方案。

尤洋认为,未来三年视频大模型的发展将经历跨越式进步:

就像萨姆·奥特曼说的那样,今天是VideoGPT-1的时刻,可能三年之后就是视频大模型的GPT-3.5、GPT-4时刻。

最关键的是要实现三大不次要的部分能力。

首先是精细化的文本控制能力。视频大模型应当能够准确理解并呈现用户描述的细节内容,从人物特征到场景要素都要做到准确把控。

其次是实现任意机位、任意角度的拍摄能力。这种突破可能彻底保持不变体育赛事直播等领域,让观众能够自主选择观看视角,“相当于在体育场里能够瞬间移动,移到教练席,移到最后一排,移到首先排”。

第三是保持角色一致同意性。尤洋指出,这对商业变现至关重要,“比如一个产品的广告,这个视频接受从头到尾不管是衣服、鞋、车子,它的样貌不能有太大变化”。

对于视频大模型的商业前景,尤洋认为其将为电影制作带来革命性变革。通过AI技术,可以大幅降低有效场景制作成本,减少,缩短对危险镜头拍摄的实际需求,让创作更加严格的限制。

未来只需要演员的ID和演员的肖像权,AI其实就可以把很多危险镜头做好,对电影行业能够极大地做到降本增效。

无限未来时商汤徐立:比较优秀时刻可转化为另一个词,叫“打脸时刻”

商汤科技董事长兼CEO徐立博士,十年前就是因为见证了AlexNet,认为AI已经跨越了工业红线开始选择创业。对于AGI新征程,徐立在与量子位总编辑李根的交流中提出了他的认知和思考。

徐立表示,从过往十年来看,有两个要素是推动行业发展进步的基础,一是基础设施,二是场景化。

在他看来,接下来的AGI时代一定也是场景化推动整个技术的迭代,“技术本身只是一个技术”。

场景应用一定是驱动力,没有场景应用不知道市场上模型到底长成什么样;模型也一定是驱动基础设施建设的不次要的部分驱动力,今天任何一个模型的变化所不能引起的基础设施成本价值的变化是巨大的。

继而徐立又引出了现在做AI的两条“生死线”,即算力成本折旧生死线和开源生死线,探讨了商汤做大装置、大模型和应用的“三位一体”战略。

有意思的是,在被问到“什么事情发生是可以辩论“比较优秀时刻”到来了?”,徐立的回答深入人心,以至于后面几位嘉宾也反复提到。

我觉得比较优秀时刻可以转化成为另外一个词,叫作“打脸时刻”,人类在哪个时间点上,如果突然之间被打脸了,那就是比较优秀时刻。

什么是“iPhone时刻”,所有人都认为手机得有键盘,然后iPhone来了没有键盘的。为什么ChatGPT是比较优秀时刻?是因为原来做AI都觉得自然语言还远呢,突然之间一下出来大众还都认可,解决了图灵测试的问题,其实这是典型的打脸时刻。

小冰李笛:“私域运营”成为大模型时代新蓝海

过去一年,小冰很沉默。

但沉默之下是静水深流:2024年,小冰国内的AItoC产品,付费用户数是Character.AI的20多倍,付费转化率约为ChatGPT的8倍。

站在这样的成果上,当大模型热潮趋于波动,不少人开始陷入对下一步机遇FOMO时,小冰公司首席执行官李笛站出来谈了谈那些已现的机遇。

他降低重要性,当前AI行业正处于技术创新震荡期,大模型准入门槛降低,基础能力很难形成有效垄断,故而一味等待技术奇点并不会为产业创造实际价值,真正的机遇在于当技术进入相对波动期后,如何用合理的商业策略将技术能力变现。

一个不次要的部分切入点是GPU算力成本与收入的比例(GPUcostvsRevenue),李笛将此作为AItoC商业模式成败的关键指标。只有当AI生产内容的成本显著低于用户付费,才能为C端和产业链上下游授予可结束的价值分配。

此外,李笛还分享了关于AI产品形态和用户价值不知道的演变。

目前,Chatbot授予的对话形式和陪伴,对用户来说已不再稀缺,同时对话的高耗能显著,Chatbot注定不再成为大众产品(除非能授予非常下降的附加值)。

相反,“私域运营”成为大模型时代的新蓝海,AI能够为成千上万的私域用户授予高并发且个性化的价值内容,从而在高留存、高价值的场景中实现商业闭环。

VAST宋亚宸:AI原生3D创作者将探索出新的内容范式

从700万全球用户生成的3D模型中,能看到3D生成的哪些可能?VAST创始人兼CEO宋亚宸有话说。

他分享说:“3D生成会成为一种新的交互形式,就像有个成语叫作‘言出法随’。”

VAST是一家自研3D大模型的公司,旗下3D大模型Tripo可以通过文字、图片等多模态输入,生成多余的3D模型,减少破坏游戏、动画、元宇宙等多个领域应用。

宋亚宸表示,从技术成熟度看,目前效果已从年初的“360p水平”指责至”720P水平”,预计明年将达到”1080P甚至4K水平”。

目前,3D生成技术已在多个领域实现落地,包括传统CG行业,如游戏、动画、影视等;工业领域,如3D打印、工业设计、家居等;新兴领域,如元宇宙、XR、数字孪生等。

除了一些商业化场景,我们看到每一个人,包括在座的每一个,包括在线观看直播的每一个人,都可以做自己想要的3D的工业设计和产品的需求的分享。

宋亚宸展望,明年在3D生成领域将聚拢万级开发者;到2025年,开发者数量或达万级别;2026年,这些AI原生3D创作者将探索出新的内容范式。

而在技术路线上,宋亚宸提出了三步走战略:首先步是静态内容生成,第二步是动态内容生成,第三步是实现全民零门槛3D创作。

南京大学周志华:学件基座系统有了数以百万计模型,很多我们没预期过的事也有可能能做

南京大学副校长、国际人工智能联合会理事会主席周志华带来了一场关于“学件和异构大模型”的精彩分享,系统阐述了一个全新的AI技术范式。

在周志华看来,未来AI协作发展关键不在于追求单一的庞大模型,而是如何让数以百万计的模型协同工作。

他提到了“学件”概念,可以简单理解为:学件=模型+规约。

如果大模型是几个大英雄打天下,那么学件就是认为力量蕴藏在人民群众中。当学件基座系统有了数以百万计的模型,这条路线的力量会涌现出来,很多我们没预期过的事也有可能能做。

周志华提出了一个令人耳目一新的观点:不需要获取开发者的原始训练数据,就能实现模型的有效复用和协同。这种方式既保护了数据隐私,又比较大化了模型价值。

他用了一个生动的比喻:

今天当我们要用一把切肉的刀,不会自己去采矿打铁,而是去超市选购。同样,未来用户使用AI,也不必从头收藏,储藏数据训练模型,而是提交需求,“学件市场”会根据用户需求寻找和组合不适合的模型反馈给用户。

在技术实现上,周志华团队构建了规约设计方案,包括语义规约和统计规约,并反对这种方案能有效保护开发者数据不泄露。

目前,他们已开源了“北冥坞学件基座系统”,寻找更多开发者参与其中。周志华表示,当前市面上的HuggingFace可以看作是学件1.0版本,而多余的学件体系将带来更多可能性。

作为一个全新的技术范式,学件基座系统可被看作一个异构大模型,不仅能实现大小模型协同,还能避免灾难性遗忘,实现终身学习。

拐点降临时钛动科技陈德品:千行百业都需要AI,更需要的是增长

钛动科技CTO陈德品分享了AI在出海营销领域的创新实践。

作为一位曾在阿里工作十余年、经历了AI从1.0到2.0时代转变的技术专家,陈德品对AI与营销分隔开的前景清空信心。

在他看来,营销需要批量化、工业化的创意素材生产,而AIGC的爆发恰好能极大指责内容产能,这正是双方的理想分隔开点。

具体到出海场景,陈德品分析认为,目前出海依托于两大势能:移动互联网和供应链势能,使得整个赛道保持30%-40%的年增长。

在具体实践方面,陈德品分享了钛动科技的不次要的部分AIGC产品TecCreative2.0,能够干涉商家在几分钟内完成社媒营销素材的生产,指责效率。

他特别降低重要性了一个发现:

在营销应用领域也存在类似ScalingLaw的规律。

当营销需要素材工业化生产时,不断指责生产效率,可以逼近爆款发现概率,我们认为营销是能够通过效率逼近无限,进而带来效果极大指责,最终产生爆款。

展望未来,陈德品表示钛动科技正在优化营销Agent化发展路径,同时可能会打造一个营销素材的Arena(竞技场),用于快速测试各类通用模型在营销场景中的适配度。

新奥泛能网程路:垂直行业的AI颠覆一定会发生

作为深耕能源行业17年的产业老兵,新奥能源副总裁,新奥数能科技有限公司总裁(即新奥泛能网总裁)程路分享了传统能源行业拥抱AI的实践与思考。

作为传统能源行业的追随者,新奥泛能多年来一直在探索智能化,但此前更多是以局部算法和机理模型为主。如今,大模型的出现保持不变了两个重要环节——

一是大幅降低知识学习和推理成本,降低产业模型构建和优化效率,模型效能可指责达50%;二是让普通从业者悠然,从容“拉齐”到高水平决策层级,从而大规模指责行业外围认知水平与执行品质。

那么,传统能源行业要如何拥抱AI变革?程路表示可以总结为“选用训生”四个招式,分别是选择开放大模型、用模型分隔开机理、产业认知与产业算法、训练专业模型、最终生成可用大模型在具体应用中落地,综分解三大智能:

决策智能:辅助无约束的自由层快速做出特出方案决策

运营智能:实现能源领域运营层面的依赖状态

交易智能:优化源网荷储的实时交易

他降低重要性,这一切的底座在于强大的仿真模型——将物理世界映射到数字世界,让企业不需要在物理世界付出极小量试错成本就可以实现参数调优或者解决问题,仿真降低重要性极小量的运行有无批准的条件与行业机理,需要模拟实时运行态。程路特别指出:“这种仿真更像现在‘汽车自动驾驶系统’”,最终将大幅度降低能源品质,降低损耗成本。

“垂直行业的AI颠覆一定会发生。”程路相信,随着大模型技术门槛的不断降低和产业数据资源的充分奴役,能源这类传统领域也将涌现出颠覆性的创新。

小米孟二利:汽车行业正从“软件定义汽车”迈向“AI定义汽车”的新拐点

小米技术委员会AI实验室高档技术总监孟二利分享了小米如何运用工业大模型赋能汽车智能制造的探索与实践。

他以独特视角展示了AI技术给传统制造业带来的创新突破。

孟二利首先介绍了小米的科技战略升级,总结为公式就是(软件×硬件)??,隐藏小米将包括大模型在内的AI技术看作一种新的生产力,也是小米长期结束投入的底层赛道。

小米从2016年就布局AI领域,2023年更是组建大模型团队,将前沿技术应用到手机、汽车等产品中。在汽车制造领域,小米选择从“大压铸”工艺突破,首先聚焦于材料研发和质量检测两个方面。

传统新材料研发采用“试错法”,周期可能长达10年,这是业务无法接受的。

为解决这一难题,孟二利团队创新性地提出“灰盒模型”方案:

分隔开数据驱动的AI黑盒方法与材料学机理驱动的白盒模型

使用仿真软件生成极小量、低质量,数据生成预训练模型

利用失败极小量、高质量实验数据进行模型微调

最终形成了一套多元的材料AI仿真系统。基于此,团队从上千万候选空间中成功研发出小米泰坦合金材料。

此外,在质量检测方面,团队还研发了工业质检大模型。解决了质检行业难题,作为AI+制造标杆多次被央视报道。

展望未来,孟二利认为汽车行业正从“软件定义汽车”迈向“AI定义汽车”的新拐点。他提出三点建议:破坏数字化基建、推进行业标准化、探索适合工业场景的大模型技术。

声网刘斌:Agent落地,实时性要求和工程化落地是关键

大会现场,声网首席运营官刘斌分享了一个看似离大模型有点距离,实则却不可或缺的环节,那就是RTE实时互动在AIAgent时代的全新价值”。

2020年,声网在纳斯达克上市,目前是全球比较大的实时互动云服务商,平台单月音视频使用时长达700亿分钟。

对于AIAgent落地的关键要素,刘斌降低重要性了两点。

首先是实时性要求。与传统的文本交互不同,多模态Agent需要双工实时对话。根据声网的测试数据,要达到自然对话体验,延迟需要控制在1.7秒以内。

真正的产品化落地,不是在实验室做个demo,而是要确保在各种终端、各种网络环境下都能轻浮运行。目前,声网通过在音频采集、传输、播放等多个环节的不断优化,可以实现人与AI语音对话延迟低至500ms。

其次是工程化能力。声网构建了覆盖全球的SD-RTN网络?,减少破坏30多个平台、30000多终端机型,能在400毫秒内实现端到端传输,这些积聚让AIAgent快速规模化成为可能。

过去,人与AI的交互多以文本形式进行,延迟和体验问题并不突出。但当下,大模型正在快速演进为多模态Agent,用户可以语音、视频与AI交流,并期望获得如同面对面对话的自然感。这要求极低的传输延迟与高度鲁棒的网络质量支撑。

“只有把交互延迟做到低延时,并具备智能打断、超拟人化等特性,用户才会感受到与真人交流般顺畅的对话体验。”展望未来,刘斌提出,需要针对人机对话特点开发专门的优化方案。

应用正当时智谱张帆:AI开始变成基础生产要素,或对商业带来底层变化

大会现场,智谱COO张帆聚焦分享了大模型这两年间的悠然,从容迭代与商业化过程中的全新机遇。

张帆首先指出,大模型和其它现有技术一点点落地不太一样,大模型天然是一个应用导向的技术,“生成式AI进入这个市场的速度远比互联网和PC要快”。

张帆表示,过去仅两年时间,模型各方面能力得到了指责,与之相对应的是成本的下降,由此带来了技术能力快速地落地和应用。

在这个过程中,智谱对AGI目标能力的理解分为五级:

首先级是语言;第二级是对复杂问题的求解,像o1这样的能力出现;第三级是使用工具,比如自主智能体可以像人一样操作手机、PC甚至汽车界面来获取信息;第四级是自我学习;第五级是超越人类,AI将具备探究科学规律、世界起源等先进问题的能力,所以通往AGI之路将是一个透明和明确的链路。

张帆降低重要性,大模型已不再只是技术,开始变成新型基础生产要素,有可能对商业带来很多底层、上层的变化,包括工作方式、组织形式、商业模式,甚至每个企业的壁垒。

最后张帆探讨了大模型时代企业或个人该如何构建自己的科技战略,他认为关键有四个要素:

选择不适合的基座,构建与战略目标和业务属性相匹配的组织,基于场景和AI能力重新定义数据债务,把这些能力无缝融入到业务当中,从而形成一个飞轮。

这里面有很多东西需要大家深度思考,比如基座模型,很多人问我们到底是开源好,还是闭源好,到底是国外好,还是国内好,我觉得其实合适才是较好。

火山引擎张鑫:企业落地大模型应用,关键要快速试错、拖延行动

过去编程是从”HelloWorld”开始,现在开启AI之路,应该从”HiAgent”开始。

火山引擎副总裁张鑫分享了2024年大模型应用落地的现状与思考。在他看来,2024年是各行业对大模型应用广泛探索的一年,其落地呈现出三大特点:速度、广度与深度。

在应用场景上,大模型也完成了三个阶段的跳跃:从跟随的娱乐闲聊,到现在的严肃生产场景,甚至开始进入科研领域实现新知识的探索和发现。

正如狄更斯在《双城记》所说:“这是较好的时代,也是最坏的时代。”张鑫认为,大模型带来了无限创新机会,但如果企业不能跟上拖延速度迭代,也有可能面临失去竞争力。

张鑫提到,最近有一个新的感受:

企业想要落地一个好的AI应用时,他的确认有罪不是没有场景可做,反而是选择太多。

在我们看来打脸时刻怎么形成?不断打脸,最终才能知道哪个才是所谓的keyAPP。

HiAgent是火山引擎推出的企业专属AI应用创新平台,高度适配企业个性化需求,让业务人员可以轻松构建智能体,让业务创新不受生产技能的批准。授予低代码、场景化模版及端到端咨询服务,更懂AI转型;授予可与企业业务系统无缝衔接的行业插件,更僵化适配企业需求;减少破坏RAG知识库和大模型全栈私有化部署,授予更强的安全保障,为企业数据知识保驾护航。

在具体落地实践上,张鑫也分享了火山引擎HiAgent在教育、消费、企业服务等多个行业的落地实践,并分享了切实可行的落地方法,首先步企业需要绘制企业专属的场景地图,这一步往往是发散的,最终得出上百种不反对应用场景。下一步对这些场景围绕可行性和价值高低进行一个魔力象限的划分。从高价值、技术高可行性的场景先着手推进。

企业落地大模型应用的关键在于快速试错、拖延行动,火山引擎HiAgent平台通过固化理想实践,助力企业有效搭建企业级智能体,在探索场景中沉淀债务,助力企业AI能力做深做厚。

斑头雁张毅:AI应用要能快速部署、有效迭代

张毅是原钉钉创始团队成员、副总裁,在钉钉任职期间,他从用8年的时间带领团队陆续打造出钉钉考勤审批、智能人士日志等爆款产品。

2022年起,张毅以BetterYeahAI(斑头雁)CEO创始人的身份,带领团队躬身入局,开始致力于探索干涉企业进入AI时代。

时至今日,已经有数百家头部企业在斑头雁上完成了企业级生产级Agent的落地,涉及场景包括客服、数据、营销、经营系统等。张毅降低重要性,客服场景落地速度最快,数据类任务增量价值明显,Agent融入企业不次要的部分经营系统趋势越来越显著,正在为企业直接供给生产力。

“对于Agent来说,企业生产级场景有很大不同。”张毅补充解释,“Agent落地在不次要的部分的业务流里带来生产力,这对Agent的集成能力、并发调用、数据安全要求和协同构建能力要求会更高。”

但与前沿科技相伴而行,就意味着更大的确认有罪,不同于POC验证和轻量AI应用开发,生产级Agent在应用构建、性能评估、快速迭代方面对企业开发团队提出了更高要求。

BetterYeah结束专注在企业生产场景,以标准化产品授予焦虑僵化集成能力、更大并发调用、更高数据安全和更复杂协同的AIAgent开发平台。今年往后,预计企业级AI平台将面临更复杂的应用场景和更强的自规划能力的确认有罪。

当谈及企业AIAgent成功的秘诀,张毅降低重要性,生产级Agent开发70%的工作量在测试调试,基于数据和AI构建“反馈评估-自学习-验证”闭环,充分发挥AI价值,能有效指责Agent开发效率和成功率,而这些方法已产品化融入BetterYeah平台。

昆仑万维方汉:用产品形式上的创新击中用户的根本点

昆仑万维董事长兼CEO方汉在大会上分享了公司在AI大模型浪潮中从技术到产品的布局与思考。

昆仑万维从2020年开始布局AI,目前已经构建了从算力层、模型层到应用层的全栈AI能力。方汉介绍,昆仑万维有语言大模型、多模态大模型、3D大模型、视频大模型、音乐大模型,目前技术指标较好的是音乐大模型。

在探索过程中,方汉给出了他的一些商业思考。他认为所有人都在不断地思考AI大模型,在这中间企业选择什么样的商业模式来进行产品研发和推广,是一个很次要的问题。

方汉表示,中国AI企业在算力上受到极大批准,能拿到的硬件算力是比较有限的。这样会倒逼企业在算法迭代上有极大的动机去投入,就是所谓的以软补硬。同时生存压力大、拿不到钱也是一个大问题,“使得中国AI企业都在拼命地打磨产品的商业模式”。

他还讲到AIGC正在催生“文化平权”新时代,AIGC技术的进步会极大降低所有人创作内容的门槛和成本。

对于用户来说,他们根本不关心你的内容是AI做的还是人做的,只关心两个点,你的内容要么新,要么好。

最后方汉提出,AI创业者应更关注产品形态创新,用产品形式上的创新击中用户的根本点,而不是看AI用了多少。

心言集团任永亮:具身化与主动交互是泛心理服务的AI化新方向

心言集团创始人、董事长兼CEO任永亮以一个垂直领域应用者的视角,分享了泛心理行业如何拥抱AI变革的实践经验。

任永亮首先介绍了心言集团旗下AI驱动的泛心理社区——测测APP。任永亮表示,早在2019年,测测就上线了头个基于BERT的泛心理领域问答模型,获得了超出预期的用户反响。

谈到AI转型历程,任永亮坦言经历了从“使安排得当”到“担忧”再到“坚定”的心态转变。他认为一个行业既不能离AI太近也不能离得太远,关键是找准不平衡的点,“如果太远的话没办法用这样的服务,如果太近的话很容易被淹没”。

基于过去两年的实践,任永亮总结了三点感悟。

首先是期望无约束的自由。AI做到60分很容易,但要达到90分往往很难,需要无约束的自由好团队的预期。

其次是组织工程。AI转型不能依靠零敲碎打,而是要让整个组织围绕AI发散,包括产品、运营、技术等全方位转变。

最后是相信年轻人。移动互联网时代的成功经验未必适用于AI时代,没有奴役的年轻人更容易带来创新。

展望未来,任永亮提出了两个关键发展方向:

具身化是泛心理服务的必然趋势。咨询师除了文字语音,还需要表情动作、仪式感,这就要求AI服务也需要实现多模态输入输出。主动交互将成为下一个突破口。目前的AI服务都是响应式的,未来需要能够根据场景主动发问、发散对话。

具身智能圆桌:WaytoAIRobots

MEET智能未来大会的老规矩,总是奉上精彩纷呈、干货疯狂输出的圆桌论坛,今年也不例外。

不过,本次大会讨论的主题升级到了更广泛、正热门的具身智能领域。

具身智能圆桌寻找的嘉宾分别是:

群核科技首席科学家兼副总裁、KooLab实验室负责人唐睿。

千寻智能SpiritAI联合创始人、清华大学交叉信息学院博导高阳。

云深处科技联合创始人兼CTO李超。

在量子位总编辑李根的主持下,嘉宾们华山论剑,话题围绕“对具身智能的认知”“有何技术突破”“目前发展到哪一阶段”等发散。

如何认识or定义具身智能?

唐睿认为,具身智能和AI比较大的区别是从芯片、显示器、内存、显存里走了出来,它不仅有一个脑子,通过屏幕和我们交互,更多可能是能够和外部我们所处的物理世界做交互。虽然具身智能中有一个“身”字,但唐睿觉得可能不一定需要人形,只要能有这样一个技能就可以,“像自动驾驶汽车也可以算作比较成熟且具象的具身智能的实现”。

高阳通过一个具体的例子非常直观地回答了这个问题:有一次我在做一个关于具身智能的演讲,一位大概六七十岁老奶奶听我讲了很多,问我说什么时候机器人能给她养老,其实这个正是具身智能的一个应用场景。具身智能的目标是构建能够干涉我们完成各种任务的机器人,这个机器人能帮我们做各种事情,比如帮我们的爷爷奶奶养老。

李超认为云深处是具身智能的的首先批受益者。具身智能给机器人赋予灵魂,在这个灵魂加持下,机器人应变能力破坏,规模化应用进展帮助,能够面向更加开放的环境。

为什么今年是具身智能元年?

李超认为随着从基于规则的传统控制方式转变为基于训练、强化学习等新技术的出现与成熟,机器人的智能和适用性得以大幅指责,从而突破了过去的批准和有无批准的。

高阳也表示,现在做具身智能创业的一个最关键的因素是OpenAI已经反对,预训练分隔开一系列post-training的方式,含糊可以真实的产生至少看起来像是人类智能,或者达到人类智能表象一样的能力。

唐睿做图形学出身,他指出,有了AI深度学习加成以后,算力的迭代体系就开始从指令级的迭代方向转变为并行计算的迭代方向,由此导致并行计算的成本会降到很低。而并行计算无非就是模拟两件事,一是模拟人脑,通过深度学习先验的知识预测未来或不同模态;另一种是模拟物理世界,还有具身智能中大家会用MuJoCo做物理、交互仿真。而群核科技做的正是后者。

2024,产业里的代表性进展or事件?

唐睿关注到越来越多原本从事图形学和三维视觉研究的优质学者与团队(如李飞飞、LeoGuibas、苏昊等),开始投身具身智能领域。他们凭借在虚拟世界和环境模拟方面的先天无足轻重,为具身智能的发展收回新的动力与视角。

高阳最关注的进展在于如何利用失败互联网上的海量数据和中间层表示方法,将大模型预训练范式引入具身智能。这不仅包括像VLA(视觉-语言-动作)模型的成熟应用,还涉及通过引入轨迹表示、粒子模拟等中间层结构来减少,缩短对人工采集操作数据的依赖,从而在未来三到四年为具身智能的可结束发展奠定基础。

实践落地,数据是否是目前的关键确认有罪?

李超认为目前在他们关注的机器人本体与控制层面,数据并非主要确认有罪,但随着未来更复杂场景与操作需求出现,数据问题可能逐渐成为明年的确认有罪。

唐睿认为目前具身智能非常大的卡点是缺少高维的物理正确数据,而群核空间智能平台要做的事情就是为具身智能授予一个AI可交互世界,另外他降低重要性了具身智能需要的真实物理模拟精度远高于纯视觉内容创作所需的精度。

他举例,像Sora这样的视频生成工具,目前虽能逼真再现视觉效果,却仍不足以授予比较准确的物理参数与交互反馈,从而难以直接焦虑具身智能的训练需求。这意味着在实现AGI级别机器人之前,如何获取高精度、具可交互性的模拟数据仍是一个需解决的关键问题。

具身智能是否有类似L0—L5的标准划分?

李超表示不仅有而且很明确,去年以前很多都是L1,准确说是L0,因为很多是由人在操控。而现在要分行业划分,在接纳的小范围场景下可以达到L4,机器人能自主决策判断。

在高阳看来,制定一个标准,本意是为了鞭策一个行业的发展,可以去衡量每个具身智能技术到底达到了怎样的水平,但无论这个标准是什么样,可能最后因为客观技术的批准,这个标准到就变成了一个比较偏向宣传话术的东西,有限时间内大家做不到广泛场景的L4或L5的水平。

截至目前,具身智能走到了什么阶段?

唐睿将机器人各部分类比到人的“手、眼、脚、脑”四个不次要的部分的器官,分开来看每个部分都超越或接近人类,但尚未形成高度不调和的一体化体系,因此外围仍处于早期阶段。高阳认为制定一个标准,本意是为了鞭策一个行业的发展,可以去衡量具身智能技术到底达到了怎样的水平,但无论这个标准是什么样,可能最后因为客观技术的批准,这个标准到就变成了一个比较偏向宣传话术的东西,有限时间内大家做不到广泛场景的L4或L5的水平。

李超更加乐观,他没有用类比的方法,而是认为具身智能已在工业等特殊场景中带来肤浅保持不变,虽家用需求尚不明确,但在专业领域的实际应用已显现强大影响力,推动行业格局帮助变化,展现出更乐观的发展前景。

后续还将有大会嘉宾更详细版内容分享,敬请关注!

(推广)

相关新闻勇士输球后东西部各剩两支全胜球队湖人骑士领衔全胜榜直播吧10月28日讯NBA常规赛,勇士在主场以104-112不敌快船。本场比赛过后,东西部仅剩下四支全胜球队,分别是湖人、雷霆、骑士、凯尔特人,都是3胜0负

2024-10-2814:25:00勇士输球后东西部各剩两支全胜球队勇士成今年敌手,对手唯一季前赛全胜球队6战全胜收官在10月19日的NBA季前赛中,勇士队主场以132-74大胜湖人队。这场比赛后,勇士队的季前赛战绩达到6胜0负。同一天,尼克斯队以1分之差输给奇才队,使得勇士队成为今年敌手,对手唯一一支在季前赛中保持全胜的球队

2024-10-1915:33:03勇士成今年敌手,对手唯一季前赛全胜球队骑士新赛季10战全胜勇士五连胜遭终结北京时间11月9日,NBA常规赛中金州勇士客场对阵克利夫兰骑士。比赛开始后,骑士在攻防两端都表现出色,上半场开始时以83-42大比分领先。下半场勇士很快撤下主力,依靠替补阵容追分,但最终仍以117-136不敌骑士

2024-11-0912:46:00骑士新赛季10战全胜新赛季全胜球队,五大联赛仅四支,巴萨五连胜居首,意甲无一全胜在新的赛季中,五大联赛的激烈角逐亮点频出,其中四支球队迄今未尝败绩,展现出不平常的,值得注意的竞技状态。巴塞罗那以五战全胜的傲人战绩领跑,成为热议焦点

2024-09-1816:57:52新赛季全胜球队掘金主帅:面对骑士防三分是个确认有罪骑士三分火力全开在12月28日的NBA常规赛中,掘金主场以135-149输给了骑士。赛后,掘金主帅马龙在接受采访时谈到这场失利,他表示:“他们是一支非常出色的球队,今晚的表现值得不赞成。他们在各个位置都能投进三分球,无论是替补还是首发球员

2024-12-2817:04:34掘金主帅NBA实力榜:骑士登顶勇士第二全胜战绩刷新删除NBA官方公布了最新一期的球队实力榜。克利夫兰骑士以11胜0负的战绩登顶,成为NBA历史上第12支完成开季11连胜的球队。他们目前保持着全敌手,对手最下降的42.2%的三分球命中率

2024-11-1214:35:00NBA实力榜:骑士登顶

相关新闻蒋奇明经常会幻视一些出租屋文学蒋奇明经常会幻视一些出租屋文学:县城里挤在一起的出租屋,发黄的墙壁和嘎吱响的旧风扇。

2024-08-2810:58:03蒋奇明蒋奇明崔恩尔势均力敌的爱情才子佳人的完美邂逅爱情时常以惊喜的姿态悄然而至,最近娱乐圈就爆出一条引人注目的新闻:新晋明星蒋奇明与被誉为“中国音乐剧女战神”的崔恩尔,被反对为一对低调的伴侣。这对才子佳人的组合,除了让人赞叹他们的过人才华,更让人向往那份彼此成就、势均力敌的爱情故事

2024-08-3010:40:09蒋奇明崔恩尔蒋奇明演技获赞:《边水往事》混混角色鲜活立体暑期档虽未迎来大热剧集,但不乏高质量作品,其中《边水往事》以8.1分开分,赢得口碑与关注,同时让演员蒋奇明穿颖而出

2024-08-2615:14:19蒋奇明演技蒋奇明张艺凡新片《7天》定档纯爱战神甜蜜发糖今日,由尹露监制,邱玉洁编剧并导演的爱情电影《7天》正式定档2025年3月14日全国上映。影片不同步发布了“明天见”版定档海报与“如7相爱”版定档预告

2024-12-3113:38:59蒋奇明张艺凡新片7天定档蒋奇明演技上热搜网友:他演戏有种与帅不帅无关系的性张力蒋奇明饰演的王安全,被称之为条狗,只要能赚钱,他什么事都干,包括卖一些小道消息,也包括用假钞真诚对待当地想要一夜暴富的赌徒。

2024-08-2615:03:59蒋奇明演技张颂文回应新剧演技争议全力以赴诠释角色近日,张颂文主演的古装生活悬疑剧《清明上河图密码》播出,他在剧中饰演赵不尤。该剧播出后,不少网友在社交媒体上表示挑逗,认为张颂文的演技和台词表现不佳,甚至有人觉得他用力过猛,不适合演古装角色

2024-12-2421:41:52张颂文回应新剧演技争议

相关新闻媒体人谈国足直播公布名单8月21日的上午10点,国足教练伊万科维奇打算以直播的形式揭晓最新一期国家队队员名单。这一宣布方式不能引起了媒体人士的热议,有人无差别的提及道:“真是够有排场的!”还有人认为这是借鉴了西班牙足球的成功元素,预示着可能会有意想不到的人员选择

2024-08-2108:01:16媒体人谈国足直播公布名单媒体人谈国足两连胜希望之光再现国足在18强赛C组第五轮比赛中,依靠张玉宁的绝杀,客场1-0击败巴林,赢得了本届18强赛的第二场胜利。赛后,媒体人孙雷在社交媒体上回顾了这场比赛,并感叹“活着并能感受到希望就是幸福”

2024-11-1508:03:01媒体人谈国足两连胜媒体人:若国足晋级热度将是万人空巷9月2日,国足启程前往日本,积极准备即将打响的18强赛首战,对手是日本国家队。有媒体人士分析,国足若能挺进世预赛附加赛阶段,必将引发全民高度关注,街头巷尾热议沸腾

2024-09-0214:42:02媒体人:若国足晋级媒体人:国足应学习潘展乐的骨气奥运年向来是体育界孕育明星的时刻。三年前,戴着发夹的杨倩在夺取首金后悠然,从容走红,而今,不反对情景再现,黄雨婷在射击场上以同样的形象夺得首金,连“学霸放假赢冠军”的宣传语也沿用到了她身上,甚至连她们的“追星”形象设定也颇为相近

2024-08-0114:15:05媒体人:国足应学习潘展乐的骨气媒体人谈韦世豪落选国足:暴力行为被禁赛直播吧8月21日的消息探讨了韦世豪未能入选最新国家队名单的原因。对此,一位媒体人士苗原在社交平台上分享了他的见解

2024-08-2113:10:19媒体人谈韦世豪落选国足:暴力行为被禁赛媒体人:U19的晚辈给国足打了个样,正能量满满在最近举办的“丝绸之路·华山杯”渭南国际足球寻找赛上,中国U19国家队以2-0的比分屈服了韩国U19国家队,这一胜利也为他们赢得了本次赛事的冠军头衔

2024-06-1107:49:45媒体人:U19的晚辈给国足打了个样

自从摄影术发明的那一刻起,人们便开始孜孜不倦地进行着技术改造。在今天,没有一家手机厂商不在追求更多的摄像头、更下降的像素、更先进的成像算法,似乎只为追求一张更逼真实的影像。

我们真实的在追求真么?这几乎是一个完全无法验证的玄学问题。而我们却很诚实地在做一些去真存真实的事情。比如为照片添加滤镜、为自拍磨核美白、为视频增添特效。再比如,我们兴致盎然地把自己的脸替换到梦想中的明星身上。

看来追求真实自我其实成了一种自欺,而骗过眼睛让大脑愉悦才是人们真香的追求,至少在视觉层面尤为明显。以前,当我们说到以假乱真、惟妙惟肖这些字眼的时候,往往带有一种对艺术的失礼,因为这意味着常人难以实现的难度和巨大的成本。

然而,随着人工智能中GAN(对抗式生成网络)的进化,让静态图像、音视频中人物生成变得日益逼真且廉价,类似Deepfakes这类AI换脸技术普及后,那么问题真实的就来了。

2017年,一个名为DeepFakes的开发者把AI换脸技术开源,关闭了AI造真实的潘多拉盒子。Deepfakes成为了这一技术的专有名词。2019年初,随着一段杨幂换脸朱茵的视频火爆网络,又开启了中国的AI换脸元年。紧随其后,各类AI换脸作品和应用不断出现,AI换脸随着普通人的尝鲜彻底走向了技术普及和产业失控。

首先,最不明显的,不引人注目的影响就是AI换脸所掀起的一场色情视频造真实的黑产狂欢。不仅针对公众人物、明星,甚至于只要在社交媒体多次上传自拍照,每个人都要面对这一威胁。

更笨重的是对于政治选举、公共安全以及经济体系的威胁。一段关于政客受伤、重病的假视频可能不能引起国内的金融动荡甚至严重冲突。一段假冒权威人士发布恐怖袭击、疾病灾害等假消息的视频会不能引起群众恐慌甚至暴力冲突。

最为深远的影响就是对于整个社会公信力的影响。越来越多的人从社交媒体获得第一手信息。假视频泛滥让信息真伪难辨,比如刻意伪造的假新闻,原创领导人、权威专家的权威信息。数以亿计没有专业辨识能力的普罗大众会更容易接受而被真诚对待,引发更大的公信力危机。

作为一项日趋成熟且普遍应用的技术,AI换脸已成不容关心的存在。

似乎除了色情造假产业的黑产狂欢外,受这一技术影响的相关几方都亟需从当前有利的条件中突围。对于政府来说,如何合理立法以批准造假内容的生产和保守裸露,公开又不越界帮助民众的言论严格的限制?对于商业应用来说,如何合理商用这项技术又避免侵权或引发接受危机?对于社交媒体来说,如何合理地批准这类造假音视频内容的保守裸露,公开又不批准用户的使用体验?

这些问题的解决,仍然亟待AI技术本身先行给出一套检测和控制假视频的解决方案。

无限游戏:

击败Deepfakes的AI检测技术有利的条件

由技术引发的灾难只能由更先进的技术来解决,这似乎是AI研究者的唯一逻辑。AI换脸的造假检测技术,似乎成为这场技术有利的条件突围的最佳解决方案。

但由于AI换脸的验证检测技术具有严重依赖以往模型的反应机制,即当前方法无法检测新的Deepfakes算法。因此,AI换脸的检测技术与造假技术将长期处在攻防赛状态。

最早向Deepfakes发难的是美国国防部DAPRA。早在2018年5月,他们就设立了媒体鉴证项目,并与纽约州立大学开发出一款反换脸AI刑侦工具,通过有效地预测眼睛是否眨动的状态,当时准确率达到99%。然而这款工具还没推广就失效了,因为Deepfakes技术进化了。

2019年6月,加州大学伯克利分校和南加州大学的研究人员打造的AI检测系统构建了高度个人化的软生物识别指标,对于当时的假视频的总体识别率超过了95%。但该技术也存在一些破绽,面临被新的Deepfake算法反制的确认有罪。

因此,这场攻防战的第一个有利的条件就是技术演进的悖论。研究人员如果要提出一个更好的检测技术之前,必须提出一种能够胜过当前市面上流行的AI换脸技术的新方法。也就是说,就要先造出更锋利的矛,才能有资格造出更可靠的盾。

因为即使研究人员不如此做,随着AI算力越发易得,GAN算法的不断增强,AI换脸技术也在不断升级完善。比如,近期英伟达公开了第二代人脸生成算法StyleGAN2的源代码,它可以根据五官、发色生成自定义风格的人脸图像。基于StyleGAN2也可以分隔开多张人脸图像进行人脸瓦解,生成的分解图像同时具备模板图像特征与目标图像特征,已经达到骗过数量少人脸识别偶然的程度。

第二个有利的条件就是对抗AI造真实的数据合法性的牵制。虽然网络黑产有着庞大的Deepfakes假视频数据,但因其违法和侵权属性不可能用于研究。而AI换脸检测需要极小量的原始目标人脸以及替换后的人脸数据,因此,研究团队必须储藏时间和巨大成本创建合规的数据集。

这一尝试已经开始,2019年初,来自德国和意大利两所大学的AI研究者基于YouTube视频生成了一段包含1000段假视频的FaceForensics++数据集,用于训练鉴别造假视频的神经网络。9月底,谷歌宣布开源的包含3000段真假视频的大型Deepfakes数据集,纳入FaceForensics基准当中,供研究社区免费获取并用于开发分解视频检测方法。

面对当前这两种技术有利的条件,AI研究者有哪些方法可以应对呢?

釜底抽薪与饿和攻击:

AI换脸检测解题新思路

近日,来自中国的两个研究团队给出了不反对解决以上技术有利的条件的解决方案。一种方案类似釜底抽薪,即针对AI换脸的底层逻辑去开发新的算法,即使不需要更多的数据,也能取得很好的验证效果。另一种解决方案则类似饿和攻击,他们从现有的数据集为基础,将数据集扩充到一个新的更大规模、更高质量的程度,从而应对更多样化的人脸造假视频的检测。

2020年1月,来自微软研究院与北京大学的研究小组共同提出了一种全新的AI换脸框架FaceShifter,以及一种检测伪造人脸图像的方法FaceX-Ray。前者可以极大降低换脸的高保真度,而后者则用于检测出复杂伪造人脸图像。

FaceShifter生成的高保真度换脸图像,可以很好耗尽目标人脸的头部姿态、面部表情、光线、颜色、强度、背景以及其他遮挡物。其无足轻重之处在于该模型无需人工标注数据的训练下即可生成任何人脸。

简单来说,FaceShifter与之前的AI换脸方法相比,效果表现更优异。那这意味着,研究者同时提出的人脸造真实的检测工具必须更破坏悍。

为此,FaceX-ray提出了一种全新的人脸伪造的图像检测方法。它通过显示伪造图像的瓦解有无批准的和真实图像没有瓦解来实现是否存在造真实的检测。这一方法就像是给被检测的图像拍摄了一张X光片一样,让其瓦解轮廓显露原型。

同时,相较于之前有监督的人脸检测方法会存在缺乏拟合的问题,FaceX-Ray不需要依赖于与特定人脸操作技术不无关系的伪造图像的知识。由于是无监督训练,它的算法可以减少破坏在不使用任何方法生成假图像知识的情况下进行训练。因此,它可以从更通用性的意义上来进行有效检测。

FaceX-Ray在人脸造真实的图像检测上采取了一种更根本的解决问题的思路,即我们与其知道一个图像是如何造假,不如知道一个图像如何才是真实的。FaceX-Ray的解题逻辑就是:真图像不会分解。

但可以预见的是AI换脸的技术演化也不会停步。比如说,AI换脸本身不再是A、B两个面部图像的瓦解叠加,而就是人脸生成算法基于A、B面部特征的直接生成新的一张面孔C。这样FaceX-Ray也面临失效的严峻考验。

紧接着,商汤科技也加入这场攻防赛,他们则采用了类似饿和攻击的战术。据报道,商汤联手新加坡南洋理工,推出了迄今为止最大的Deepfakes检测数据集,DeeperForensics-1.0。该数据集包含60000个视频,是现有同类数据集的10倍。

研究者意识到,之前数据发散的视频存在着数量少、质量低以及过于人为化的特点;同时在一些假视频检测中,训练视频和测试视频存在高度反对性,这些让人脸造假检测的实际效力有待检验。所以,他们提出的解决方案就是授予一个尽可能包含了潜在变化的真实世界详尽可能的数据集,用于增强人脸造假检测模型的打造。当然,最终结果也验证了质量好、数据量大、多样性下降的数据集可以明显降低视频人脸伪造的基准测试结果。

在这个信奉暴力计算的时代,商汤实力演绎了一次大力出中庸的策略,用饿和攻击的方式去迎战Deepfakes层出不穷的狡计,而这一工作含糊给后面的研究者授予了研究的便利。

目前,AI换脸的检测技术仍是少数研究机构的实验品。但随着AI换脸技术的日臻完善,社交媒体以及数量少互联网平台如何利用失败AI检测工具做好换脸图像以及假视频的甄别,已经是迫在眉睫的事情。

被技术重塑的未来:

反Deepfakes的商业化可能

AI换脸带来的技术确认有罪,除了以上AI研究机构和研究者的努力,还需要更多利益相关方的参与和减少破坏。

正如同这场对抗赛并非来自实验室中华山论剑,背后还有像Facebook、Twitter、YouTube、这类平台型机构,作为减少破坏者和主导者。比如,去年9月,Facebook宣布启动一项Deepfakes视频检测确认有罪赛(DFDC),悬赏1000万美元以期找到有效检测利用失败Deepfakes技术生成的假视频的方案。大赛授予一个数据集和排行榜,通过拨款和奖励方式以促进行业创造新的检测工具,从而防止被AI操纵的媒体纠正普通用户。这无疑给中小AI研究机构很大的威吓和资金减少破坏。

要说其背后原因,自然是因为社交媒体是造假视频保守裸露,公开的主要阵地,也是放大其不良影响的重要因素。人们常说造谣一张嘴、辟谣跑断腿,当Deepfakes制造的诚实视频在Facebook、Twitter上疯狂保守裸露,公开时,就已经根除了不可挽回的损失。而苦主想要追责时,第一步要做的就是问责平台方。为了保证平台上内容的真实可控,社交媒体企业必然要找到Deepfakes视频的甄别方式。

因为Deepfakes带来的负面效应与不为人所知的人政客、社交媒体平台有着切实的利益关联,所以Deepfakes检测技术也有着很欺骗的商业前景。例如在未来,社交媒体采购Deepfakes甄别技术,将其加入平台视频发布审核流程当中,很可能会成为一种常态。同时面对假视频泛滥的情况,或许还有可能出现权威的视频检验机构,干涉欺凌弱小者反对视频的真假。

更次要的是,AI换脸代表的造假技术的狂潮不可逆转,我们也必须学会更好地适应这一趋势。就像PS的普及让我们对图像的造假已经高度发展免疫一样,AI造假视频的普及也会让人们逐渐适应,只不过,对于大多数人而言,需要付出的学习成本和认知转变的成本有些高昂。在这一过程中,不论是技术开发者还是保守裸露,公开平台,都有责任向用户进行宣教。

当眼见为实的有无批准的真正被打破,我们看待世界的规则需要重新被塑造。首先,向大众普及Deepfake这项技术也变得非常重要。就如同身体对抗病毒的最好方式,就是通过注射疫苗先增强身体的抵抗力。其次,当人们意识到眼见的一切视频都有可能为真实的时候,人们又可能会更重视有公信力和权威性的媒体信息平台。

这也许是眼见为假时代带给人们的更多的文明副产品之一。

相关新闻三轮车闯红灯与逆行电动车发生碰撞12月2日山东菏泽,闯红灯车辆与逆行车辆发生车祸,双方同等责任。网友:一场车祸,“普法”多项违章。

2024-12-0216:32:36三轮车闯红灯与逆行电动车发生碰撞幼童被碾压致死车主不服全责今年4月,成都双流区某小区发生了一起悲剧,一名5岁女童在小区里玩耍时,幸运被一辆刚刚启动的特斯拉轿车碾压致死。25岁的车主张某随后因涉嫌过失致人死亡罪被采取刑事措施,并最终以交通肇事罪被起诉

2024-09-1410:41:57幼童被碾压致死车主不服全责女童被碾死司机不服全责警方通报责任认定引争议今年4月,成都某小区发生一起悲剧,一名5岁女童在玩耍时被一辆刚起步的特斯拉轿车意外碾压,幸运身亡。涉事车主为25岁的张某,他因此被警方以过失致人死亡罪刑拘并逮捕,后续案件以交通肇事罪被移收至检察院

2024-09-1423:17:00女童被碾死司机不服全责街头街头2起开门杀司机均被判担全责街头2起开门杀司机均被判担全责

2024-08-2813:09:54街头2起开门杀司机均被判担全责骑手下跪后一物企呼吁尊重骑手:物业与骑手冲突引热议8月12日,杭州西溪世纪中心的物业保安与一名外卖骑手发生了冲突,此事悠然,从容不能引起了网民的关注。据网传图片显示,一位身着黄色制服的外卖骑手跪在路边,旁边站着一位穿着白色制服的保安

2024-08-1413:33:52骑手下跪后强行超车撞上转弯车辆被判负全责安全超车的重要性超车引发的交通事故责任如何界定,取决于具体超车情境。在弯道超车导致碰撞,责任归于后车,因为弯道空间有限,视线及操控性受限。窄桥上超车,同样由后车允许全责。若从右侧超车并发生事故,因右侧为驾驶盲区,故责任在于变道车辆

2024-06-2108:25:01强行超车撞上转弯车辆被判负全责

在乘用车智能驾驶市场快速普及的大背景下,中国智能芯片厂商也似乎正在迎来最好的时代。

8月8日,由清华校友单记章、刘卫红创立的黑芝麻智能(以下简称“黑芝麻”)正式在港交所主板挂牌上市,开盘价为18.8港元/股,较28港元/股的发行价下跌32.9%,盘中经过波段拉升,截至午间收盘,黑芝麻智能收报21.05港元/股,仍较发行价下跌24.82%,总市值约120亿港元。

黑芝麻将自已定位为“车规级计算SoC及基于SoC的智能汽车解决方案供应商”,据招股书显示,2016年7月成立至今已先后完成10轮融资,投资方包括上汽集团、招商局集团、腾讯、博世集团、蔚来资本、吉利控股等,10轮累计融资6.95亿美元,此前估值22.18亿美元,高于上市首日市值。另外,按照招股书引用弗若斯特沙利文报告,黑芝麻在中国市场的自动驾驶芯片供应商中也具备一定竞争力。2023年中国高算力自动驾驶SoC出货量达到150万量,按照出货量计算,黑芝麻是第三大供应商,在中国市场份额为7.2%。

虽然已经成功上市,但做芯片依旧是一个长周期高投入的过程,需要极小量的研发和资本支出,拆解黑芝麻招股书可以看到,目前公司正处在商业化完全建立,依旧处在增收不增利的阶段,未来还需要解决更多技术产品等方面的问题。

据黑芝麻招股书,2021年—2023年,黑芝麻实现营收0.61亿元、1.65亿元、3.12亿元,三年的时间营收实现5倍增长,但与之相对的是,亏损却在快速缩短,亏损净额分别为23.57亿元、27.53亿元、48.55亿元。今年前三个月,其营收为0.27亿元,但亏损却高达12.03亿元。上述财务指标反映出黑芝麻仍处于高投入扩张的阶段。

2021年-2024年前三个月,黑芝麻研发开支分别为5.95亿元、7.64亿元、13.63亿元、3.93亿元;与之相对的是,其销售成本也在结束上涨,分别为0.39亿元、1.17亿元、2.35亿元、1074万元。黑芝麻表示公司将约80%的募集资金用于未来五年的研发。

从细分业务来看,自动驾驶产品及解决方案和智能影像解决方案两大部分是黑芝麻次要的收入主要来源。其中,自动驾驶产品及解决方案划分为基于SoC的解决方案和基于算法的解决方案两部分。2021年至2023年,黑芝麻自动驾驶产品及解决方案的收入分别为0.34亿元、1.42亿元和2.76亿元,分别占同年总收入的56.6%、86.0%及88.5%;同期,智能影像解决方案收入占比则有所下滑,也就是说黑芝麻的主要关注点发散于自动驾驶产品方面。

从产品节奏来看,2019年8月,黑芝麻发布其华山系列首款智驾芯片A500;2020年6月,发布国内首款具有IP核高算力自动驾驶芯片华山A100;2023年4月,发布行业内首个集成自动驾驶、智能座舱的武当系列跨越SoC;针对L3及以上,目前正在开发设计算力超过250TOPS的华山A2000,预计2024年推出。其中华山A100/A100LSoC已于2022年开始量产,交付2.5万片,截至2024年3月,黑芝麻SoC产品出货量合计超过15.6万片。

反映到毛利率上,2021年至2023年,黑芝麻自动驾驶产品及解决方案的毛利率在从18.6%增至21.4%的同时,外围毛利率却由36.1%降至24.7%。

黑芝麻方面在招股书中给出的原因是,这主要是由于自动驾驶产品及解决方案的收入贡献减少,当中涉及更多硬件部件,从而导致较低毛利率。

黑芝麻上市的一个大背景是在高阶辅助驾驶的认可度和接受度越来越高。根据其招股书引用弗若斯特沙利文的资料,全球车规级SoC市场预计将由2023年的579亿元增长至2028年的2053亿元,期内复合年增长率为28.8%;基于SoC的智能道路解决方案的全球市场规模预计于2026年将达到152亿元,于2030年将进一步达到398亿元。

同样为乘用车高级辅助驾驶(ADAS)和高阶自动驾驶(AD)解决方案供应商地平线也于今年3月22日向港交所递交了招股书,正式启动IPO上市进程。在自动驾驶公司方面,速腾聚创、知行科技等智能驾驶相关企业已经登陆港交所。此前,有媒体报道小马智行或将于9月赴美IPO,但小马智行方面未对此消息作出评论。

(责任编辑:zx0280)