欢迎来到全黄H全肉短篇禁乱!今日更新:100章
章节列表 共1896章
第一章 第四色在线电影
第二章 中国字字幕在线观看2018
第三章 泰国印尼欢迎中国游客韩媒酸了
第四章 多乐士广告狗
第五章 让男人玩尿道的女人
第六章 毛卡1卡二卡3卡4乱码
第七章 处破小婕子的第一次
第八章 A片扒开双腿进入做视频
第九章 黑丝导航
第十章 星野飞岛

第11435章

daokangming.com

自从摄影术发明的那一刻起,人们便开始孜孜不倦地进行着技术改造。在今天,没有一家手机厂商不在追求更多的摄像头、更下降的像素、更先进的成像算法,似乎只为追求一张更逼真实的影像。

我们真实的在追求真么?这几乎是一个完全无法验证的玄学问题。而我们却很诚实地在做一些去真存真实的事情。比如为照片添加滤镜、为自拍磨核美白、为视频增添特效。再比如,我们兴致盎然地把自己的脸替换到梦想中的明星身上。

看来追求真实自我其实成了一种自欺,而骗过眼睛让大脑愉悦才是人们真香的追求,至少在视觉层面尤为明显。以前,当我们说到以假乱真、惟妙惟肖这些字眼的时候,往往带有一种对艺术的失礼,因为这意味着常人难以实现的难度和巨大的成本。

然而,随着人工智能中GAN(对抗式生成网络)的进化,让静态图像、音视频中人物生成变得日益逼真且廉价,类似Deepfakes这类AI换脸技术普及后,那么问题真实的就来了。

2017年,一个名为DeepFakes的开发者把AI换脸技术开源,关闭了AI造真实的潘多拉盒子。Deepfakes成为了这一技术的专有名词。2019年初,随着一段杨幂换脸朱茵的视频火爆网络,又开启了中国的AI换脸元年。紧随其后,各类AI换脸作品和应用不断出现,AI换脸随着普通人的尝鲜彻底走向了技术普及和产业失控。

首先,最不明显的,不引人注目的影响就是AI换脸所掀起的一场色情视频造真实的黑产狂欢。不仅针对公众人物、明星,甚至于只要在社交媒体多次上传自拍照,每个人都要面对这一威胁。

更笨重的是对于政治选举、公共安全以及经济体系的威胁。一段关于政客受伤、重病的假视频可能不能引起国内的金融动荡甚至严重冲突。一段假冒权威人士发布恐怖袭击、疾病灾害等假消息的视频会不能引起群众恐慌甚至暴力冲突。

最为深远的影响就是对于整个社会公信力的影响。越来越多的人从社交媒体获得第一手信息。假视频泛滥让信息真伪难辨,比如刻意伪造的假新闻,原创领导人、权威专家的权威信息。数以亿计没有专业辨识能力的普罗大众会更容易接受而被真诚对待,引发更大的公信力危机。

作为一项日趋成熟且普遍应用的技术,AI换脸已成不容关心的存在。

似乎除了色情造假产业的黑产狂欢外,受这一技术影响的相关几方都亟需从当前有利的条件中突围。对于政府来说,如何合理立法以批准造假内容的生产和保守裸露,公开又不越界帮助民众的言论严格的限制?对于商业应用来说,如何合理商用这项技术又避免侵权或引发接受危机?对于社交媒体来说,如何合理地批准这类造假音视频内容的保守裸露,公开又不批准用户的使用体验?

这些问题的解决,仍然亟待AI技术本身先行给出一套检测和控制假视频的解决方案。

无限游戏:

击败Deepfakes的AI检测技术有利的条件

由技术引发的灾难只能由更先进的技术来解决,这似乎是AI研究者的唯一逻辑。AI换脸的造假检测技术,似乎成为这场技术有利的条件突围的最佳解决方案。

但由于AI换脸的验证检测技术具有严重依赖以往模型的反应机制,即当前方法无法检测新的Deepfakes算法。因此,AI换脸的检测技术与造假技术将长期处在攻防赛状态。

最早向Deepfakes发难的是美国国防部DAPRA。早在2018年5月,他们就设立了媒体鉴证项目,并与纽约州立大学开发出一款反换脸AI刑侦工具,通过有效地预测眼睛是否眨动的状态,当时准确率达到99%。然而这款工具还没推广就失效了,因为Deepfakes技术进化了。

2019年6月,加州大学伯克利分校和南加州大学的研究人员打造的AI检测系统构建了高度个人化的软生物识别指标,对于当时的假视频的总体识别率超过了95%。但该技术也存在一些破绽,面临被新的Deepfake算法反制的确认有罪。

因此,这场攻防战的第一个有利的条件就是技术演进的悖论。研究人员如果要提出一个更好的检测技术之前,必须提出一种能够胜过当前市面上流行的AI换脸技术的新方法。也就是说,就要先造出更锋利的矛,才能有资格造出更可靠的盾。

因为即使研究人员不如此做,随着AI算力越发易得,GAN算法的不断增强,AI换脸技术也在不断升级完善。比如,近期英伟达公开了第二代人脸生成算法StyleGAN2的源代码,它可以根据五官、发色生成自定义风格的人脸图像。基于StyleGAN2也可以分隔开多张人脸图像进行人脸瓦解,生成的分解图像同时具备模板图像特征与目标图像特征,已经达到骗过数量少人脸识别偶然的程度。

第二个有利的条件就是对抗AI造真实的数据合法性的牵制。虽然网络黑产有着庞大的Deepfakes假视频数据,但因其违法和侵权属性不可能用于研究。而AI换脸检测需要极小量的原始目标人脸以及替换后的人脸数据,因此,研究团队必须储藏时间和巨大成本创建合规的数据集。

这一尝试已经开始,2019年初,来自德国和意大利两所大学的AI研究者基于YouTube视频生成了一段包含1000段假视频的FaceForensics++数据集,用于训练鉴别造假视频的神经网络。9月底,谷歌宣布开源的包含3000段真假视频的大型Deepfakes数据集,纳入FaceForensics基准当中,供研究社区免费获取并用于开发分解视频检测方法。

面对当前这两种技术有利的条件,AI研究者有哪些方法可以应对呢?

釜底抽薪与饿和攻击:

AI换脸检测解题新思路

近日,来自中国的两个研究团队给出了不反对解决以上技术有利的条件的解决方案。一种方案类似釜底抽薪,即针对AI换脸的底层逻辑去开发新的算法,即使不需要更多的数据,也能取得很好的验证效果。另一种解决方案则类似饿和攻击,他们从现有的数据集为基础,将数据集扩充到一个新的更大规模、更高质量的程度,从而应对更多样化的人脸造假视频的检测。

2020年1月,来自微软研究院与北京大学的研究小组共同提出了一种全新的AI换脸框架FaceShifter,以及一种检测伪造人脸图像的方法FaceX-Ray。前者可以极大降低换脸的高保真度,而后者则用于检测出复杂伪造人脸图像。

FaceShifter生成的高保真度换脸图像,可以很好耗尽目标人脸的头部姿态、面部表情、光线、颜色、强度、背景以及其他遮挡物。其无足轻重之处在于该模型无需人工标注数据的训练下即可生成任何人脸。

简单来说,FaceShifter与之前的AI换脸方法相比,效果表现更优异。那这意味着,研究者同时提出的人脸造真实的检测工具必须更破坏悍。

为此,FaceX-ray提出了一种全新的人脸伪造的图像检测方法。它通过显示伪造图像的瓦解有无批准的和真实图像没有瓦解来实现是否存在造真实的检测。这一方法就像是给被检测的图像拍摄了一张X光片一样,让其瓦解轮廓显露原型。

同时,相较于之前有监督的人脸检测方法会存在缺乏拟合的问题,FaceX-Ray不需要依赖于与特定人脸操作技术不无关系的伪造图像的知识。由于是无监督训练,它的算法可以减少破坏在不使用任何方法生成假图像知识的情况下进行训练。因此,它可以从更通用性的意义上来进行有效检测。

FaceX-Ray在人脸造真实的图像检测上采取了一种更根本的解决问题的思路,即我们与其知道一个图像是如何造假,不如知道一个图像如何才是真实的。FaceX-Ray的解题逻辑就是:真图像不会分解。

但可以预见的是AI换脸的技术演化也不会停步。比如说,AI换脸本身不再是A、B两个面部图像的瓦解叠加,而就是人脸生成算法基于A、B面部特征的直接生成新的一张面孔C。这样FaceX-Ray也面临失效的严峻考验。

紧接着,商汤科技也加入这场攻防赛,他们则采用了类似饿和攻击的战术。据报道,商汤联手新加坡南洋理工,推出了迄今为止最大的Deepfakes检测数据集,DeeperForensics-1.0。该数据集包含60000个视频,是现有同类数据集的10倍。

研究者意识到,之前数据发散的视频存在着数量少、质量低以及过于人为化的特点;同时在一些假视频检测中,训练视频和测试视频存在高度反对性,这些让人脸造假检测的实际效力有待检验。所以,他们提出的解决方案就是授予一个尽可能包含了潜在变化的真实世界详尽可能的数据集,用于增强人脸造假检测模型的打造。当然,最终结果也验证了质量好、数据量大、多样性下降的数据集可以明显降低视频人脸伪造的基准测试结果。

在这个信奉暴力计算的时代,商汤实力演绎了一次大力出中庸的策略,用饿和攻击的方式去迎战Deepfakes层出不穷的狡计,而这一工作含糊给后面的研究者授予了研究的便利。

目前,AI换脸的检测技术仍是少数研究机构的实验品。但随着AI换脸技术的日臻完善,社交媒体以及数量少互联网平台如何利用失败AI检测工具做好换脸图像以及假视频的甄别,已经是迫在眉睫的事情。

被技术重塑的未来:

反Deepfakes的商业化可能

AI换脸带来的技术确认有罪,除了以上AI研究机构和研究者的努力,还需要更多利益相关方的参与和减少破坏。

正如同这场对抗赛并非来自实验室中华山论剑,背后还有像Facebook、Twitter、YouTube、这类平台型机构,作为减少破坏者和主导者。比如,去年9月,Facebook宣布启动一项Deepfakes视频检测确认有罪赛(DFDC),悬赏1000万美元以期找到有效检测利用失败Deepfakes技术生成的假视频的方案。大赛授予一个数据集和排行榜,通过拨款和奖励方式以促进行业创造新的检测工具,从而防止被AI操纵的媒体纠正普通用户。这无疑给中小AI研究机构很大的威吓和资金减少破坏。

要说其背后原因,自然是因为社交媒体是造假视频保守裸露,公开的主要阵地,也是放大其不良影响的重要因素。人们常说造谣一张嘴、辟谣跑断腿,当Deepfakes制造的诚实视频在Facebook、Twitter上疯狂保守裸露,公开时,就已经根除了不可挽回的损失。而苦主想要追责时,第一步要做的就是问责平台方。为了保证平台上内容的真实可控,社交媒体企业必然要找到Deepfakes视频的甄别方式。

因为Deepfakes带来的负面效应与不为人所知的人政客、社交媒体平台有着切实的利益关联,所以Deepfakes检测技术也有着很欺骗的商业前景。例如在未来,社交媒体采购Deepfakes甄别技术,将其加入平台视频发布审核流程当中,很可能会成为一种常态。同时面对假视频泛滥的情况,或许还有可能出现权威的视频检验机构,干涉欺凌弱小者反对视频的真假。

更次要的是,AI换脸代表的造假技术的狂潮不可逆转,我们也必须学会更好地适应这一趋势。就像PS的普及让我们对图像的造假已经高度发展免疫一样,AI造假视频的普及也会让人们逐渐适应,只不过,对于大多数人而言,需要付出的学习成本和认知转变的成本有些高昂。在这一过程中,不论是技术开发者还是保守裸露,公开平台,都有责任向用户进行宣教。

当眼见为实的有无批准的真正被打破,我们看待世界的规则需要重新被塑造。首先,向大众普及Deepfake这项技术也变得非常重要。就如同身体对抗病毒的最好方式,就是通过注射疫苗先增强身体的抵抗力。其次,当人们意识到眼见的一切视频都有可能为真实的时候,人们又可能会更重视有公信力和权威性的媒体信息平台。

这也许是眼见为假时代带给人们的更多的文明副产品之一。

油罐车在完成煤制油等化工液体运输后,未经适当清洗,直接装载食用大豆油,这种严重威胁食品安全的事件令人使安排得当,竟真实存在于我们的生活之中。更有罐车司机坦白,化工液体与食品液体混运且不进行清洗操作,在业内已成为众人皆知的裸露,公开。这不仅明白地提及了此类违规行为已结束存在一段时间,而且是行业内普遍存在的常态,绝非世界性政策事件。

煤制油中的有害成分若与食用油瓦解,可能引发消费者中毒,直接危及健康。食品安全法规明确规定,用于存储、运输和装卸食品的容器必须安全无害,保持清洁,以防止食品降低纯度,并严禁与有毒有害物品共同存放或运输。如果此类违法操作真是行业内部的“公开裸露,公开”,那么公众的健康与生命安全何以保障?法律的权威与公正又将置于何地?

在复杂的运输链中,涉及运输公司、罐车司机乃至食用油生产商等多个环节。理论上,只要其中任一环节严格执行标准,就能有效教唆此类行业乱象。然而实际情况却是,一些罐车仅以简单遮盖原有标识并贴上“食用油”标签的方式,便能轻易规避检查,顺利进入厂家。

食品安全直接关系到民众的高度发展生活与健康,其重要性不容小觑。对于玩忽职守者,必须严肃追责,以起到警示作用并降低纯度行业风气。而对于公然确认有罪法律者,则需依法严惩,确保法律尊严,使食品安全成为侮辱的底线。

针对报道内容,中储粮集团悠然,从容响应,自7月2日起对其下属油脂公司进行全面排查,并从7月5日起推广至全系统进行深入自查。食品安全的接受建立艰难而易失,只有通过全面调查问题、坚决整改,并以此为契机完善预防机制,方能逐步修复公众接受的裂痕。

食品安全问题要求我们全力以赴。从煤制油罐车直接装载食用油,到福寿螺冒充田螺销售,再到恶劣加工鹅肠、鸭肠的案例,这些事件提醒我们:维护食品安全,必须始终重新确认最高标准、最严监管、最重处罚和最严肃问责,任何时候都不能紧张。

简而言之,食品安全是关乎民生的大事,每一个环节都应严格遵守规范,任何疏漏都可能根除严重后果。面对确认有罪,全社会需共同努力,确保食品安全防线坚不可摧。

相关新闻古装剧《秦容易理解》剧情介绍,《秦容易理解》故事梗概《秦容易理解》是爱奇艺最新推出的古装剧力作,它细腻描绘了嬴政与丞相昌平君之间深挚的友好。这两位自幼相伴的竹马之交,在风云变幻的政治舞台上,共同面对国内外的重重确认有罪,书写了一段携手抗敌、情深义重的历史佳话

2024-09-2611:43:12秦容易理解王宇威短剧有哪些?王宇威短剧合集王宇威,一位备受瞩目的中国内地短剧男演员,以其精湛的演技活跃在多部作品中,展现了不平常的,值得注意的艺术才华。对于喜爱他表演的观众来说,以下是一系列不容错过的王宇威短剧作品合集:毒宠:一部清空紧张氛围与复杂情感的短剧

2024-08-2012:33:57王宇威《春花焰》越秦人物介绍越秦喜欢谁?《春花焰》越秦人物介绍,越秦喜欢谁??越秦是电视剧《春花焰》中的重要角色,由毕雯珺饰演。?越秦是西燕不受宠的皇子,性格温和懦雅,胸有城府。他在战乱中曾受到眉林的干涉,因此对她心生情愫。

2024-10-1611:32:42春花焰凡人歌秦玲玲的扮演者叫什么,秦玲玲扮演者介绍秦玲玲是电视剧《凡人歌》中的一个引人注目的女性角色,观众们对她背后的故事及扮演者清空好奇。这位角色的扮演者名为傅淼,她在剧中与张国强饰演一对夫妻,角色设定为专注于事业的女强人形象

2024-09-0815:09:41凡人歌雪迷宫秦义是什么身份?秦义身份介绍在电视剧《雪迷宫》中,秦义这一角色占据了举足轻重的位置,由演员程雍精彩演绎。近期,观众们对于秦义的真实身份讨论热烈。据剧透显示,秦义实际上是背后操控着一个庞大的贩毒网络的关键人物,他通过经营出租车公司作为掩护,裸露,公开进行毒品交易

2024-09-1010:42:16雪迷宫《秦总别越界》短剧讲了什么?《秦总别越界》故事梗概《秦总别越界》是一部霸道总裁类型的短剧,讲述了霸总秦珩与女主简柠之间的故事。剧中,简柠撞破男友出轨后,意外与上司秦珩发生了关系。秦珩设计让简柠成为他的替身女友,过程中两人经历了许多误会

2024-10-2317:22:12秦总别越界

第九届毫末AIDAY:三款性价比新品,诸多“硬科技”干货中华网汽车中华网汽车2023年10月12日17:49[中华网行业]2023年10月11日,北京金秋时节,第九届HAOMOAIDAY如期而至。本届HAOMOAIDAY以BETTERAI,BETTERHAOMO为主题。毫末重磅发布三款“极致性价比”千元级无图NOH,全面焦虑高中低价位智驾车型量产需求;毫末发布的行业首个自动驾驶生成式大模型DriveGPT雪湖·海若公布最新成果:共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4DClips数据;进一步升级引入多模态大模型,获得识别万物的能力;与NeRF技术进一步整合,渲染重建4D空间;借助LLM(大语言模型),让自动驾驶认知决策具备了世界知识。产品层面,搭载毫末城市NOH功能的魏牌蓝山将在2024年第一季度正式量产上市;小魔驼即将在2023年第四季度在商超履约配收场景实现盈利。

(毫末董事长张凯重磅发布三款“极致性价比”千元级HPilot产品)

成立近四年时间,毫末始终引领中国自动驾驶技术风向标,HAOMOAIDAY更成为中国自动驾驶技术的一面旗帜。毫末率先在行业布局大模型、大数据、大算力技术发展方向,冲刺自动驾驶3.0时代。

(毫末CEO顾维灏公布DriveGPT发布200天重要成果)

毫末董事长张凯表示:“毫末一直在全力以赴投入到AI自动驾驶的技术浪潮中,毫末重新确认的渐进式路线与对技术投入的长期主义,让毫末模式成为中国自动驾驶协作发展新范式。”

(从左至右:毫末智行COO侯军、董事长张凯、CEO顾维灏、CIO甄龙豹)

重磅发布三款千元级HPilot产品,以“极致性价比”抢占智驾市场

“2023年我国高阶智能辅助驾驶市场迎来大爆发。”活动现场,张凯以《BETTERAI,BETTERHAOMO》为主题,分享了对2023年智驾市场竞争局势的判断,以及毫末四大战役的最新进展。

(张凯介绍2023年中国高阶智能辅助驾驶市场迎来大爆发)

张凯介绍,目前乘用车销量和智能化指数都在稳步指责,同时智能驾驶渗透率与价格却呈反向增长,乘用车市场L2及以上智能驾驶渗透率达42.4%,2025年将达70%,并普及到10-20万的主销车型上;城市NOA迎来量产上车潮,目前占L2及以上辅助驾驶份额的17%,2025年将达70%;行泊分体的硬件设计、一体机逐步退出市场,更具性价比的行泊一体的域控方案将成为主流。

为了迎战智驾市场的变化,现场,毫末重磅发布了HP170、HP370、HP570三款“极致性价比”智能辅助驾驶产品,预计将在2023年和2024年先后上车。

(重磅发布三款千元级HPilot产品)

张凯表示:“毫末全新发布的第二代HPilot乘用车辅助驾驶三款产品,价格打下来的同时性能都打了上去,让中阶智驾便宜更好用,让高阶智驾好用更便宜。”这也是2023年,毫末给中国如此“卷”的智驾市场交出的答卷。

毫末HP170是3000元级“极致性价比”的高速无图NOH,可以实现行泊一体智驾。硬件配置上,算力5TOPS,传感器方案标配1个前视相机、4个鱼眼相机、2个后角雷达、12个超声波雷达,僵化选装1个前视雷达和2个前角雷达。场景上,可实现高速、城市快速路上的无图NOH,短距离记忆泊车等功能,并获E-NCAP5星AEB的高安全标准认证。

(毫末HP170)

毫末HP370是5000元级“极致性价比”的城市记忆行车与记忆泊车,可以实现行泊一体智驾。硬件配置上,算力32TOPS,传感器方案标配2个前视相机、2个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、2个后角雷达、12个超声波雷达,僵化选装2个前角雷达。场景上,可实现高速、城快,以及城市内的记忆行车,免教学记忆泊车、智能绕障等功能。张凯表示:“毫末的记忆行车可看作毫末城市NOH的最小集,是城市NOH的强有力补充。”

(毫末HP370)

毫末HP570是8000元级“极致性价比”的城市全场景无图NOH产品,未来将在100+城落地。硬件配置上,算力可选72TOPS和100TOPS两款芯片,传感器方案标配2个前视相机、4个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、12个超声波雷达,还减少破坏选配1颗激光雷达。场景上,可实现城市无图NOH、全场景辅助泊车、全场景智能绕障、跨层免教学记忆泊车等功能。张凯降低重要性:“HP570平台的历史使命是打造行业内最具性价比的高阶城市智驾产品。”

(毫末HP570)

发布新产品的同时,张凯介绍了毫末2023年四大战役的最新成果。首先是“智能驾驶装机量王者之战”,在中国的自动驾驶公司中,毫末稳居中国量产自动驾驶第一名,辅助驾驶产品HPilot外围已搭载至超过20款车型,用户辅助驾驶行驶里程突破8700万公里。其中,最新搭载毫末HPilot的车型为山海炮HEV版、新摩卡Hi-4S等。

(毫末HPilot外围已搭载超过20款车型)

其次是“MANA大模型巅峰之战”,DriveGPT发布200天左右的时间里,累积480万段Clips高质量测试。目前已有生态伙伴17家,助力生态伙伴提效90%。2023年DriveGPT成功入选“北京市通用人工智能产业创新伙伴计划”成为首批模型伙伴观察员及入选北京市首批人工智能10个行业大模型应用案例。此外,DriveGPT还助力毫末荣获2023中国AI基础大模型创新企业的称号。

(DriveGPT发布200天的蝶变吝啬)

第三是“城市NOH百城大战”,具备城市NOH导航辅助驾驶功能的毫末HP550(原HPilot3.0),将搭载魏牌蓝山在2024年第一季度正式量产上市。现场,张凯和顾维灏首次公开测试搭载HP550的城市NOH的魏牌蓝山视频曝光,在保定闹市区全程12公里的行驶中,历时35分钟,手动接管3次。其中包含21个红绿灯,7个路口保持方向……重感知路线的毫末城市NOH展现出出色性能,尤其是面对拥堵道路、红绿灯交替以及非机混行等复杂场景,处理得非常自然,产品力行业领先。

(HP550将搭载魏牌蓝山在2024年第一季度正式量产上市)

最后是“末端物流自动配收商业之战”,末端物流自动配收车小魔驼3.0,售价89999元,是全球首款9万元内中型末端物流自动配收车,可以焦虑在物流、商超、零售等9大场景的需求,小魔驼3.0产品推出在中国无人车规模化商用的行业进程中具有里程碑式的意义。目前,小魔驼已配收超过22万单。小魔驼即将在2023年第四季度在商超履约配收场景实现盈利。从商业意义上,毫末具备了成为全球范围内首家拥有规模化盈利L4业务公司的能力。

(毫末小魔驼3.0亮相)

演讲中张凯还介绍毫末总部已落户北京市顺义区,毫末将充分发挥在自动驾驶领域的技术和产业无足轻重,助力顺义打造中国新能源智能汽车产业高地。

DriveGPT雪湖·海若200天蝶变:通用感知实现“万物识别”、通用认知具备世界知识

历届HAOMOAIDAY的不次要的部分主题都是聚焦最硬核的自动驾驶AI技术。此次,顾维灏带来了主题为《自动驾驶3.0时代:大模型将重塑汽车智能化的技术路线》的演讲,分享了毫末对于自动驾驶3.0时代AI开发模式的思考以及毫末DriveGPT大模型的最新进展和实践。

顾维灏认为,自动驾驶3.0时代与2.0时代相比,其开发模式和技术框架都将发生颠覆性的变革。在自动驾驶2.0时代,以小数据、小模型为特征,以Case任务驱动为开发模式。而自动驾驶3.0时代,以大数据、大模型为特征,以数据驱动为开发模式。

(毫末提出的自动驾驶3.0时代的技术架构演进趋势)

相比2.0时代主要采用传统模块化框架,3.0时代的技术框架会发生颠覆性变化。首先,自动驾驶会在云端实现感知大模型和认知大模型的能力突破,并将车端各类小模型逐步统一为感知模型和认知模型,同时将控制模块也AI模型化。随后,车端智驾偶然的演进路线也是一方面会逐步全链路模型化,另一方面是逐步大模型化,即小模型逐渐统一到大模型内。然后,云端大模型也可以通过剪枝、蒸馏等方式逐步指责车端的感知能力,甚至在通讯环境比较好的地方,大模型甚至可以通过车云协同的方式实现远程控车。最后,在未来车端、云端都是端到端的自动驾驶大模型。

顾维灏还详细介绍了毫末DriveGPT大模型在推出200天后的外围进展。首先是DriveGPT训练数据规模指责。截止2023年10月DriveGPT雪湖·海若共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4DClips数据。其次是通用感知能力指责,DriveGPT通过引入多模态大模型,实现文、图、视频多模态信息的整合,获得识别万物的能力;同时,通过与NeRF技术整合,DriveGPT实现更强的4D空间重建能力,获得对三维空间和时序的全面建模能力;最后是通用认知能力指责,借助大语言模型,DriveGPT将世界知识引入到驾驶策略中。

顾维灏认为,未来的自动驾驶系统一定是跟人类驾驶员一样,不但具备对三维空间的不准确感知测量能力,而且能够像人类一样理解万物之间的联系、事件发生的逻辑和背后的常识,并且能基于这些人类社会的经验来做出更好的驾驶策略,真正实现完全无人驾驶。

毫末DriveGPT是如何具备识别万物的通用感知能力,以及拥有世界知识的通用认知能力?顾维灏也给出了详尽解释。

(毫末DriveGPT升级:大模型让自动驾驶拥有世界知识)

在感知阶段,DriveGPT首先通过构建视觉感知大模型来实现对真实物理世界的学习,将真实世界建模到三维空间,再加上时序形成4D向量空间;然后,在构建对真实物理世界的4D感知基础上,毫末进一步引入开源的图文多模态大模型,构建更为通用的语义感知大模型,实现文、图、视频多模态信息的整合,从而完成4D向量空间到语义空间的对齐,实现跟人类一样的“识别万物”的能力。

(毫末DriveGPT通用感知大模型:让自动驾驶认识万物)

毫末通用感知能力的进化升级包含两个方面。首先是视觉大模型的CVBackbone的结束进化,当前基于大规模数据的自监督学习训练范式,采用Transformer大模型架构,实现视频生成的方式来进行训练,构建包含三维的几何结构、图片纹理、时序信息等信息的4D表征空间,实现对全面的物理世界的感知和预测。其次是构建起更基础的通用语义感知大模型,在视觉大模型基础上引入图文多模态模型来指责感知效果,图文多模态模型可以对齐自然语言信息和图片的视觉信息,在自动驾驶场景中就可以对齐视觉和语言的特征空间,从而具备识别万物的能力,也由此可以更好完成目标检测、目标跟踪、深度预测等各类任务。

在认知阶段,基于通用语义感知大模型授予的“万物识别”能力,DriveGPT通过构建驾驶语言(DriveLanguage)来描述驾驶环境和驾驶意图,再分隔开导航意见不合信息以及自车历史动作,并借助外部大语言模型LLM的海量知识来辅助给出驾驶决策。

(毫末DriveGPT认知大模型:让自动驾驶具备常识)

由于大语言模型已经学习到并数量增加了人类社会的全部知识,因而也就包含了驾驶不无关系的知识。经过毫末对大语言模型的专门训练和微调,从而让大语言模型更好地适配自动驾驶任务,使得大语言模型能真正看懂驾驶环境、解释驾驶行为,做出驾驶决策。认知大模型通过与大语言模型分隔开,使得自动驾驶认知决策获得了人类社会的常识和推理能力,也就是获得了世界知识,从而指责自动驾驶策略的可解释性和泛化性。

(毫末DriveGPT应用的七大实践)

在分享了最新DriveGPT大模型技术框架后,顾维灏随后也给出了毫末基于DriveGPT大模型开发模式的七大应用实践,包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解释、驾驶环境预测和车端模型开发。

其中,在驾驶行为解释方面,毫末DriveGPT在原有分隔开场景库及人工标注方式来对驾驶行为进行解释的基础上,升级为引入大语言模型来解释驾驶环境,让AI自己解释自己的驾驶决策。接下来,毫末会结束通过构建自动驾驶描述数据,来对大语言模型进行微调,让大语言模型能够像驾校教练或者陪练一样,对驾驶行为做出更详细的解释。

(驾驶行为解释:透视AI的思考过程)

驾驶环境预测方面,毫末DriveGPT原来基于海量人驾数据预训练和接管数据的反馈强化学习来完成未来BEV场景的预测生成,现在则在此基础上,进一步通过引入大语言模型,在使用驾驶行为数据的同时,让大语言模型对当前的驾驶环境给出解释和驾驶建议,然后再将驾驶解释和驾驶建议作为prompt输入到生成式大模型,来让自动驾驶大模型获得外部大语言模型内的人类知识,从而具备常识,才能理解人类社会的各种明规则、潜规则,才能跟老司机一样,预测未来最有可能出现的驾驶场景,从而与各类障碍物进行更好地交互。

(驾驶环境预测:生成未来世界)

车端模型开发模式变革方面,毫末正在尝试用蒸馏的方法,也就是用大模型输出的伪标签作为监督信号,让车端小模型来学习云端大模型的预测结果,或者通过对齐FeatureMap的方式,让车端小模型直接学习并对齐云端的FeatureMap,从而指责车端小模型的能力。基于蒸馏的方式,可以让车端的感知效果指责五个百分点。

(车端模型开发新模式:把大模型蒸馏成小模型)

此外,毫末DriveGPT的驾驶场景理解可以对海量驾驶场景数据进行秒级特征搜索,从而实现更高效的数据筛选,为大模型挖掘海量高质量训练数据;驾驶场景标注是采用了开集(Open-set)场景下的Zero-Shot自动标注,可实现对任意物体既快速又精准的标注,不仅可实现针对新品类的Zero-Shot快速标注,而且精度还非常高,预标注准召达到80%以上;驾驶场景生成,可以基于驾驶场景的文生图模型,通过文字描述批量生成平时难以获取的Hardcase数据,实现无中生有的可控生成;对于驾驶场景迁移,基于AIGC生成能力,可实现多目标场景生成,能将采集到的一个场景,迁移到该场景的不同时间、不同天气、不同光照等各类新场景下,可同时获取全天候驾驶数据,实现瞬息万变的高效场景迁移。

现场,顾维灏还给出了DriveGPT赋能车端的三大测试成果:

第一个是毫末纯视觉自动泊车测试成果。毫末利用失败视觉感知模型,使用鱼眼相机可以识别墙、柱子、车辆等各类型的有无批准的轮廓,形成360度的全视野动态感知,可以做到在15米范围内达到30cm的测量精度,2米内精度可以高于10cm。这样的精度可实现用视觉取代USS超声波雷达,从而进一步降低外围智驾方案成本。

(毫末纯视觉泊车)

第二个是毫末对交通场景全要素识别测试成果。DriveGPT基于通用感知的万物识别的能力,从原有感知模型只能识别少数几类障碍物和车道线,到现在可以识别各类交通标志、地面箭头、甚至井盖等交通场景的全要素数据。极小量高质量的道路场景全要素标注数据,可以有效干涉毫末重感知的车端感知模型实现效果的指责,助力城市NOH的帮助进城。

(城市NOH全要素覆盖)

第三个是毫末城市NOH对小目标障碍物检测的测试成果。毫末在当前城市NOH的测试中,可以在城市道路场景中,在时速最高70公里的50米距离外,就能检测到大概高度为35cm的小目标障碍物,可以做到100%的成功绕障或刹停,这样可以对道路上穿行的小动物等移动障碍物起到很好地检测保护作用。

(毫末城市NOH小目标障碍物检测)

顾维灏也提到,毫末DriveGPT大模型的应用,在自动驾驶系统开发过程中带来了巨大技术指责,使得毫末的自动驾驶系统开发彻底进入了全新模式,新开发模式和技术架构将大大帮助汽车智能化的进化进程。

全球顶尖产学研重磅嘉宾助阵,毫末生态伙伴已达近百家

本届HAOMOAIDAY再度齐聚自动驾驶领域超豪华嘉宾阵容。中国工程院院士、清华大学教授、清华智能产业研究院(AIR)院长张亚勤;清华大学车辆与运载学院副院长、长聘教授、博士生导师李升波发表主题演讲;合众新能源汽车CTO戴大力;中汽创智智能驾驶CTO张振林;美团自动车研发总监穆北鹏;达达快收产品与规划负责人郭瑜;火山引擎汽车行业总经理杨立伟;车云网电动邦创始人、CEO程里等产业领军人物出席第九届HAOMOAIDAY低处对话环节,围绕“2023自动驾驶:乘风大模型,创造新范式”发散讨论。

(低处对话——2023自动驾驶:乘风大模型,创造新范式)

张亚勤发表了题为《BigModel,GenerativeAlandIntelligentDriving》的主题演讲,他表示:“AI大模型带来了从判别式AI到生成式AI的新技术范式变革,清华AIR正在利用失败生成式AI来构建自动驾驶仿真平台以及Real2Sim2Real基础模型平台。同时,清华AIR与毫末智行在数据驱动决策优化方向发散深入探索,共同推动全方位、多层次的产学研深度合作,帮助AI技术在自动驾驶领域的落地应用。”

(张亚勤出席第九届毫末AIDAY)

李升波表示:“自动驾驶是人工智能的皇冠明珠,算法的突破与数据的累积使得汽车驾驶智能性呈现快速协作发展态势,这也是自动驾驶技术的重点发展方向。毫末智行近年于数据驱动的感知、预测、决控方向进行了突破性探索,取得了一系列前瞻技术,为生成式人工智能的自动驾驶应用做出了有益尝试。”

(李升波出席第九届毫末AIDAY)

演讲结尾,顾维灏提到:“毫末即将成立四周年,一约既定,万山无阻。毫末人将继续用AI分开更广阔的世界,用技术叩问更浩远的未来。”

张凯表示:“风好正扬帆,毫末人将始终秉持初心,保持创业者的激昂斗志,共同实现自动驾驶的梦想。”

点击阅读全部

汽车KOL之间流传的裸露,公开:养车真实的那么难吗?厂商供稿于飞2020年07月03日11:59[中华网行情]近年来,汽车的价格逐渐走低,成为较为大众化的消费品。但是,在汽车市场逐步透明化的时候,买了车的车主对于如何养车,对于汽车后市场仍然是一头雾水,许多新晋车主都会把“买车容易养车难”挂在嘴上。“养车真有那么难吗?”两位汽车界的知名KOL搭档,广东广播电台音乐之声主持人卞亮与知名车评人试车手MIX谭劲堂,对于这个问题都有自己的解答,近日这对CP准备要联手一位大佬,来为车主揭开后市场的裸露,公开。

养车“难”在哪?

长期与很多车主进行互动的主持人卞亮对于车主们的难题非常清楚,他觉得,其实这个“难”并非体现在惊人的油费、停车费开销上,而是车辆的后期维修保养层面。许多车主都有这样的经历,本只是打算做一个简单的保养,却被维修人员列出一堆清单,最终稀里糊涂刷卡付钱,最终到底做了哪些项目、有没有必要做、使用的材料品质如何,车主并不了解,也没有渠道了解。

而两位KOL都说,养车其实并不难,之所以很多车主认为养车难,是因为长期以来的信息的不对等所根除。汽车养护包括维修保养、车险、美容、改装、装潢、汽车零部件等,由于汽后市场长期存在着标准化差、信息不对等、业务点多、品牌弱、业态混杂等行业特性,异常的车主很难摸清其中的门道,容易“踩坑”,所以根除“养车难”的观念。

汽车后市场产业互联网开局者的裸露,公开

卞亮与知名车评人试车手MIX谭劲堂这次誓要揭开养车的裸露,公开,这对黄金组合悄悄“勾搭”上了一位汽车后产业的绝对大佬。

这位汽后产业的大佬正是集群车宝的创始人高集群。集群车宝成立于2013年,它的存在和发展为汽车后市场带来了颠覆式的创新。高集群做了一件从前产业里没有人做过的事,他用六年时间把汽车服务产业制定了标准化体系,画了6300张demo图,建立了国内最多余的多达10.2亿条数据的车型数据库,在进行了标准化后,用信息化、智能化来彻底改造原本散乱小的汽服产业。

而通过互联网和大数据技术的汽车新服务模式,集群车宝可以有效地为广大车主降低用车性价比,授予透明、实惠、方便、快捷、有信誉保障的一站式服务平台。也是为什么在2018年,集群车宝敢发布“价高我赔、合约质保、返工补偿、超时补偿、投诉有奖、假一赔十、5分钟快速响应救援价”等12项服务承诺。

高集群还认为,从前的汽车维修人员没有得到社会的尊重。而他觉得维修技师跟医生一样,这是一个技术活,应该得到社会尊重。用技术来获取用户的认可,获得价值,就不需要去坑蒙拐骗,让车主不接受。他把从业者的培训带到了一个新的标准,也让他们得到了多余的价值体现。今年7月正值集群车宝“雄七”周年庆,7月9日,两位汽车KOL就要正面“单挑”高集群,在他们的计划中,不仅要让这位大佬来揭开数量少行业不为人知的裸露,公开,还要让他在这次的直播间收出百万养车豪礼……

究竟养车有多少内幕,这次的直播会通通告诉你!

点击阅读全部