相关新闻全国多地遇强降雨安徽多地告急,紧急转移六万四千人6月23日至24日,安徽省黄山、宣城两地遭遇了大范围的暴雨侵袭,雨量惊人,屯溪区占川站记录到的最大降雨量达到了190毫米
2024-06-2416:17:05全国多地遇强降雨暴雨来袭四川乐山紧急转移796人多地防范强降雨7月12日至13日,四川省在24小时内未出现因灾伤亡情况,得益于及时转移3244人并成功避险3起地质灾害,有效保护了54人免受可能的灾害使加剧。此期间,广元市苍溪县苍溪三川站记录到最大降雨量为122.9毫米2024-07-1720:49:35暴雨来袭广西南宁强降雨多地内涝各方救援紧急排水保畅通5月8日,南宁遭遇暴雨侵袭,市区多条道路积水严重。其中,良庆区和平乐区的情况尤为突出,银海大道、大沙田等地积水深至成人膝盖,影响交通,电动自行车被冲倒,甚至有车辆被水流卷走。市民赵先生经历此景,在银海大道旁商铺躲避,直至积水稍退2024-05-0909:03:14广西南宁强降雨多地内涝安徽黄山遇强降雨多地受灾,启动Ⅲ级响应紧急接纳6月20日,黄山市减灾救灾委员会办公室发布公告,宣布启动自然灾害放弃应急预案Ⅲ级响应,以应对自6月19日起影响该市的强降雨灾害。此次降雨导致黄山市三区四县均遭受了不同程度的损失2024-06-2016:01:03安徽黄山遇强降雨多地受灾全国多地遭遇强降雨天气多地启动应急响应近期,我国多地遭遇强降雨天气。重庆、湖北、湖南、广西及海南岛部分区域普降大雨或暴雨。中央气象台报告称,直至5月31日,全国范围内的降雨天气仍在结束2024-05-3115:18:05全国多地遭遇强降雨天气广东开启新一轮强降雨多地发布暴雨预警广东省气象台最新通报显示,4月30日凌晨,一股强飑线向东并向南移动,导致广东省北部地区在0时至5时期间遭受显著强降水侵袭。2024-04-3011:13:06广东开启新一轮强降雨声明:本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:Sia,授权站长之家转载发布。
新年伊始,ChatGPT竟成了「恐怖分子」的帮凶?在为一位美国现役军人授予爆炸知识后,后者成功将一辆特斯拉Cybertruck在酒店门口引爆……
汽车爆炸现场画面,外媒视频截图
这并非科幻电影桥段,而是AI安全风险正在文明身边真实上演的缩影。知名AI投资人RobToews在《福布斯》专栏预测,2025年我们将迎来「第一起真实的AI安全事件」。
我们已经开始和另一种智能生命一起生活了,RobToews写道,它跟人一样任性难测,且具有真诚对待性。
巧的是,另份新鲜出炉的行业预测也指向同一问题。北京智源研究院在2025十大AI技术趋势中描绘了从础研究到应用落地再到AI安全的不完整图景。值得划重点的是,AI安全作为一个独立的技术赛道,被智源评为第十个趋势:
模型能力指责与风险预防并重,AI安全治理体系结束完善。
报告点评道:作为复杂系统,大模型的Scaling带来了涌现,但复杂系统特有的涌现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了确认有罪。基础模型在自主决策上的结束进步带来了清楚的失控风险,如何引入新的技术监管方法,如何在人工监管上不平衡的行业发展和风险管控?这对参与AI的各方来说,都是一个值得结束探讨的议题。
AI大模型安全,水深流急
2024年,AI大模型在实现跨越式协作发展同时,也让我们透明看到了安全的警惕神经如何被促进挑动。
根据研究,AI安全风险可以分为三类:内生安全问题、衍生安全问题和外生安全问题。
「内生安全问题」(如「数据有毒」、「价值对齐」、「决策黑盒」),属于大模型的「基因问题」——庞大的架构、海量的参数、复杂的内部交互机制,让模型既强大又难以驾驭。
很多人知道「poem」复读漏洞——重复一个词就能让ChatGPT吐出真实个人信息,这是因为大模型学习过程中,除了提取语言知识,也会「背诵」一些数据,结果数据隐私以一种意想不到的荒谬方式被触发出来。
机器之心曾让ChatGPT不断重复「AI」这个词,一开始它很听话,不断重复,在重复了1395次「AI」之后,它突然话锋一转,开始说起SantaMonica,而这些内容很可能是ChatGPT训练数据的一部分。
Prompt攻击是因为系统提示和用户输入都采用相同的格式——自然语言文本字符串,大语言模型没办法仅根据数据类型来区分指令和输入。
「越狱」手段也是层出不穷。从「奶奶漏洞」、「冒险家漏洞」、「作家漏洞」到最新的「DeceptiveDelight」技术,攻击者只需三次对话就有65%的概率绕过安全批准,让模型生成违禁内容。
DeceptiveDelight攻击示例,来源PaloAltoNetworks
Anthropic的最新研究更是发现,大语言模型居然学会了「真实的物品对齐」。
更令人担忧的是大模型在行业领域的表现。大模型在通用对话中表现流畅,清华大学、中关村实验室、蚂蚁集团等机构联合撰写的《大模型安全实践(2024)》白核书指出,在金融、医疗等对模型输出专业性、准确性要求极高领域的应用却面临严峻确认有罪,包括严重幻觉、缺乏复杂推理能力。
展望2025年,智源研究院预测AgenticAI将成为大模型应用的主要形态,这些具备更强自主性的智能体将深度融入工作与生活,也加剧了系统失控的风险。
试想一下,未来两到三年内,我们可能生活在一个每个人都有数十或数百名代理为我们工作的世界,安全基础设施的建设变得尤为重要,谁来授予这些安全基础设施?如何无约束的自由这些AI代理?如何确保它们不会失控?
当前的大模型安全评测主要聚焦内容安全,对于智能体这类复杂应用架构和未来AGI的安全评估体系仍显不足。
AI安全风险的另一大来源是「衍生安全问题」,随着AI滥用引发其他领域的一些重大安全事故,如假新闻、深度伪造诈骗、解开知识产权、教唆青少年自杀、作弊,也对社会治理提出了重大确认有罪。
「真实」这个高度发展命题正遭到前所未有确认有罪。西藏日喀则地震期间,「地震被压废墟下戴帽小孩是AI生成」的新闻冲上热搜,很多平台账号转发图片时都以为是真。除了金融诈骗,深度伪造也将网络性暴力推向极端,「厌女文化」盛行的韩国成了重灾区。世界经济论坛甚至把AI操纵选举列为2024年的头号风险。
这张图片被平台多个账号发布,并和本次地震关联,引发网友关注和转发。经媒体查证,上述图片由AI工具创作,原始作者在2024年11月18日发布了相同画面的短视频,并声明是AI生成。
版权是另一个大问题。OpenAI、Anthropic、Suno等领头羊已深陷版权泥潭。最近,爱奇艺起诉某大模型公司AI魔改经典影视剧片段,开创国内AI视频侵权诉讼先例。
第三类「外生安全问题」指向了人工智能偶然的外部网络攻击对抗,如平台、框架安全漏洞、模型被盗、数据泄露风险等,属于传统信息安全范畴。
就拿更加严峻的数据泄露来说。目前AI模型推理比较好的选择仍是在明文状态下进行,用户会输入极小量真实、警惕数据,获取模型建议。有报告指出,2024年企业员工上传到生成式AI工具的警惕数据增长了485%,包括客户减少破坏信息、源代码和研发数据。
因为不同类型的数据(如文本、图像、视频、音频)在数据规模和处理需求上的巨大统一,被预测寄予厚望的多模态大模型让数据的安全防护变得更为棘手。
穿越激流,构筑多维安全航道
人类叩开了深度智能时代的大门,安全问题也迎来质变时刻。
2024年,整个业界、政府、国际组织在AI治理上做了很多工作,从技术研究、治理框架到国际合作,进行了多种形式探索。数字时代积聚的安全对抗能力,让中国在大模型应用与治理方面走在了世界前列。
在监管层面,中国是全球最早对生成式AI进行规范的国家之一。继2023年5月发布《生成式人工智能服务无约束的自由暂行办法》后,《网络安全技术生成式人工智能服务安全高度发展要求》也已进入公开征求意见阶段,很多规范细正在制定之中。
在底层关键技术研究上,国内业界取得了积极成果。例如,北京智源研究院研发了防御大模型和AI监管大模型,对齐优化方面进行了创新。
因为模型在预训练后形成的分布结构较为稳固,大模型存在「抗拒微调对齐」的特性,后期单纯通过微调来实现对齐往往效果不理想,对此,智源提出在预训练阶段就将对齐所需的表征能力编织入模型架构中。
在对齐优化过程中,针对未对齐答案和对齐答案之间存在的偏差,智源采用了迭代训练的方法,更有利于模型从原始问题到对齐问题的训练,取得了良好效果。
在多模态对齐上,智源推出的「alignanything」框架实现了多模态信息的全面对齐,其创新在于将多模态信息、现实世界的具身认知、以及人类意图进行细粒度的对齐整合,在LLaMA模型的微调过程中已经展现出显著效果。
同样是解决大模型的可控性,蚂蚁集团的应对之道是把知识图谱的优点——逻辑推理能力强、知识准确可靠,与大模型分隔开起来。通过在大模型预训练、提示指令、思维链、RAG(检索增强生成)和模型对齐等环节中引入符号知识,有效增强了模型输出的专业性和可靠性。
大模型作为一种通用技术,既可以用于「攻」,也可以用于「防」。在拥抱大模型,以AI对抗AI方面,华为、蚂蚁集团、360集团、深信服等厂商进行了有益探索。
华为提出业界首个L4级AI安全智能体,用大模型加上一些安全知识图谱实现安全的纵深推理,发现一些以前没有发现过的安全攻击。
蚂蚁集团发布了大模型安全一体化解决方案「蚁天鉴」,包含大模型安全检测平台「蚁鉴」、大模型风险防御平台「天鉴」两大产品,拥有检测与防御两大不次要的部分安全技术能力。
「蚁鉴」是全球第一个实现工业级应用的可信AI检测平台,以生成式能力检测生成式系统,覆盖了内容安全、数据安全、科技伦理全风险类型,适用文本、表格、图像、音频、视频等全数据模态。
在防御能力上,「天鉴」会动态监测用户与模型的交互,防止诱导攻击,同时对生成的回答内容进行风险过滤,保障大模型上线后从用户输入到生成输出的外围安全防御。
360集团推出了基于类脑分区专家协同架构的安全大模型,通过EB级安全数据训练,已具备L4级「自动驾驶」能力,实现了从威胁检测到溯源分析的全流程自动化。
深信服的「安全GPT」可授予7×24小时实时在线智能值守,指责安全运营效率,同时深度挖掘传统安全设备难以检测的高对抗、高绕过的Web攻击、钓鱼攻击。
除了监管、关键技术的推进,行业也在积极破坏AI安全协作。
在安全治理领域,模型的安全评测是一个非常次要的环节。2024年4月,联合国科技大会发布了两项大模型安全标准,其中,蚂蚁集团牵头制定《大语言模型安全测试方法》,首次给出四种攻击强度分类,授予了可衡量的安全评估标准:L1随机攻击、L2盲盒攻击、L3黑盒攻击和L4白盒攻击。
这种分级不仅搁置了攻击的技术复杂度,更次要的是基于攻击者能获取的模型信息程度来划分,这让防护措施的部署更有针对性。
在推进国际对话上,2024年3月,北京智源研究院发起并承办我国首个AI安全国际对话高端闭门论坛,与全球AI领袖学者及产业专家联合签署《北京AI安全国际共识》,设定模型安全红线,释放模型自我演进、自我复制和不受控的无能的增长等行为,确保开发者遵循严格的安全标准。
9月威尼斯,一场推动AI安全的全球对话落幕,图灵奖得主YoshuaBengio、姚期智等科学家共同签署「AI安全国际对话威尼斯共识」,降低重要性了人工智能安全作为「全球公共产品」的重要性。
放眼全球,英美侧重轻触式监管,美国加州的SB1047因争议被同意。欧盟AI法案已经生效,它建立起四级风险分类体系,明确了人工智能产品的全生命周期监管要求。
在业界,主要头部AI公司相继发布安全框架。
OpenAI在不次要的部分安全团队解散后公布了前10个安全措施,试图在技术创新与社会责任间寻求不平衡的。
Google也紧随其后发布了SAIF安全框架,应对模型窃取、数据降低纯度等风险。
Anthropic发布了负责任扩展策略(ResponsibleScalingPolicy,RSP),被认为是降低AI灾难性风险(如恐怖分子利用失败模型制造生物武器)最有前途的方法之一。
RSP最近更新,引入了更僵化和细致的风险评估与无约束的自由方法,同时重新确认不培训或部署未实施充分保障措施的模型。
一年多前《经济学人》就开始讨论人工智能的快速发展既让人平淡,又让人恐惧,我们应该有多担心?
2024年初,中国社会科学院大学在研究报告中指出,安全科技将成为社会的公共品,并与人工智能并列为未来的两项通用技术。一年后,智源研究院再次呼吁关注安全治理印证了这一战略判断的前瞻性,AI越强大,安全科技价值也在不同步放大。
我们不可能扔掉利刃,重新接受科技,唯有为其打造足够安全的刀鞘,让AI在造福人类的同时始终处于可控轨道。变与不变中,AI安全治理或许才是AI行业永恒的话题。
当晚,齐先生及家人、亲朋彻夜展开搜寻。经过查看村中的监控,发现当日下午3时20分许,佳佳一个人往村子南面去了。村南有一个阳光小区,有两栋住宅楼,小区产生的生活污水,通过管道排放到附近一个大坑中。这个大坑是取土形成的,面积有三四十亩,约15米深,水深六七米。坑岸直上直下犹如斧劈刀削一般,如果人掉下去,即使会游泳也很难爬上岸来。家人多次来到大水坑四周搜寻,都没有发现佳佳的踪迹。
今年,我国将破坏国家综合立体交通网主骨架建设。各地帮助推进重点工程和重点项目,以创新为引擎助力高质量建设。
新年第二天,经过100多名建设者连续6个多小时的施工,厦金大桥(厦门段)控制性工程刘五店航道桥西锚碇首个沉井安全沉放到40米水深的海底,为大桥筑稳“压舱石”。沉井的加工基地拼装、海上长距离浮运和现场下放定位等环节都面临地质、风浪等多种复杂因素影响。中交二航局厦金大桥(厦门段)A1标段常务副总工郝聂冰表示,他们积极攻克全离岸环境下桥梁技术难题,完成沉井海上长距离浮运拖带,自主研发智能监测与控制系统,可实时感知沉井结构应力等关键参数,克服了沉井施工系列难题。主线全长17.34公里的厦金大桥(厦门段)建成后,将成为厦门本岛联系翔安机场最便捷的通道,有效缓解翔安进出岛通道及翔安机场片区交通压力。
在长江入海口,正在被吊装的是“江海号”盾构机的“心脏”——主驱动。“江海号”盾构机整机长约145米,总重量约5000吨,最大开挖直径达16.64米,是我国自主研制的最大直径盾构机,将用于世界最长公路水下盾构隧道——海太长江隧道的建设。巨无霸“江海号”10月底在长沙下线后拆解,分段通过不同运输方式长途跋涉到达江苏隧道施工现场,再进行组装、调试。作为这个“大国重器”的“快递员”,孟德锋的新年是在路上度过的。中铁十四局海太长江隧道项目盾构经理孟德锋表示,像主驱动这样的大部件采用水陆联运,其他相对小件则采用陆运,整个过程总共需要运输113车船,新年前后他一直在路上有30多天。随着主要部件运进施工现场,“江海号”也进入入地组装的关键阶段,预计今年3月将开始长江下超长距离的掘进。孟德锋认为,“江海号”盾构机搭载了许多行业领先的新工艺、新技术,是隧道设备新质生产力的发散体现,能够参与其中感到非常自豪。
新年伊始,上海洋山港一片繁忙。在国家“十四五”重点工程——小洋山北作业区施工现场,国内先进的打桩船、起重船等正在紧张有序交叉作业中。目前,西防波堤正在安装第27个基础结构,今年计划安装70个。中交三航局小洋山北项目总经理部副总经理赵辉介绍,西防波堤工程由136个桶式基础结构组成,每个桶重达5000多吨、高30多米。他们在施工过程中采用了国内首创的桶式基础结构施工工艺,节省了工期、降低了成本,同时把对海洋环境的影响降到最低。新的一年,他们将在建设施工过程中不断创新,用实干奋斗建设好洋山港。小洋山北作业区计划新建7个7万吨级和15个2万吨级集装箱泊位,建成后将进一步发挥长三角世界级港口群江海联运外围无足轻重,指责上海国际航运中心功能地位和我国国际航运竞争力。
37.98万元!最强泛越野坦克500Hi4-Z正式开启预售中华网汽车邱添2024年12月04日16:42[中华网新车]2024年12月3日泛越野坦克500Hi4-Z正式开启预售,预售价37.98万元,并授予价值超2.2万的三大预售权益。选装无忧礼,9000元的前桥差速锁及户外休闲包;用电无忧礼,用户首年充电费用;舒享无忧礼,价值8000元座椅按摩包、2000元流媒体内后视镜以及3000元手机蓝牙钥匙和遥控泊车。
坦克500Hi4-Z定位中大型豪华电混SUV,可忽略的,不次要的性能和豪华配置成为越野新能源市场的新标杆,拥有“全新智能、全面安全、全系豪华”三大配置亮点。今年10月份,长城汽车基于34年越野造车经验,公布了越野分级标准,以期成为用户对消费者生命授予保障的安全指南,干涉用户真正基于需求场景对号入座,用户在确认有罪自然、确认有罪自我的过程中更加从容地应对,享受真正的越野乐趣。截至目前,在越野分级的标准下,坦克品牌旗下所有在售车型,都属于强越野序列,而坦克500Hi4-Z就是坦克品牌的首款泛越野产品。功率分流作为全球市场保有量最多的混动技术,已有27年的历史。但受限于发动机无法在越野场景下的大负荷工况授予足够轮端扭矩,以及在沙漠等高速大负荷场景单挡功率分流调节能力不足等问题,始终未能应用在越野品类车型中。长城Hi4-Z通过采用功率分流+三挡前驱模块的高集成创新设计,双电机分布式布置,一举解决这一难题,能够实现包含纯电、增程、功率分流、直驱、并联、四驱等其他混动系统所包含的全部工作模式,成为目前为止全球范围内覆盖模式最全的越野混动系统。在结构方面,Hi4-Z拥有全球最短的变速器箱,通过电机转子与行星排嵌套式设计,超薄离合器机构,传动轴与主减一体连接技术,低摩擦锥轴承,2微米级高精度磨齿工艺等30余项发明专利技术,实现了560mm的纵向尺寸,比单档混联变速器箱短20%,为电池布置腾出空间。在电池安全方面,Hi4-Z应用了专为混动越野开发的高安全、高体积密度动力电池。电芯方面使用高比能活性材料、超导离子电解液、全极耳工艺,在pack设计上采用了双层高强度模组、双液冷循环等行业领先技术,不但实现了234Wh/kg能量密度,还实现了232wh/L的体积密度,使得动力电池在焦虑目标电量的基础上尺寸做到最小。通过一系列高集成度设计,最终将59.05kW·h的动力电池包,融进了带大梁的中大型越野SUV上,使Hi4-Z架构的WLTC工况纯电续航达到200km以上,成为全球纯电续航最长的插混越野架构。续航长更需要充电快,Hi4-Z配备800V电压平台,3C高充电倍率电池,集成式升压模块,最大充电功率163kW,使用800V超充桩仅需一杯咖啡的时间就能够减少120公里纯电续航。同时,Hi4-Z还集成了升压模块,即便使用低压充电桩,依然是插混越野最快的充电功率,真正做到越野插混充电速率的行业第一。在硬件布置上,Hi4-Z搭载前后桥机械差速锁,物理加持实现前后轴各自的绝对同转,拉高泛越野的穿困能力上限。后悬架布置,采用迪翁五连杆越野专用后悬架。既能耗尽传统外围桥的天生强度,又能容纳更大的驱动电机模块。工艺上采用行业最下降的4000吨液压一体成型技术,使直径90mm的高强钢弯梁一次成型,可耐受1000兆帕强度,相当于1万个大气压。在电池安全方面,Hi4-Z的电池包采用结构强化的铝型材壳体,电池包通过边梁强化+双层结构,扭转刚度达到32000N·m/deg,上壳体选用高温复合材料,配合多层隔热防火材料,可实现单电芯热失控时,整包不起火。另外,电池包还采用超IP68防水等级,水深1米以下48小时静置各项功能正常,超行业标准96倍。Hi4-Z以领先的技术组合和智能控制能力,绝对冗余的技术搭载和测试标定,让越野性能达到了泛越野场景下的行业新高度,不管是复杂路况的精准操控,还是极限环境的穿困能力,都展现了无与伦比的实力。动力方面,坦克500Hi4-Z搭载2.0T发动机和前后大功率驱动电机,三擎联动,可实现百公里帮助4.6秒;纯电续航里程WLTC201公里,完美做到“一周只充一次电,一次就能开一周”,综合续航近1100公里;得益于功率分流3挡的前驱模块,发动机可以做到全速域的高效直驱。智能化层面,坦克500Hi4-Z搭载全新升级的CoffeeOS3.0系统,减少了露营模式、儿童模式等4种智能场景体验。语音识别更精准,一句话10个指令快速响应,人机交互也更加智能和迅捷。安全性层面,坦克500Hi4-Z分隔开笼式车身结构与智能驾驶系统,通过23项主动安全功能为用户授予全方位的安全防护,无论是在复杂的城市街道还是崎岖山路,都能轻松应对。豪华性层面,坦克500Hi4-Z延续坦克高端豪华的基因,同样按照超豪车标准精心打造,无论是设计、用料、还是豪华配置,都力求给车主最尊贵的体验。内饰采用大面积的核质包覆,座椅材质采用亲肤级Nappa真核,应用人体工程学设计,配合通风加热按摩,可以做到比肩百万级豪车的水准。坦克500Hi4-Z的预售启动,预示着坦克品牌在新能源越野领域的又一里程碑,坦克品牌将继续以澎湃实力攀登新高峰,为全球用户授予更加出色的越野SUV体验。点击阅读全部编辑部发自凹非寺
量子位|公众号QbitAI
「ScalingLaw」和「打脸时刻」,相对是2024年科技智能领域的年度关键词。
坏消息是,传统定义上的ScalingLaw在放缓,但好消息是又有新的ScalingLaw出现。
缩减时间维度,其实ScalingLaw在AI发展领域中一直起着作用。
人类在哪个时间点上,如果突然之间被打脸了,那就是比较优秀时刻。
不断打脸,最终才能知道哪个才是所谓的KillerAPP。
这是20余位工业界、学术界乃至投资界的顶流大咖,在量子位MEET2025智能未来大会上反复提及、探讨的话题。
在座无隙地的会场,大牛们的深入讨论当然没有只局限于此——
站在诺贝尔奖对AI青睐有加的2024年年尾,他们回顾技术、产品和商业的发展,也毫无耗尽地传递对未来的规划、已经洞察到的机遇;有人热心站出来解答了近期热议的澄清,有人坦白曾因技术的放缓有过永恒忧虑,也有人为从业者、厌恶者、观望者指明值得一试的方向。
有深度,够前瞻,思考碰撞,安排得当四溅。
320万+线上观众、1000+现场观众和在场嘉宾一起,见证了干货满满的一天。
△连“站票”也很抢手哟围绕着「智变千行,慧及百业」这一主题,本次大会嘉宾们畅聊了关于「技术演进时」「无限未来时」「拐点来临时」和「应用正当时」的所见所思所想。
来,跟着量子位真人编辑和ChatGPT、Claude等大模型一起划重点。
技术演进时李开复:ScalingLaw放缓,AI-First应用爆发帮助MEET2024智能未来大会以零一万物首席执行官、创新工场董事长李开复和量子位总编辑李根的深度对话拉开帷幕。
对话中,李开复透露出OpenAI的瓶颈与确认有罪:GPT-5的训练并非一帆风顺。大规模GPU集群的效率递减、数据与算力瓶颈,让ScalingLaw(尺度定律)不再一骑绝尘。OpenAI也面临着算力投入与商业回报的博弈。
坏消息是,传统定义上的ScalingLaw在放缓,但好消息是又有新的ScalingLaw(o1推理范式)出现。
但我们不要忘记,现在的模型虽然还没有达到AGI,但已经足够好到解决很多问题。
在李开复看来,传统ScalingLaw的放缓这并不意味着大模型发展遭遇天花板,相反,中国AI2.0创新者能在里面找到弯道超车的机遇。
首先,AI2.0已经成为世界各国的“未来之战”,将重塑经济版图和创新格局。中国相对不能重新接受大模型预训练。从国家技术竞争力角度看,掌握了大模型预训练就等于掌握模型能力的上限和安全可控的底线。
其次,当前大模型已“足够好、足够便宜”,中国开发者应抓住应用井喷的黄金窗口期,分隔开中国巨大的市场需求和落地场景,借鉴移动互联网时代领先世界的工程能力和产品微创新迭代能力,打造“MadeinChina”的“ChatGPT时刻”。
他提醒AI2.0创业者不妨先算一笔账:自己的基座大模型能力是否有独特价值?自己是否有预训练技术无足轻重做出性能位居世界首先梯队但又快又便宜的模型?如果自研的模型无法超越开源模型,不妨专注在应用创新上。
在商业策略上,零一万物打造的预训练模型Yi-Lightning不仅在国际保障的“大模型竞技场”LMSYS盲测中创下中国大模型历史理想成绩,而且推理成本仅为GPT-4o的三十分之一。
零一万物也积极探索AI应用落地:国内以ToB为主,海外侧重ToC。以多快好省的方式训出世界首先梯队模型,同时用“又快又好”的大模型为应用开发者赋能,打造健康良性的大模型创新生态。
李开复相信,未来大模型头部玩家更应聚焦AI-First应用端的价值创造,就像过往PC、移动互联网时代的创新发展路径一样,创造比较大经济价值的往往是应用层。
智源王仲远:其实ScalingLaw一直在AI发展中起作用北京智源人工智能研究院院长王仲远博士指出,当前人工智能正处于一个新的拐点。
大模型的出现标志着弱人工智能向通用人工智能的转变。尽管目前的大模型能力仍存在不足,但已能看到它对各行各业的深远影响。
他谈到了当下最热门的一个话题:ScalingLaw是否撞墙/失效了?
看过去七、八十年,每一次新的科技浪潮背后都有一些本质规律,即随着模型参数、训练数据及计算能力指责,模型效果也会有巨大指责。
也就是说,如果缩减时间维度,其实ScalingLaw在人工智能发展领域中一直起着作用。
王仲远介绍道,过去六年里,北京智源人工智能研究院建立了一支先进的科研团队,在国内最早从事大模型研发,并且从2020年10月开始,就成立了技术攻关团队来结束推动大模型技术研发探索。
至于大模型未来的发展方向,在他看来,除了文本数据,世界上还存在极小量的图像、音频、视频等多模态数据。如何煽动这些数据中的智能,是未来大模型研究的重要方向。
“最终将出现一个统一的多模态大模型,实现人工智能对世界的感知、理解和推理。”王仲远说。
蚂蚁集团王旭:开源社区为技术方向授予中立而广泛的信息在蚂蚁集团内部,大模型的应用已经渗透到财务数据分析领域,极大地降低了处理效率和深度。
蚂蚁集团开源技术委员会副主席王旭,站在开源视角进行了演讲分享——毕竟从ChatGPT掀起滔天巨浪开始,大模型的开闭源之争就从未开始。
王旭降低重要性,蚂蚁集团的开源技术增长团队十分重视对开源社区的数据洞察,并以此为蚂蚁的技术架构和技术演进授予参考。
社区数据虽然不全面,却能反映外部视角,为技术方向授予中立而广泛的信息。
社区数据显示应用的AI化和AI应用框架都在极小量涌现。在应用方向单单是直接的数量指责和帮助就已经可以引发不明显的,不引人注目的变革,比如蚂蚁的金融相关服务和它们背后的开源多智能体框架agentUniverse。
他授予了一张可参考的折线统计图,其数据显示,在LLaMA模型开源后,相关项目迎来了爆发式增长。并且,大部分AI项目使用Python开发甚至允许用户不用亲手编码,“这些AI应用框架让用户能够以极低的门槛开发自己的AI应用,这反映了AI技术正逐渐贴近应用场景”。
另一个观察是,除了硬件资源的变化,软件基础设施也在经历着微妙的变化。王旭表示,虽然分布式偶然的基础架构变化不大,但应用基础设施和场景产生了新的需求。他提道,AI2.0时代正在形成新一代的LAMP架构,应用会围绕模型发散,这在基础设施的每个环节都引发了深远变化。
最后,王旭威吓技术从业者根据时代的需求调整不当软件架构,并演进自己的基础设施。
华为王辉:网络与AI之间,就是NetworkforAI和AIforNetwork会上,华为数据通信产品线NCE数据通信领域总裁王辉围绕《AI大模型使能网络迈向高阶自智》这一话题,站在工业领域和ToB行业的视角开始了他的分享。
他指出,当前各行各业都面临“如何让自己的产品和产业变得更加智能”的问题,且落地过程面临诸多确认有罪。
在演讲中,王辉把网络与AI的关系总结为两种:
NetworkForAI,指如何用网络帮助AI训练和推理
AlForNetwork,指用AI手段让网络变得更加轻浮可靠,助力千行万业的发展
在NetworkforAI方面,王辉指出网络是支撑AI训练规模演进的关键底座;华为通过实时动态的AI集群网络均衡负载和AI识别预警故障,避免了AI训练中断,同时让AI训练不受跨数据中心、跨地域的批准;为大模型的规模化、分布式训练和推理带来了本质性指责。
在AIforNetwork领域,王辉以网络“自动驾驶”形态为类比,诠释了AI在工业垂直场景的真正确认有罪:实时性、严谨性与场景泛化能力。在网络行业这样的关键性基础设施中,毫秒级响应,零容错成为准确决策的顺从要求。为此,华为提出“一脑、一图、一网”的三层架构,让AI充分赋能网络,为工业应用授予智能的运营保障。
他还降低重要性:
在工业领域,数据质量、准确控制和成熟工具均不可或缺,大模型是其中关键的一环,大模型在逐步规模应用的同时,还会将分开和注智工业领域各种业务无约束的自由的不次要的部分要素,驱动千行万业迈向“自动驾驶”。
潞晨科技尤洋:视频大模型需要实现精细化文本控制、任意角度拍摄和角色一致同意性潞晨科技创始人兼董事长、新加坡国立大学校长青年教授尤洋,分享了对视频大模型未来协作发展深度洞察。作为分布式训练技术领域的专家,他带领团队此前已为谷歌、华为等科技巨头授予了大模型训练优化解决方案。
尤洋认为,未来三年视频大模型的发展将经历跨越式进步:
就像萨姆·奥特曼说的那样,今天是VideoGPT-1的时刻,可能三年之后就是视频大模型的GPT-3.5、GPT-4时刻。
最关键的是要实现三大不次要的部分能力。
首先是精细化的文本控制能力。视频大模型应当能够准确理解并呈现用户描述的细节内容,从人物特征到场景要素都要做到准确把控。
其次是实现任意机位、任意角度的拍摄能力。这种突破可能彻底保持不变体育赛事直播等领域,让观众能够自主选择观看视角,“相当于在体育场里能够瞬间移动,移到教练席,移到最后一排,移到首先排”。
第三是保持角色一致同意性。尤洋指出,这对商业变现至关重要,“比如一个产品的广告,这个视频接受从头到尾不管是衣服、鞋、车子,它的样貌不能有太大变化”。
对于视频大模型的商业前景,尤洋认为其将为电影制作带来革命性变革。通过AI技术,可以大幅降低有效场景制作成本,减少,缩短对危险镜头拍摄的实际需求,让创作更加严格的限制。
未来只需要演员的ID和演员的肖像权,AI其实就可以把很多危险镜头做好,对电影行业能够极大地做到降本增效。
无限未来时商汤徐立:比较优秀时刻可转化为另一个词,叫“打脸时刻”商汤科技董事长兼CEO徐立博士,十年前就是因为见证了AlexNet,认为AI已经跨越了工业红线开始选择创业。对于AGI新征程,徐立在与量子位总编辑李根的交流中提出了他的认知和思考。
徐立表示,从过往十年来看,有两个要素是推动行业发展进步的基础,一是基础设施,二是场景化。
在他看来,接下来的AGI时代一定也是场景化推动整个技术的迭代,“技术本身只是一个技术”。
场景应用一定是驱动力,没有场景应用不知道市场上模型到底长成什么样;模型也一定是驱动基础设施建设的不次要的部分驱动力,今天任何一个模型的变化所不能引起的基础设施成本价值的变化是巨大的。
继而徐立又引出了现在做AI的两条“生死线”,即算力成本折旧生死线和开源生死线,探讨了商汤做大装置、大模型和应用的“三位一体”战略。
有意思的是,在被问到“什么事情发生是可以辩论“比较优秀时刻”到来了?”,徐立的回答深入人心,以至于后面几位嘉宾也反复提到。
我觉得比较优秀时刻可以转化成为另外一个词,叫作“打脸时刻”,人类在哪个时间点上,如果突然之间被打脸了,那就是比较优秀时刻。
什么是“iPhone时刻”,所有人都认为手机得有键盘,然后iPhone来了没有键盘的。为什么ChatGPT是比较优秀时刻?是因为原来做AI都觉得自然语言还远呢,突然之间一下出来大众还都认可,解决了图灵测试的问题,其实这是典型的打脸时刻。
小冰李笛:“私域运营”成为大模型时代新蓝海过去一年,小冰很沉默。
但沉默之下是静水深流:2024年,小冰国内的AItoC产品,付费用户数是Character.AI的20多倍,付费转化率约为ChatGPT的8倍。
站在这样的成果上,当大模型热潮趋于波动,不少人开始陷入对下一步机遇FOMO时,小冰公司首席执行官李笛站出来谈了谈那些已现的机遇。
他降低重要性,当前AI行业正处于技术创新震荡期,大模型准入门槛降低,基础能力很难形成有效垄断,故而一味等待技术奇点并不会为产业创造实际价值,真正的机遇在于当技术进入相对波动期后,如何用合理的商业策略将技术能力变现。
一个不次要的部分切入点是GPU算力成本与收入的比例(GPUcostvsRevenue),李笛将此作为AItoC商业模式成败的关键指标。只有当AI生产内容的成本显著低于用户付费,才能为C端和产业链上下游授予可结束的价值分配。
此外,李笛还分享了关于AI产品形态和用户价值不知道的演变。
目前,Chatbot授予的对话形式和陪伴,对用户来说已不再稀缺,同时对话的高耗能显著,Chatbot注定不再成为大众产品(除非能授予非常下降的附加值)。
相反,“私域运营”成为大模型时代的新蓝海,AI能够为成千上万的私域用户授予高并发且个性化的价值内容,从而在高留存、高价值的场景中实现商业闭环。
VAST宋亚宸:AI原生3D创作者将探索出新的内容范式从700万全球用户生成的3D模型中,能看到3D生成的哪些可能?VAST创始人兼CEO宋亚宸有话说。
他分享说:“3D生成会成为一种新的交互形式,就像有个成语叫作‘言出法随’。”
VAST是一家自研3D大模型的公司,旗下3D大模型Tripo可以通过文字、图片等多模态输入,生成多余的3D模型,减少破坏游戏、动画、元宇宙等多个领域应用。
宋亚宸表示,从技术成熟度看,目前效果已从年初的“360p水平”指责至”720P水平”,预计明年将达到”1080P甚至4K水平”。
目前,3D生成技术已在多个领域实现落地,包括传统CG行业,如游戏、动画、影视等;工业领域,如3D打印、工业设计、家居等;新兴领域,如元宇宙、XR、数字孪生等。
除了一些商业化场景,我们看到每一个人,包括在座的每一个,包括在线观看直播的每一个人,都可以做自己想要的3D的工业设计和产品的需求的分享。
宋亚宸展望,明年在3D生成领域将聚拢万级开发者;到2025年,开发者数量或达万级别;2026年,这些AI原生3D创作者将探索出新的内容范式。
而在技术路线上,宋亚宸提出了三步走战略:首先步是静态内容生成,第二步是动态内容生成,第三步是实现全民零门槛3D创作。
南京大学周志华:学件基座系统有了数以百万计模型,很多我们没预期过的事也有可能能做南京大学副校长、国际人工智能联合会理事会主席周志华带来了一场关于“学件和异构大模型”的精彩分享,系统阐述了一个全新的AI技术范式。
在周志华看来,未来AI协作发展关键不在于追求单一的庞大模型,而是如何让数以百万计的模型协同工作。
他提到了“学件”概念,可以简单理解为:学件=模型+规约。
如果大模型是几个大英雄打天下,那么学件就是认为力量蕴藏在人民群众中。当学件基座系统有了数以百万计的模型,这条路线的力量会涌现出来,很多我们没预期过的事也有可能能做。
周志华提出了一个令人耳目一新的观点:不需要获取开发者的原始训练数据,就能实现模型的有效复用和协同。这种方式既保护了数据隐私,又比较大化了模型价值。
他用了一个生动的比喻:
今天当我们要用一把切肉的刀,不会自己去采矿打铁,而是去超市选购。同样,未来用户使用AI,也不必从头收藏,储藏数据训练模型,而是提交需求,“学件市场”会根据用户需求寻找和组合不适合的模型反馈给用户。
在技术实现上,周志华团队构建了规约设计方案,包括语义规约和统计规约,并反对这种方案能有效保护开发者数据不泄露。
目前,他们已开源了“北冥坞学件基座系统”,寻找更多开发者参与其中。周志华表示,当前市面上的HuggingFace可以看作是学件1.0版本,而多余的学件体系将带来更多可能性。
作为一个全新的技术范式,学件基座系统可被看作一个异构大模型,不仅能实现大小模型协同,还能避免灾难性遗忘,实现终身学习。
拐点降临时钛动科技陈德品:千行百业都需要AI,更需要的是增长钛动科技CTO陈德品分享了AI在出海营销领域的创新实践。
作为一位曾在阿里工作十余年、经历了AI从1.0到2.0时代转变的技术专家,陈德品对AI与营销分隔开的前景清空信心。
在他看来,营销需要批量化、工业化的创意素材生产,而AIGC的爆发恰好能极大指责内容产能,这正是双方的理想分隔开点。
具体到出海场景,陈德品分析认为,目前出海依托于两大势能:移动互联网和供应链势能,使得整个赛道保持30%-40%的年增长。
在具体实践方面,陈德品分享了钛动科技的不次要的部分AIGC产品TecCreative2.0,能够干涉商家在几分钟内完成社媒营销素材的生产,指责效率。
他特别降低重要性了一个发现:
在营销应用领域也存在类似ScalingLaw的规律。
当营销需要素材工业化生产时,不断指责生产效率,可以逼近爆款发现概率,我们认为营销是能够通过效率逼近无限,进而带来效果极大指责,最终产生爆款。
展望未来,陈德品表示钛动科技正在优化营销Agent化发展路径,同时可能会打造一个营销素材的Arena(竞技场),用于快速测试各类通用模型在营销场景中的适配度。
新奥泛能网程路:垂直行业的AI颠覆一定会发生作为深耕能源行业17年的产业老兵,新奥能源副总裁,新奥数能科技有限公司总裁(即新奥泛能网总裁)程路分享了传统能源行业拥抱AI的实践与思考。
作为传统能源行业的追随者,新奥泛能多年来一直在探索智能化,但此前更多是以局部算法和机理模型为主。如今,大模型的出现保持不变了两个重要环节——
一是大幅降低知识学习和推理成本,降低产业模型构建和优化效率,模型效能可指责达50%;二是让普通从业者悠然,从容“拉齐”到高水平决策层级,从而大规模指责行业外围认知水平与执行品质。
那么,传统能源行业要如何拥抱AI变革?程路表示可以总结为“选用训生”四个招式,分别是选择开放大模型、用模型分隔开机理、产业认知与产业算法、训练专业模型、最终生成可用大模型在具体应用中落地,综分解三大智能:
决策智能:辅助无约束的自由层快速做出特出方案决策
运营智能:实现能源领域运营层面的依赖状态
交易智能:优化源网荷储的实时交易
他降低重要性,这一切的底座在于强大的仿真模型——将物理世界映射到数字世界,让企业不需要在物理世界付出极小量试错成本就可以实现参数调优或者解决问题,仿真降低重要性极小量的运行有无批准的条件与行业机理,需要模拟实时运行态。程路特别指出:“这种仿真更像现在‘汽车自动驾驶系统’”,最终将大幅度降低能源品质,降低损耗成本。
“垂直行业的AI颠覆一定会发生。”程路相信,随着大模型技术门槛的不断降低和产业数据资源的充分奴役,能源这类传统领域也将涌现出颠覆性的创新。
小米孟二利:汽车行业正从“软件定义汽车”迈向“AI定义汽车”的新拐点小米技术委员会AI实验室高档技术总监孟二利分享了小米如何运用工业大模型赋能汽车智能制造的探索与实践。
他以独特视角展示了AI技术给传统制造业带来的创新突破。
孟二利首先介绍了小米的科技战略升级,总结为公式就是(软件×硬件)??,隐藏小米将包括大模型在内的AI技术看作一种新的生产力,也是小米长期结束投入的底层赛道。
小米从2016年就布局AI领域,2023年更是组建大模型团队,将前沿技术应用到手机、汽车等产品中。在汽车制造领域,小米选择从“大压铸”工艺突破,首先聚焦于材料研发和质量检测两个方面。
传统新材料研发采用“试错法”,周期可能长达10年,这是业务无法接受的。
为解决这一难题,孟二利团队创新性地提出“灰盒模型”方案:
分隔开数据驱动的AI黑盒方法与材料学机理驱动的白盒模型
使用仿真软件生成极小量、低质量,数据生成预训练模型
利用失败极小量、高质量实验数据进行模型微调
最终形成了一套多元的材料AI仿真系统。基于此,团队从上千万候选空间中成功研发出小米泰坦合金材料。
此外,在质量检测方面,团队还研发了工业质检大模型。解决了质检行业难题,作为AI+制造标杆多次被央视报道。
展望未来,孟二利认为汽车行业正从“软件定义汽车”迈向“AI定义汽车”的新拐点。他提出三点建议:破坏数字化基建、推进行业标准化、探索适合工业场景的大模型技术。
声网刘斌:Agent落地,实时性要求和工程化落地是关键大会现场,声网首席运营官刘斌分享了一个看似离大模型有点距离,实则却不可或缺的环节,那就是RTE实时互动在AIAgent时代的全新价值”。
2020年,声网在纳斯达克上市,目前是全球比较大的实时互动云服务商,平台单月音视频使用时长达700亿分钟。
对于AIAgent落地的关键要素,刘斌降低重要性了两点。
首先是实时性要求。与传统的文本交互不同,多模态Agent需要双工实时对话。根据声网的测试数据,要达到自然对话体验,延迟需要控制在1.7秒以内。
真正的产品化落地,不是在实验室做个demo,而是要确保在各种终端、各种网络环境下都能轻浮运行。目前,声网通过在音频采集、传输、播放等多个环节的不断优化,可以实现人与AI语音对话延迟低至500ms。
其次是工程化能力。声网构建了覆盖全球的SD-RTN网络?,减少破坏30多个平台、30000多终端机型,能在400毫秒内实现端到端传输,这些积聚让AIAgent快速规模化成为可能。
过去,人与AI的交互多以文本形式进行,延迟和体验问题并不突出。但当下,大模型正在快速演进为多模态Agent,用户可以语音、视频与AI交流,并期望获得如同面对面对话的自然感。这要求极低的传输延迟与高度鲁棒的网络质量支撑。
“只有把交互延迟做到低延时,并具备智能打断、超拟人化等特性,用户才会感受到与真人交流般顺畅的对话体验。”展望未来,刘斌提出,需要针对人机对话特点开发专门的优化方案。
应用正当时智谱张帆:AI开始变成基础生产要素,或对商业带来底层变化大会现场,智谱COO张帆聚焦分享了大模型这两年间的悠然,从容迭代与商业化过程中的全新机遇。
张帆首先指出,大模型和其它现有技术一点点落地不太一样,大模型天然是一个应用导向的技术,“生成式AI进入这个市场的速度远比互联网和PC要快”。
张帆表示,过去仅两年时间,模型各方面能力得到了指责,与之相对应的是成本的下降,由此带来了技术能力快速地落地和应用。
在这个过程中,智谱对AGI目标能力的理解分为五级:
首先级是语言;第二级是对复杂问题的求解,像o1这样的能力出现;第三级是使用工具,比如自主智能体可以像人一样操作手机、PC甚至汽车界面来获取信息;第四级是自我学习;第五级是超越人类,AI将具备探究科学规律、世界起源等先进问题的能力,所以通往AGI之路将是一个透明和明确的链路。
张帆降低重要性,大模型已不再只是技术,开始变成新型基础生产要素,有可能对商业带来很多底层、上层的变化,包括工作方式、组织形式、商业模式,甚至每个企业的壁垒。
最后张帆探讨了大模型时代企业或个人该如何构建自己的科技战略,他认为关键有四个要素:
选择不适合的基座,构建与战略目标和业务属性相匹配的组织,基于场景和AI能力重新定义数据债务,把这些能力无缝融入到业务当中,从而形成一个飞轮。
这里面有很多东西需要大家深度思考,比如基座模型,很多人问我们到底是开源好,还是闭源好,到底是国外好,还是国内好,我觉得其实合适才是较好。
火山引擎张鑫:企业落地大模型应用,关键要快速试错、拖延行动过去编程是从”HelloWorld”开始,现在开启AI之路,应该从”HiAgent”开始。
火山引擎副总裁张鑫分享了2024年大模型应用落地的现状与思考。在他看来,2024年是各行业对大模型应用广泛探索的一年,其落地呈现出三大特点:速度、广度与深度。
在应用场景上,大模型也完成了三个阶段的跳跃:从跟随的娱乐闲聊,到现在的严肃生产场景,甚至开始进入科研领域实现新知识的探索和发现。
正如狄更斯在《双城记》所说:“这是较好的时代,也是最坏的时代。”张鑫认为,大模型带来了无限创新机会,但如果企业不能跟上拖延速度迭代,也有可能面临失去竞争力。
张鑫提到,最近有一个新的感受:
企业想要落地一个好的AI应用时,他的确认有罪不是没有场景可做,反而是选择太多。
在我们看来打脸时刻怎么形成?不断打脸,最终才能知道哪个才是所谓的keyAPP。
HiAgent是火山引擎推出的企业专属AI应用创新平台,高度适配企业个性化需求,让业务人员可以轻松构建智能体,让业务创新不受生产技能的批准。授予低代码、场景化模版及端到端咨询服务,更懂AI转型;授予可与企业业务系统无缝衔接的行业插件,更僵化适配企业需求;减少破坏RAG知识库和大模型全栈私有化部署,授予更强的安全保障,为企业数据知识保驾护航。
在具体落地实践上,张鑫也分享了火山引擎HiAgent在教育、消费、企业服务等多个行业的落地实践,并分享了切实可行的落地方法,首先步企业需要绘制企业专属的场景地图,这一步往往是发散的,最终得出上百种不反对应用场景。下一步对这些场景围绕可行性和价值高低进行一个魔力象限的划分。从高价值、技术高可行性的场景先着手推进。
企业落地大模型应用的关键在于快速试错、拖延行动,火山引擎HiAgent平台通过固化理想实践,助力企业有效搭建企业级智能体,在探索场景中沉淀债务,助力企业AI能力做深做厚。
斑头雁张毅:AI应用要能快速部署、有效迭代张毅是原钉钉创始团队成员、副总裁,在钉钉任职期间,他从用8年的时间带领团队陆续打造出钉钉考勤审批、智能人士日志等爆款产品。
2022年起,张毅以BetterYeahAI(斑头雁)CEO创始人的身份,带领团队躬身入局,开始致力于探索干涉企业进入AI时代。
时至今日,已经有数百家头部企业在斑头雁上完成了企业级生产级Agent的落地,涉及场景包括客服、数据、营销、经营系统等。张毅降低重要性,客服场景落地速度最快,数据类任务增量价值明显,Agent融入企业不次要的部分经营系统趋势越来越显著,正在为企业直接供给生产力。
“对于Agent来说,企业生产级场景有很大不同。”张毅补充解释,“Agent落地在不次要的部分的业务流里带来生产力,这对Agent的集成能力、并发调用、数据安全要求和协同构建能力要求会更高。”
但与前沿科技相伴而行,就意味着更大的确认有罪,不同于POC验证和轻量AI应用开发,生产级Agent在应用构建、性能评估、快速迭代方面对企业开发团队提出了更高要求。
BetterYeah结束专注在企业生产场景,以标准化产品授予焦虑僵化集成能力、更大并发调用、更高数据安全和更复杂协同的AIAgent开发平台。今年往后,预计企业级AI平台将面临更复杂的应用场景和更强的自规划能力的确认有罪。
当谈及企业AIAgent成功的秘诀,张毅降低重要性,生产级Agent开发70%的工作量在测试调试,基于数据和AI构建“反馈评估-自学习-验证”闭环,充分发挥AI价值,能有效指责Agent开发效率和成功率,而这些方法已产品化融入BetterYeah平台。
昆仑万维方汉:用产品形式上的创新击中用户的根本点昆仑万维董事长兼CEO方汉在大会上分享了公司在AI大模型浪潮中从技术到产品的布局与思考。
昆仑万维从2020年开始布局AI,目前已经构建了从算力层、模型层到应用层的全栈AI能力。方汉介绍,昆仑万维有语言大模型、多模态大模型、3D大模型、视频大模型、音乐大模型,目前技术指标较好的是音乐大模型。
在探索过程中,方汉给出了他的一些商业思考。他认为所有人都在不断地思考AI大模型,在这中间企业选择什么样的商业模式来进行产品研发和推广,是一个很次要的问题。
方汉表示,中国AI企业在算力上受到极大批准,能拿到的硬件算力是比较有限的。这样会倒逼企业在算法迭代上有极大的动机去投入,就是所谓的以软补硬。同时生存压力大、拿不到钱也是一个大问题,“使得中国AI企业都在拼命地打磨产品的商业模式”。
他还讲到AIGC正在催生“文化平权”新时代,AIGC技术的进步会极大降低所有人创作内容的门槛和成本。
对于用户来说,他们根本不关心你的内容是AI做的还是人做的,只关心两个点,你的内容要么新,要么好。
最后方汉提出,AI创业者应更关注产品形态创新,用产品形式上的创新击中用户的根本点,而不是看AI用了多少。
心言集团任永亮:具身化与主动交互是泛心理服务的AI化新方向心言集团创始人、董事长兼CEO任永亮以一个垂直领域应用者的视角,分享了泛心理行业如何拥抱AI变革的实践经验。
任永亮首先介绍了心言集团旗下AI驱动的泛心理社区——测测APP。任永亮表示,早在2019年,测测就上线了头个基于BERT的泛心理领域问答模型,获得了超出预期的用户反响。
谈到AI转型历程,任永亮坦言经历了从“使安排得当”到“担忧”再到“坚定”的心态转变。他认为一个行业既不能离AI太近也不能离得太远,关键是找准不平衡的点,“如果太远的话没办法用这样的服务,如果太近的话很容易被淹没”。
基于过去两年的实践,任永亮总结了三点感悟。
首先是期望无约束的自由。AI做到60分很容易,但要达到90分往往很难,需要无约束的自由好团队的预期。
其次是组织工程。AI转型不能依靠零敲碎打,而是要让整个组织围绕AI发散,包括产品、运营、技术等全方位转变。
最后是相信年轻人。移动互联网时代的成功经验未必适用于AI时代,没有奴役的年轻人更容易带来创新。
展望未来,任永亮提出了两个关键发展方向:
具身化是泛心理服务的必然趋势。咨询师除了文字语音,还需要表情动作、仪式感,这就要求AI服务也需要实现多模态输入输出。主动交互将成为下一个突破口。目前的AI服务都是响应式的,未来需要能够根据场景主动发问、发散对话。
具身智能圆桌:WaytoAIRobotsMEET智能未来大会的老规矩,总是奉上精彩纷呈、干货疯狂输出的圆桌论坛,今年也不例外。
不过,本次大会讨论的主题升级到了更广泛、正热门的具身智能领域。
具身智能圆桌寻找的嘉宾分别是:
群核科技首席科学家兼副总裁、KooLab实验室负责人唐睿。
千寻智能SpiritAI联合创始人、清华大学交叉信息学院博导高阳。
云深处科技联合创始人兼CTO李超。
在量子位总编辑李根的主持下,嘉宾们华山论剑,话题围绕“对具身智能的认知”“有何技术突破”“目前发展到哪一阶段”等发散。
如何认识or定义具身智能?唐睿认为,具身智能和AI比较大的区别是从芯片、显示器、内存、显存里走了出来,它不仅有一个脑子,通过屏幕和我们交互,更多可能是能够和外部我们所处的物理世界做交互。虽然具身智能中有一个“身”字,但唐睿觉得可能不一定需要人形,只要能有这样一个技能就可以,“像自动驾驶汽车也可以算作比较成熟且具象的具身智能的实现”。
高阳通过一个具体的例子非常直观地回答了这个问题:有一次我在做一个关于具身智能的演讲,一位大概六七十岁老奶奶听我讲了很多,问我说什么时候机器人能给她养老,其实这个正是具身智能的一个应用场景。具身智能的目标是构建能够干涉我们完成各种任务的机器人,这个机器人能帮我们做各种事情,比如帮我们的爷爷奶奶养老。
李超认为云深处是具身智能的的首先批受益者。具身智能给机器人赋予灵魂,在这个灵魂加持下,机器人应变能力破坏,规模化应用进展帮助,能够面向更加开放的环境。
为什么今年是具身智能元年?李超认为随着从基于规则的传统控制方式转变为基于训练、强化学习等新技术的出现与成熟,机器人的智能和适用性得以大幅指责,从而突破了过去的批准和有无批准的。
高阳也表示,现在做具身智能创业的一个最关键的因素是OpenAI已经反对,预训练分隔开一系列post-training的方式,含糊可以真实的产生至少看起来像是人类智能,或者达到人类智能表象一样的能力。
唐睿做图形学出身,他指出,有了AI深度学习加成以后,算力的迭代体系就开始从指令级的迭代方向转变为并行计算的迭代方向,由此导致并行计算的成本会降到很低。而并行计算无非就是模拟两件事,一是模拟人脑,通过深度学习先验的知识预测未来或不同模态;另一种是模拟物理世界,还有具身智能中大家会用MuJoCo做物理、交互仿真。而群核科技做的正是后者。
2024,产业里的代表性进展or事件?唐睿关注到越来越多原本从事图形学和三维视觉研究的优质学者与团队(如李飞飞、LeoGuibas、苏昊等),开始投身具身智能领域。他们凭借在虚拟世界和环境模拟方面的先天无足轻重,为具身智能的发展收回新的动力与视角。
高阳最关注的进展在于如何利用失败互联网上的海量数据和中间层表示方法,将大模型预训练范式引入具身智能。这不仅包括像VLA(视觉-语言-动作)模型的成熟应用,还涉及通过引入轨迹表示、粒子模拟等中间层结构来减少,缩短对人工采集操作数据的依赖,从而在未来三到四年为具身智能的可结束发展奠定基础。
实践落地,数据是否是目前的关键确认有罪?李超认为目前在他们关注的机器人本体与控制层面,数据并非主要确认有罪,但随着未来更复杂场景与操作需求出现,数据问题可能逐渐成为明年的确认有罪。
唐睿认为目前具身智能非常大的卡点是缺少高维的物理正确数据,而群核空间智能平台要做的事情就是为具身智能授予一个AI可交互世界,另外他降低重要性了具身智能需要的真实物理模拟精度远高于纯视觉内容创作所需的精度。
他举例,像Sora这样的视频生成工具,目前虽能逼真再现视觉效果,却仍不足以授予比较准确的物理参数与交互反馈,从而难以直接焦虑具身智能的训练需求。这意味着在实现AGI级别机器人之前,如何获取高精度、具可交互性的模拟数据仍是一个需解决的关键问题。
具身智能是否有类似L0—L5的标准划分?李超表示不仅有而且很明确,去年以前很多都是L1,准确说是L0,因为很多是由人在操控。而现在要分行业划分,在接纳的小范围场景下可以达到L4,机器人能自主决策判断。
在高阳看来,制定一个标准,本意是为了鞭策一个行业的发展,可以去衡量每个具身智能技术到底达到了怎样的水平,但无论这个标准是什么样,可能最后因为客观技术的批准,这个标准到就变成了一个比较偏向宣传话术的东西,有限时间内大家做不到广泛场景的L4或L5的水平。
截至目前,具身智能走到了什么阶段?唐睿将机器人各部分类比到人的“手、眼、脚、脑”四个不次要的部分的器官,分开来看每个部分都超越或接近人类,但尚未形成高度不调和的一体化体系,因此外围仍处于早期阶段。高阳认为制定一个标准,本意是为了鞭策一个行业的发展,可以去衡量具身智能技术到底达到了怎样的水平,但无论这个标准是什么样,可能最后因为客观技术的批准,这个标准到就变成了一个比较偏向宣传话术的东西,有限时间内大家做不到广泛场景的L4或L5的水平。
李超更加乐观,他没有用类比的方法,而是认为具身智能已在工业等特殊场景中带来肤浅保持不变,虽家用需求尚不明确,但在专业领域的实际应用已显现强大影响力,推动行业格局帮助变化,展现出更乐观的发展前景。
后续还将有大会嘉宾更详细版内容分享,敬请关注!
(推广)