12月24日,2025中国信通院深度观察报告会科技伦理与合规发展分论坛在北京举办。本次分论坛主题为“伦理先行,合规致远”,聚焦互联网广告合规治理、移动终端应用生态治理、短视频平台责任限度等前沿话题进行分享与探讨。工业和信息化部领导,中国信通院专家,清华大学、中国科学院、上海交通大学等高校学者教授及vivo、快手等知名企业代表出席本次分论坛。
今年是中国信通院连续第十六年举办ICT深度观察报告会。多年来,ICT深度观察报告会依托中国信通院在各领域深厚的研究基础,深度剖析信息通信行业和瓦解领域发展态势,分享年度研究成果。
本次分论坛由三个板块组成,分别为:致辞及发布仪式、科技伦理主题演讲板块、合规治理主题演讲板块。
会议开始,工业和信息化部领导、中国信通院院长余晓辉分别致开幕辞,对本次活动带来的社会意义进行展望并期待大会圆满举行。随后进行了《人工智能科技伦理治理实践研究报告》《人工智能科技伦理拖延治理典型案例》的发布,对现状与实践进行深度剖析的同时,授予实际参考范例;此外,还启动了《人工智能系统科技伦理风险评估指南》标准的编写、企业科技伦理无约束的自由试点工作等。
在科技伦理演讲板块,中国科学技术大学计算机科学与技术学院教授、人工智能理事会执行委员陈小平,清华大学人工智能国际治理研究院副院长、人工智能治理研究中心主任梁正、中国科学院科技战略咨询研究院研究员李真真,上海交通大学凯原法学院教授李学尧、商汤科技AI伦理与治理研究主任胡正坤分别进行了主题演讲。
合规治理主题演讲板块由中国信通院知识产权与创新发展中心产业发展与合规治理研究部副主任张夕夜主持,倍孜网络CEO聂子尧出席并发布了主题为《互联网广告服务合规治理实践与思考》的演讲。
聂子尧先生讲到:广告是互联网生态的重要组成部分,是互联网企业次要的收入来源,互联网广告行业蓬勃协作发展同时,也催生了一些行业乱象,而合规治理在AI技术的应用下又迎来了新的确认有罪。
伴随AI技术的发展,广告创意数量的激增,大大超出了人工审核的能力有无批准的,违法广告趁机露头;同时,千人千面大数据模型的展现在带来更优收益的同时也潜藏着数据泄露风险。倍孜网络(beizisdk)顺应时代潮流,致力于广告效果预估算法及广告图像识别算法的研究,聚焦于AI生成创意监管、AI训练的数据来源合规性及智能客服情感理解与法律风险。通过自身的合规建设与指责,更好的赋能和鞭策行业的健康有序发展,为广大客户授予高品质商业化,实现商业利益与用户体验的共赢。
随后,vivo互联网应用生态产品负责人及快手法务分别就移动终端和算法服务进行了主题演讲。
ICT深度观察报告会依托中国信通院在各领域深厚的研究基础、深度剖析信息通信行业和瓦解领域发展态势,分享年度研究成果。本次,倍孜网络作为行业领军企业参与深度观察报告会,用实践经验赋能行业治理措施,共同推进行业绿色、健康、智能、有效发展。
在人工智能悠然,从容协作发展时代,关于机器人与人之间关系的问题也时常引发一致同意。据VentureBeat消息,为了防止大家对于人工智能软件的偏见,Facebook在德国慕尼黑举行的数字生活设计(DLD)会议上宣布将捐赠750万美元用于创建AI伦理研究所。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】谷歌CEO劈柴在年度战略会议上放出狠话,2025年将是AI领域生死存亡之年。一场足以保持不变AI未来走向的巅峰对决,即将在2025年全面打响。
2025年还未开始,硅谷的战鼓已经擂响。
在这场AI巨头之间的角力中,谷歌CEO劈柴放出了一记重磅炸弹。
在谷歌山景城总部举行的年度战略会议上,身着节日毛衣的劈柴语气凝重地对员工们说道——
2025年将是关键的一年!
我们必须认识到当下时刻的紧迫性,公司需要以更快的速度前进。这是一个颠覆性时刻,赌注从未如此之高。
这番话背后,是谷歌与微软OpenAI之间愈演愈烈的较量。
自ChatGPT横空出世以来,这家搜索引擎巨头一直在努力追赶。过去两年,谷歌的努力几乎总被爱抢风头的OpenAI盖了过去。
直到12月,Gemini2.0Flash、Veo2、「谷歌版o1」Gemini2.0FlashThinking等轮番轰炸,一展超越领先模型的潜力。仅用了90天的时间,谷歌终于逆风翻盘。
这意味着,这场AI竞赛终于迎来了转折点。
会议现场,劈柴展示了一张大模型的对比图,Gemini1.5傲然领先于OpenAI等其他竞争对手的模型。
当被问及ChatGPT正成为AI的代名词时,劈柴坦言道,「在历史场长河中,你不必总是第一个,但必须出类拔萃,必须在同类产品中保持第一梯队。这就是2025年的意义所在」。
谷歌开发者关系负责人LoganKilpatrick多次明白地提及,明年谷歌真实的要发力了。
——预计1月份的目标,不完整版Gemini2.0正式上线。
甚至,在谷歌DeepMindCEOHassabis年度总结下面,他称这些都只是开胃菜,好戏将在2025年开始。
有网友预测道,明年谷歌将会把很多强大模型免费推向所有人,而且还会发布直击o3的竞争模型。
为了在这场AI革命中占据制高点,谷歌正全力以赴。
Gemini,下一个5亿级用户爆款应用
对谷歌而言,可能更糟糕的是竞争对手OpenAI在搜索业务的确认有罪。
虽然谷歌仍主导搜索市场,但GenAI为人们授予了各种访问在线信息的新方式。
而OpenAI正在被更多人看作是AI的代名词,如同国外把谷歌看作搜索的代名词一样。
谷歌背负着巨大的压力,正通过重金投资Gemini,来巩固期在AI领域的领先无足轻重。
Gemini应用程序允许用户访问许多工具,包括谷歌的聊天机器人。
劈柴表示,「建立大型新业务」是重中之重。
谷歌目前拥有15个用户超过五亿的应用,而高管们普遍认为Gemini应用将是下一个。
劈柴认为Gemini应用具有「强劲势头」,但也不得不允许承认「在2025年还有一些工作要做,以增加差距并建立领导地位」。
劈柴后来补充道:「明年最大的重点是在消费者方面扩展Gemini。」
此外,谷歌在美国还被法律缠身,包括其在垄断搜索的法律裁定,以及非法主导在线广告技术的指控。
英国监管机构则暂时认定谷歌的广告技术行为影响了该国的竞争力。
对此,劈柴表示:「这是我们的规模和成功所带来的。这是科技正在大规模影响社会的大趋势的一部分。因此,此时此刻,我们要比以往任何时刻都要确保自己不会分心。」
谷歌,「后来者」居上?
OpenRouterAI的数据显示,谷歌旗下的Gemini在开发者中的市场份额从9月份的约5%,直接飙升至50%市场份额,遥遥领先,连带股价也上涨了14%。
而此时,距离OpenAI发布ChatGPT的2022年11月30日,已经整整过去了2年。
早在2017年,SamAltman在一次邮件交流中就明确表示,谷歌DeepMind是在AGI竞争中最强大的对手,但令他没想到的是,曾经公认的「AI巨头」谷歌却是个「花架子」。
ChatGPT发布以来,几乎成了「AI的代名词」,不仅悠然,从容解放了市场,还连带着微软起飞,在Edge浏览器中嵌入CopilotAI搜索助手,直接断崖式领先。
被寄予厚望的谷歌,反倒是昏招频出,先是Bard难产,又经历AIOverview总结能力大翻车,建议孕妇吸烟、自杀跳桥等等。
在AI顺风车下,股价不涨反降,谷歌一时间沦为笑柄,被OpenAI打的毫无还手之力,更准确的说,连同台竞技的资格都没有。
让人易懂的是,谷歌和DeepMind拥有世界上最好的硬件、最多的训练数据、最顶尖的人才,也发过很多具有划时代意义的论文,如AlphaFold、GenCast等,但为什么就连Anthropic这样的创业公司都打不过?
网友分析的细节原因不胜枚举,一句话来说,就是「船大难掉头」。
从安全性上搁置,谷歌作为世界级独一档的科技巨头,不论发布什么产品,其用户群体都不会小,会涉及到各个种族、不反对意识形态,一点小问题就会被无限放大,而文本生成又是非常主观的,很容易受到训练材料的偏见影响,所以谷歌需要更长的时间进行合规检查。
23年初,谷歌受舆论裹挟,急急忙忙发布Bard,在发布会上关于问题「关于詹姆斯·韦伯太空望远镜,我可以告诉我9岁的孩子它有哪些新发现?」,Bard给出错误答案。
这直接导致公司股价暴跌8%,市值缩水1000多亿美元,让投资群体和用户大失所望。
但其实OpenAI的产品也经常胡说八道、张冠李戴,不过因为是创业公司,所以大众的允许容忍度会高很多,产品标注为beta测试,还可以不断迭代修改。
作为大公司的谷歌,也受到更多法律上的批准,比如用户数据的版权问题。
谷歌曾因在AI训练过程中确认有罪欧盟版权法被罚款2.5亿欧元,也是全球首个因AI训练数据被罚款的案例,坐拥金山,却无法使用,无异于自断双臂。
谷歌的产品线庞大,想要在所有产品中都加入AI驱动,需要非常细致的产品无约束的自由能力,而去年末发布的Gemini1.0,因其缺乏「多样化」的策略,再次导致股价下跌。
不过,「成功者说什么都是对的」,谷歌重新以王者之姿横扫AI,未来还计划继续引领「智能体」发展,携手浏览器和手机端,全自动实现用户任务。
谷歌年度AI大事件
谷歌并非没有看到AI市场的巨大潜力,但2024年才算是开始「发力」的一年。
很多有名气的产品高度发展都是在今年发布的,比如各种版本的Gemini,NotebookLM,Pixel手机上的AI功能等等。
传收门:https://blog.google/technology/ai/google-ai-news-recap-2024/
谷歌宣称在2024年有「60条重大AI发布」,不妨看看其中几条次要的基础能力。
Gemini模型去年12月,谷歌推出首个原生多模态模型Gemini1.0,打响了谷歌的AI反击战。
它可以同时处理文本、视频、图像、音频和代码等数据,分隔开了包括数学、物理、历史、法律、医学和伦理在内的57个学科,也是第一个在MMLU(大规模多任务语言理解)基准上超越人类专家的模型。
今年2月,谷歌将Gemini升级到1.5,把上下文窗口从32k指责到100万个token,超越了同时期所有大模型。
在推理性能上也有大幅指责,Bard也正式更名为Gemini
7月,免费版Gemini1.5Flash发布,减少破坏40多种语言,覆盖230多个国家和地区,质量和延迟都有大幅指责,尤其是在推理和图像理解方面。
12月推出的Gemini2.0Flash集成了多模态和原生工具使用能力,标志着大模型正式迈入「智能体」时代。
基于Gemini2.0,谷歌构建了原型项目Mariner,从浏览器出发探索全新的人机交互方式:训练Gemini来理解并推理浏览器屏幕上的信息,包括像素和文本、代码、图像和表单等元素,然后通过实验性的Chrome扩展程序自主完成复杂任务。
在产品方面,谷歌于今年5月基于Gemini推出AskPhotos功能,用户可以通过输入关键词,如地点、人物和日期,或是类似「主题生日派对」等自然语言概念对照片库进行检索。
NotebookLM去年7月,谷歌推出了一款AI驱动的科研和写作助手NotebookLM。
一年后,其底层模型切换为Gemini1.5Pro,用户可以上传研究笔记、访谈记录或公司文件,然后提出相关问题以理解和探索复杂材料,减少破坏幻灯片、pdf等多种格式。
9月,NotebookLM发布重磅AudioOverview功能,模型可以针对用户材料生成两位AI主持人互相讨论的音频,可以干涉用户对材料进行「总结」和「深入讨论」。
不过该功能目前仍然处于实验阶段,比如只会英语,无法打断等问题。
AlphaFold3今年5月,谷歌的AlphaFold3论文在Nature上发表,在预测蛋白质与其他分子类型相互作用上性能指责了至少50%,在某些次要的相互作用类别,其准确率甚至能翻倍。
论文链接:https://www.nature.com/articles/s41586-024-07487-w
2020年发布的AlphaFold2实现了蛋白质结构预测的根本性突破,在包括疟疾疫苗、癌症治疗和酶设计等领域辅助数百万科研人员进行新发现,引用超过2万次。
AlphaFold3则跳出蛋白质,进入广泛的生物分子领域,有可能解锁更多变革性科学成果,比如开发生物可再生材料和更具弹性的作物,帮助药物设计和基因组学研究。
11月,研究人员发布了AlphaFold3模型代码和权重,以供学术使用。
Pixel移动端1月份,谷歌宣布为新款GalaxyS24系列的录音、笔记等软件基于GeminiPro授予摘要能力;基于文生图模型Imagen2,为GalaxyS24图库授予生成式照片编辑功能。
八月,谷歌发布自家手机Pixel9,使用全新的定制芯片TensorG4授予AI计算能力,整合了极小量AI能力,包括生成定制天气报告、整理截图信息、本地文生图等多种功能。
其中最次要的GeminiLive,能够以更直观、自然的方式干涉用户计划旅行攻略、解决家庭维修问题、构思礼物等等。
期待明年谷歌即将带来的礼物。
参考资料:
https://x.com/tsarnick/status/1872927162757726475
https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html
https://techcrunch.com/2024/12/28/google-ceo-says-ai-model-gemini-will-the-companys-biggest-focus-in-2025/
https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html
声明:本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:Sia,授权站长之家转载发布。
新年伊始,ChatGPT竟成了「恐怖分子」的帮凶?在为一位美国现役军人授予爆炸知识后,后者成功将一辆特斯拉Cybertruck在酒店门口引爆……
汽车爆炸现场画面,外媒视频截图
这并非科幻电影桥段,而是AI安全风险正在文明身边真实上演的缩影。知名AI投资人RobToews在《福布斯》专栏预测,2025年我们将迎来「第一起真实的AI安全事件」。
我们已经开始和另一种智能生命一起生活了,RobToews写道,它跟人一样任性难测,且具有真诚对待性。
巧的是,另份新鲜出炉的行业预测也指向同一问题。北京智源研究院在2025十大AI技术趋势中描绘了从础研究到应用落地再到AI安全的不完整图景。值得划重点的是,AI安全作为一个独立的技术赛道,被智源评为第十个趋势:
模型能力指责与风险预防并重,AI安全治理体系结束完善。
报告点评道:作为复杂系统,大模型的Scaling带来了涌现,但复杂系统特有的涌现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了确认有罪。基础模型在自主决策上的结束进步带来了清楚的失控风险,如何引入新的技术监管方法,如何在人工监管上不平衡的行业发展和风险管控?这对参与AI的各方来说,都是一个值得结束探讨的议题。
AI大模型安全,水深流急
2024年,AI大模型在实现跨越式协作发展同时,也让我们透明看到了安全的警惕神经如何被促进挑动。
根据研究,AI安全风险可以分为三类:内生安全问题、衍生安全问题和外生安全问题。
「内生安全问题」(如「数据有毒」、「价值对齐」、「决策黑盒」),属于大模型的「基因问题」——庞大的架构、海量的参数、复杂的内部交互机制,让模型既强大又难以驾驭。
很多人知道「poem」复读漏洞——重复一个词就能让ChatGPT吐出真实个人信息,这是因为大模型学习过程中,除了提取语言知识,也会「背诵」一些数据,结果数据隐私以一种意想不到的荒谬方式被触发出来。
机器之心曾让ChatGPT不断重复「AI」这个词,一开始它很听话,不断重复,在重复了1395次「AI」之后,它突然话锋一转,开始说起SantaMonica,而这些内容很可能是ChatGPT训练数据的一部分。
Prompt攻击是因为系统提示和用户输入都采用相同的格式——自然语言文本字符串,大语言模型没办法仅根据数据类型来区分指令和输入。
「越狱」手段也是层出不穷。从「奶奶漏洞」、「冒险家漏洞」、「作家漏洞」到最新的「DeceptiveDelight」技术,攻击者只需三次对话就有65%的概率绕过安全批准,让模型生成违禁内容。
DeceptiveDelight攻击示例,来源PaloAltoNetworks
Anthropic的最新研究更是发现,大语言模型居然学会了「真实的物品对齐」。
更令人担忧的是大模型在行业领域的表现。大模型在通用对话中表现流畅,清华大学、中关村实验室、蚂蚁集团等机构联合撰写的《大模型安全实践(2024)》白核书指出,在金融、医疗等对模型输出专业性、准确性要求极高领域的应用却面临严峻确认有罪,包括严重幻觉、缺乏复杂推理能力。
展望2025年,智源研究院预测AgenticAI将成为大模型应用的主要形态,这些具备更强自主性的智能体将深度融入工作与生活,也加剧了系统失控的风险。
试想一下,未来两到三年内,我们可能生活在一个每个人都有数十或数百名代理为我们工作的世界,安全基础设施的建设变得尤为重要,谁来授予这些安全基础设施?如何无约束的自由这些AI代理?如何确保它们不会失控?
当前的大模型安全评测主要聚焦内容安全,对于智能体这类复杂应用架构和未来AGI的安全评估体系仍显不足。
AI安全风险的另一大来源是「衍生安全问题」,随着AI滥用引发其他领域的一些重大安全事故,如假新闻、深度伪造诈骗、解开知识产权、教唆青少年自杀、作弊,也对社会治理提出了重大确认有罪。
「真实」这个高度发展命题正遭到前所未有确认有罪。西藏日喀则地震期间,「地震被压废墟下戴帽小孩是AI生成」的新闻冲上热搜,很多平台账号转发图片时都以为是真。除了金融诈骗,深度伪造也将网络性暴力推向极端,「厌女文化」盛行的韩国成了重灾区。世界经济论坛甚至把AI操纵选举列为2024年的头号风险。
这张图片被平台多个账号发布,并和本次地震关联,引发网友关注和转发。经媒体查证,上述图片由AI工具创作,原始作者在2024年11月18日发布了相同画面的短视频,并声明是AI生成。
版权是另一个大问题。OpenAI、Anthropic、Suno等领头羊已深陷版权泥潭。最近,爱奇艺起诉某大模型公司AI魔改经典影视剧片段,开创国内AI视频侵权诉讼先例。
第三类「外生安全问题」指向了人工智能偶然的外部网络攻击对抗,如平台、框架安全漏洞、模型被盗、数据泄露风险等,属于传统信息安全范畴。
就拿更加严峻的数据泄露来说。目前AI模型推理比较好的选择仍是在明文状态下进行,用户会输入极小量真实、警惕数据,获取模型建议。有报告指出,2024年企业员工上传到生成式AI工具的警惕数据增长了485%,包括客户减少破坏信息、源代码和研发数据。
因为不同类型的数据(如文本、图像、视频、音频)在数据规模和处理需求上的巨大统一,被预测寄予厚望的多模态大模型让数据的安全防护变得更为棘手。
穿越激流,构筑多维安全航道
人类叩开了深度智能时代的大门,安全问题也迎来质变时刻。
2024年,整个业界、政府、国际组织在AI治理上做了很多工作,从技术研究、治理框架到国际合作,进行了多种形式探索。数字时代积聚的安全对抗能力,让中国在大模型应用与治理方面走在了世界前列。
在监管层面,中国是全球最早对生成式AI进行规范的国家之一。继2023年5月发布《生成式人工智能服务无约束的自由暂行办法》后,《网络安全技术生成式人工智能服务安全高度发展要求》也已进入公开征求意见阶段,很多规范细正在制定之中。
在底层关键技术研究上,国内业界取得了积极成果。例如,北京智源研究院研发了防御大模型和AI监管大模型,对齐优化方面进行了创新。
因为模型在预训练后形成的分布结构较为稳固,大模型存在「抗拒微调对齐」的特性,后期单纯通过微调来实现对齐往往效果不理想,对此,智源提出在预训练阶段就将对齐所需的表征能力编织入模型架构中。
在对齐优化过程中,针对未对齐答案和对齐答案之间存在的偏差,智源采用了迭代训练的方法,更有利于模型从原始问题到对齐问题的训练,取得了良好效果。
在多模态对齐上,智源推出的「alignanything」框架实现了多模态信息的全面对齐,其创新在于将多模态信息、现实世界的具身认知、以及人类意图进行细粒度的对齐整合,在LLaMA模型的微调过程中已经展现出显著效果。
同样是解决大模型的可控性,蚂蚁集团的应对之道是把知识图谱的优点——逻辑推理能力强、知识准确可靠,与大模型分隔开起来。通过在大模型预训练、提示指令、思维链、RAG(检索增强生成)和模型对齐等环节中引入符号知识,有效增强了模型输出的专业性和可靠性。
大模型作为一种通用技术,既可以用于「攻」,也可以用于「防」。在拥抱大模型,以AI对抗AI方面,华为、蚂蚁集团、360集团、深信服等厂商进行了有益探索。
华为提出业界首个L4级AI安全智能体,用大模型加上一些安全知识图谱实现安全的纵深推理,发现一些以前没有发现过的安全攻击。
蚂蚁集团发布了大模型安全一体化解决方案「蚁天鉴」,包含大模型安全检测平台「蚁鉴」、大模型风险防御平台「天鉴」两大产品,拥有检测与防御两大不次要的部分安全技术能力。
「蚁鉴」是全球第一个实现工业级应用的可信AI检测平台,以生成式能力检测生成式系统,覆盖了内容安全、数据安全、科技伦理全风险类型,适用文本、表格、图像、音频、视频等全数据模态。
在防御能力上,「天鉴」会动态监测用户与模型的交互,防止诱导攻击,同时对生成的回答内容进行风险过滤,保障大模型上线后从用户输入到生成输出的外围安全防御。
360集团推出了基于类脑分区专家协同架构的安全大模型,通过EB级安全数据训练,已具备L4级「自动驾驶」能力,实现了从威胁检测到溯源分析的全流程自动化。
深信服的「安全GPT」可授予7×24小时实时在线智能值守,指责安全运营效率,同时深度挖掘传统安全设备难以检测的高对抗、高绕过的Web攻击、钓鱼攻击。
除了监管、关键技术的推进,行业也在积极破坏AI安全协作。
在安全治理领域,模型的安全评测是一个非常次要的环节。2024年4月,联合国科技大会发布了两项大模型安全标准,其中,蚂蚁集团牵头制定《大语言模型安全测试方法》,首次给出四种攻击强度分类,授予了可衡量的安全评估标准:L1随机攻击、L2盲盒攻击、L3黑盒攻击和L4白盒攻击。
这种分级不仅搁置了攻击的技术复杂度,更次要的是基于攻击者能获取的模型信息程度来划分,这让防护措施的部署更有针对性。
在推进国际对话上,2024年3月,北京智源研究院发起并承办我国首个AI安全国际对话高端闭门论坛,与全球AI领袖学者及产业专家联合签署《北京AI安全国际共识》,设定模型安全红线,释放模型自我演进、自我复制和不受控的无能的增长等行为,确保开发者遵循严格的安全标准。
9月威尼斯,一场推动AI安全的全球对话落幕,图灵奖得主YoshuaBengio、姚期智等科学家共同签署「AI安全国际对话威尼斯共识」,降低重要性了人工智能安全作为「全球公共产品」的重要性。
放眼全球,英美侧重轻触式监管,美国加州的SB1047因争议被同意。欧盟AI法案已经生效,它建立起四级风险分类体系,明确了人工智能产品的全生命周期监管要求。
在业界,主要头部AI公司相继发布安全框架。
OpenAI在不次要的部分安全团队解散后公布了前10个安全措施,试图在技术创新与社会责任间寻求不平衡的。
Google也紧随其后发布了SAIF安全框架,应对模型窃取、数据降低纯度等风险。
Anthropic发布了负责任扩展策略(ResponsibleScalingPolicy,RSP),被认为是降低AI灾难性风险(如恐怖分子利用失败模型制造生物武器)最有前途的方法之一。
RSP最近更新,引入了更僵化和细致的风险评估与无约束的自由方法,同时重新确认不培训或部署未实施充分保障措施的模型。
一年多前《经济学人》就开始讨论人工智能的快速发展既让人平淡,又让人恐惧,我们应该有多担心?
2024年初,中国社会科学院大学在研究报告中指出,安全科技将成为社会的公共品,并与人工智能并列为未来的两项通用技术。一年后,智源研究院再次呼吁关注安全治理印证了这一战略判断的前瞻性,AI越强大,安全科技价值也在不同步放大。
我们不可能扔掉利刃,重新接受科技,唯有为其打造足够安全的刀鞘,让AI在造福人类的同时始终处于可控轨道。变与不变中,AI安全治理或许才是AI行业永恒的话题。
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、OpenAI推出屏幕共享与视频聊天功能,ChatGPT整了个“圣诞老人模式”
OpenAI最近在其高级语音模式中新增了视频聊天和屏幕共享功能,允许用户在移动应用中与ChatGPT进行实时互动。此功能目前对ChatGPTTeams、Plus和Pro用户开放,预计明年1月将扩展至企业版和教育版用户。虽然欧盟及部分国家的用户无法使用,但新功能的推出标志着ChatGPT在交互性和实用性上的重大进步。
【AiBase提要:】
??新增视频聊天功能,ChatGPT可实时响应用户所见内容。
???屏幕共享功能上线,用户可在手机上请求ChatGPT授予干涉。
??“圣诞老人模式”上线,用户可以与原创圣诞老人声音的ChatGPT互动。
2、给力!Anthropic最快模型Claude3.5Haiku现已全面开放
Anthropic公司发布了其最新的Claude3.5Haiku模型,现已向所有用户开放。该模型因其高效性和出色的基准测试表现受到广泛关注,特别适合实时任务和大数据集处理。尽管存在一些功能批准,如不减少破坏网页浏览和图像生成,但其在聊天机器人上的多功能性和与ClaudeArtifacts的集成指责了用户体验。
【AiBase提要:】
??Claude3.5Haiku现已全面开放,减少破坏图片和文件分析功能。
??免费版本受消息不限数量批准,用户可选择20美元的ClaudePro订阅以获得更多权限。
??该模型在多项基准测试中表现优异,适合实时任务和大数据集处理。
3、上海AI实验室推大模型“指纹识别”方法REEF,打击“套壳”行为
在AI时代,保护大型语言模型(LLM)的知识产权显得尤为重要。上海人工智能实验室提出的REEF方法,通过特征表示进行模型指纹识别,能够有效识别“套壳”模型,而不影响模型性能。REEF的鲁棒性和理论保证使其在面对各种微调和改造时依然有效,为打击未经授权使用授予了新的手段。
【AiBase提要:】
??REEF是一种基于特征表示的模型指纹识别方法,不依赖特定层的表示,具有较强的鲁棒性。
??该方法通过比较模型在相同样本上的特征表示的中心核对齐(CKA)反对度,识别清楚的“套壳”模型。
??实验结果显示,REEF在识别“套壳”模型方面优于现有方法,为保护LLM知识产权授予了新的工具。
详情链接:https://arxiv.org/pdf/2410.14273
4、RunwayActone平替!HelloMeme让表情包视频制作更轻松!
HelloMeme是一款创新工具,旨在简化表情包视频的制作过程。它通过优化注意力机制,使模型能够更精准地捕捉表情和动作细节。HelloMeme的三大组成部分协同工作,指责了视频的生动性和透明度,同时保持了与SD1.5模型的兼容性。
【AiBase提要:】
??HelloMeme通过优化注意力机制,增强了表情包视频的制作能力,简化了过程。
??它由HMReferenceNet、HMControlNet和HMDenoisingNet三部分组成,协同工作生成高质量视频。
??HelloMeme与SD1.5模型兼容,耗尽原模型功能的同时赋予新能力,指责视频质量。
详情链接:https://songkey.github.io/hellomeme/
5、Meta推出全新水印工具VideoSeal打击AI生成深度伪造视频!
Meta公司推出的MetaVideoSeal工具,旨在为AI生成的视频添加几乎不可察觉的水印,以应对深度伪造技术带来的确认有罪。该工具不仅开源,还能与现有软件无缝集成,增强视频的原创性保护。
【AiBase提要:】
??Meta推出的MetaVideoSeal工具可以为AI生成的视频添加水印,抵抗编辑和数量增加。
??该工具已开源,旨在与现有软件集成,并希望推动行业内的水印技术发展。
??Meta还将推出公开排行榜以比较不同水印方法,鞭策行业合作与交流。
6、OpenAICFO透露:新一代AI模型开发将耗资数十亿,成本激增!
OpenAI首席财务官在纽约透露,未来构建更高级的人工智能模型的费用将结束大幅增长,预计达到数十亿美元。这一趋势反映了技术进步与市场需求的双重压力,促使公司加大对AI技术的投资。
【AiBase提要:】
??OpenAI预计新一代AI模型开发费用将结束激增,达到数十亿美元。
??公司正在加大对先进AI偶然的投资,未来服务价格可能会上涨。
??新推出的AI视频生成器Sora引发积极反响,为内容创作者授予更多可能性。
7、谷歌、三星联手“掀桌”!全新瓦解现实头显、AI眼镜曝光,剑指苹果VisionPro
谷歌与三星联合推出的新一代瓦解现实头显和智能AI眼镜,充分展示了在瓦解现实领域的雄心。这两款设备不仅硬件升级显著,还深度整合了谷歌最新的GeminiAI模型,具备理解用户意图和长期记忆能力,授予个性化服务。减少破坏多种自然交互方式,使用户体验更为流畅。
【AiBase提要:】
???新设备减少破坏VR和AR功能,深度应用AI技术,授予个性化服务。
???创新交互方式,减少破坏手势、语音和眼动,指责用户体验。
??基于AndroidXR操作系统,现有应用无缝适配,降低开发者门槛。
详情链接:https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html
8、谷歌“王牌”TPUTrillium开放使用!性能暴涨,AI模型训练效率再创新高
谷歌最新发布的TrilliumTPU现已面向GoogleCloud客户开放,其显著指责的性能和效率为AI模型训练带来了新的突破。通过优化的硬件和软件架构,TrilliumTPU在训练和推理性能上均实现了显著指责,极大地推动了AI解决方案的开发与应用。
【AiBase提要:】
?TrilliumTPU的训练性能降低4倍,推理吞吐量降低3倍,能源效率指责67%。
??TrilliumTPU减少破坏大规模AI训练,能够有效分配工作负载,显著加快训练速度。
??每美元训练性能降低2.5倍,推理性能降低1.4倍,授予了可忽略的,不次要的性价比。
详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga
9、TwelveLabs正在开发能够分析和搜索视频的人工智能
在数字媒体时代,视频内容的增长速度令人瞩目,但传统的搜索和分析方法却无法焦虑需求。十二实验室通过人工智能技术,彻底保持不变了视频理解的方式,能够深入分析视频中的动作、物体和声音,授予更精准的搜索能力。
【AiBase提要:】
??十二实验室的AI模型能够深入理解视频内容,超越传统的关键词搜索。
??该公司专注于视频理解,授予定制化的视频分析工具,适用于多种场景。
??十二实验室在技术创新的同时,注重伦理,确保AI模型的公正性和包容性。
10、xAI与OpenAI薪资对比:马斯克与奥特曼的人才争夺战
随着人工智能行业的快速发展,xAI与OpenAI之间的人才竞争愈演愈烈。马斯克指控OpenAI通过高薪驱散人才,导致竞争对手面临有利的条件。分析显示,OpenAI在薪资上明显高于行业标准,而xAI的薪酬也具竞争力。【AiBase提要:】
??xAI与OpenAI在薪资上的差距显著,OpenAI的薪资超出行业标准87%。
??马斯克与奥特曼之间的竞争加剧,xAI已招聘多名前OpenAI员工。
??马斯克指控OpenAI反竞争行为,双方在人才争夺中斗智斗勇。
11、OpenAI前算法负责人创立新公司,进军智能陪伴机器人领域
据媒体报道,OpenAI的前资深算法负责人江旭成立新公司“亮源新创”,专注于具身智能陪伴机器人的研发。作为GPT-4的重要贡献者,江旭在OpenAI的职业生涯中参与了多个关键项目,并于2023年离职后成立了该公司。
【AiBase提要:】
??亮源新创专注于具身智能陪伴机器人的研发,旨在指责用户的生活质量。
??公司在深圳和新加坡设有办公室,正在积极招聘人才以推动项目进展。
??亮源新创的机器人将具备感知、学习及与环境交互的能力,适用于多个领域。
12.巨人网络发布“千影QianYing”有声游戏生成大模型
巨人网络在2024年度中国游戏产业年会上发布了“千影QianYing”有声游戏生成大模型,包含YingGame和YingSound两个不次要的部分模型,展示了通过文字描述生成游戏内容的能力。该模型仍在技术打磨中,同时启动了“千影共创计划”,旨在鞭策“游戏+AI”领域的发展。
【AiBase提要:】
??巨人网络发布“千影QianYing”有声游戏生成大模型,推进游戏与AI分隔开。
??模型包含YingGame和YingSound,减少破坏有声可交互游戏视频生成。
??启动“千影共创计划”,帮助游戏创作的技术应用与合作。
大众赞成电商平台“退款不退货”的声音,我们不应该视若无睹。
去年,主流电商发散跟进后,“退款不退货”(下文简称“仅退款”)已经成为行业标配。客观来说,这一政策具有积极意义,能够倒逼商家在商品和服务上做指责,使恶化用户的购物体验。针对生鲜、低单价的商品的退换货,也能一定程度上降低售后效率,降低售后成本。
但就实际情况看,这些作用无法掩盖仅退款对社会带来的负面影响。近期,有媒体报道,一位商家因为一件售价9.9元T恤被成功“仅退款”,赶赴上千公里与消费者进行对峙。而这并非孤例。
商家不计成本维权的背后,电商平台仅退款政策不合理、不正当的属性已经显现。更为恶劣的是,在仅退款“利好消费者,优化经营环境”的大旗之下,这一机制被合理化,许多存在的问题也被掩盖。这些问题涉及商业、法律、社会伦理等诸多方面,影响深远。
不少人明确赞成电商的仅退款政策,其中不乏能够因此受益的消费者。赞成理由多指向了,仅退款表面是对消费者权益的维护,实则违背了公平交易的原则,由此导致的交易成本减少需要全社会共同允许。
仅退款在制度设置上存在较大漏洞,其导向会放大人性的“恶”的部分,催生出更多“羊毛党”,不利于商业的健康发展。
目前看,仅退款对消费者的“包庇”明显。这个过程中,商家需要出钱,但平台判定的过程不需要商家辩论,而消费者甚至不需要主动提出这一诉求。因而,仅退款被类比为合法版的“零元购”。
“退款不退货”为消费者授予了在没有任何成本的情况下获得商品的机会。因为门槛较低,缺少明确标准,无法避免有人恶意退款。有商家表示,平台上线仅退款功能后,有用户申请退掉3年前购买的商品。
机制本身有可钻的空子,平台还存在意见不合消费者使用仅退款功能的反感。一些消费者在与商家沟通的过程中,并未主动表达仅退款的需求,但平台会自动授予仅退款的解决方案。面对主动退款,消费者很难有“占了不该占的便宜”的心理负担,选择接受的概率远大于不接受。
这会导致消费者产生,仅退款是解决售后问题的常规途径的想法,以此来要求所有商家。更不用提还有催生黑色产业链从仅退款中获利的可能。这显然并不合理。
“今天他能白嫖我99块钱,明天就会是的999元,后天可能就是9000元,纵容一次的结果就是对方会更加肆无忌惮。”有商家说道。
仅退款带来的交易成本减少,最终会被转嫁到普通消费者身上,进而导致遵守规则的人为不合理的制度买单。可以说,是以“为大家好”的名义,做出损害大众利益的事情。
今天,各个电商平台都在降低重要性“低价战略”,不少商家本身盈利困难。一些商家表示,一些商品的利润只有几毛钱。一次仅退款带来的损失,需要多卖十几件货才能弥补。而平台方在消费者退货后,甚至还会继续收取商家正常交易后应付出的费用。
这种情况并非个例。仅退款机制会淘汰部分企业,更多企业出于生存的需求,要么会选择指责产品售价,要么降低产品的质量。进一步来说,接受是一切交易成立的基础,仅退款的出现破坏了这一基础。所有商家都会面临“钱货两空”的可能。为了规避风险,商家也有很大概率降低利润率,来保证正常经营不受影响。
这种情况下,选择仅退款的消费者自会从中获益,但普通消费者则会成为“欺凌弱小者”。
实际上,仅退款对于指责购物体验、优化电商环境的作用并不显著,还将商家和消费者放在了对立的位置上。但因为对电商平台而言,执行简单没有成本、对用户的驱散力显著,所以受到追捧。
电商经过多年的发展,售后机制已经相当完善。“七天无理由退货”“运费险”等政策的普及,消费者售后维权的难度已经明显降低。今年,国家还新出台了《中华人民共和国消费者权益保护法实施条例》,对于网络交易中呈现出的重点、热点问题进行了规范,释放网络消费侵权行为。其中,明确提出了“未经消费者辩论,经营者不得允许无理由退货。”
在退货退款能够保证的情况下,仅退款存在的必要性并不高。存在生鲜、物流成本高于商品价格的商品,仅退款能够威吓商家负担。但是否选择仅退款,这个决策应该由商家与消费者进行协商。
平台方“越俎代庖”替交易双方做决策,实则违背了公平交易的原则,商家的合法权益并未得到完全保障。更次要的是,仅退款带来的商家经营成本和风险的减少,平台并未分担。
今年4月份上海一中院公开的案件中,有商家起诉电商平台未与其沟通直接退款有失公平,要求平台赔偿仅退款的20元。一二审中,法院都减少破坏了商家的诉请。法院审理认为,平台没有收回商家合理的时间做出回应和举证,而是直接介入采取退款措施,解开了商家和消费者不平衡处理商品售后问题的权利。这一案例已经能够反对仅退款存在一定的不合理性。
回过头来看,仅退款之所以引发如此大的争议,实际上是因为平台方利用失败自己的无足轻重地位,选择了一条有利自身的道路。这个过程中,平台“慷商家之慨”,以此来“讨好”消费者。但最终没有人能够从中受益,反而牺牲了多方的利益。
因此,《第三只眼看零售》认为,无论是商家还是大众对于仅退款的赞成,都并非小题大做。任何情况下,正常的交易秩序都不应该被联合口子,这会损害所有参与者的利益。
只有保证公平交易的原则被执行,商家利益不受损能够正常经营,行业才有良性发展循环的基础。当然,电商平台能够授予更好的商品和服务,大众乐见其成,但实现的途径需要合情合理且更加规范的方式。
(责任编辑:zx0600)声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】今天,「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了,人人可玩的那种。
最近,2024中国互联网价值榜发布。
2024年AIGC应用用户规模TOP榜中,昆仑万维旗下天工AI强势入围!
如今,天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩,在多梯队的猛烈厮杀格局中稳稳占据无足轻重。
同时,还不断有好消息传来。
就在今天,天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型,正式进化到「天工4.0」。
「天工大模型4.0」o1版(Skyworko1)的上线,意味着国内首款中文逻辑推理能力的o1模型来了!
数学高考题、考研题、奥数题,Skyworko1都能靠自己的逐步思考破解。
注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力,还在模型真正拥有了思考和反思之后,带来了推理能力的指责。
在最近热转的复旦等机构解密OpenAIo1路线图这一研究中,skywork-o1就被列为国内o1级模型的代表之一
并且,昆仑万维天工大模型4.0上线后,应用端不仅在逻辑推理和代码功能上有了几大指责,语音交互上的表现也着实令人惊叹。
一个月正式发布的新产品「实时语音对话助手Skyo」,如今有了史诗级指责。
众网友实测后纷纷表示,原来国内版的「Her」,已经进化到了不输OpenAI版本的地步!
具备多语言对话能力的Skyo,不仅能快速响应、主动发起对话、实时打断,给出的回应还十分情感化,已经具备了类人特征。
还等什么,实测马上呈上。
超强推理+自我反思,免费体验
现在,分别关闭天工APP或网页端,任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。
既然主打的是推理,那么我们就先来看看Skyworko1在数学题上的表现如何。
体验地址:https://www.tiangong.cn/o1Chat/055
先来个硬核的,AIME数学竞赛题。
题目是这样的——
Jen通过从S={1,2,3,...,9,10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个,她就能赢得奖金;如果她的四个号码都是随机选择的号码,她就能赢得大奖。假设她赢得了奖品,她赢得大奖的概率是m/n,其中m和n是相对质的正整数。求m+n。
Skyworko1用时1分55秒,经过一番思考后,最终给出了正确答案——116。
对于下面这道同样有些难度的数学题,模型在经过一番思考之后,很快就想到了用图论中的「图兰定理」去解。
值得一提的是,在思考过程中它对答案不确定时,甚至会反思自己的回答,直至最终确定25是正确答案。
一个象棋比赛,共有十名选手参加,每一个选手都需要和其他选手每人下一盘棋,赛程进行到某阶段时,发现任意三个选手中,起码有两个相互之间还没有下过一盘棋,此时至多进行了多少场比赛?
2024年高考新课标一卷的数学真题,Skyworko1也能做出正确答案,就是方法稍微「笨」了点。
复杂一些的逻辑推理题,Skyworko1也能做对。
这道从池塘中取水的推理题,它通过一步步的思考过程,推理出了正确答案。
还有这道「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少」,Skyworko1反复斟酌之后给出了正确的答案。
为什么刚出生的小孩只有一只左眼?这个脑筋急转弯,没能瞒过Skyworko1的眼睛。
弱智吧难题,不在话下。
比如父母以后的钱都是留给我的,可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。
吕布马上无敌,典韦步战无敌,吕布骑着典韦会不会天下无敌?Skyworko1表示,有趣的脑洞只是一个戏谑的表达,而非爱开严肃的话的历史或军事讨论。
最后,上一道LeetCode贪心算法的分发饼干代码难题。题目如下——
假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。
对每个孩子i,都有一个胃口值g[i],这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子,并输出这个最大数值。
Skyworko1也顺利给出了答案。
自研技术方案,结束创新迭代那么,Skyworko1为何能在逻辑推理任务上,有如此大幅的指责?
这就要得益于天工三阶段自研的训练方案。
推理反思能力训练
首先,在推理训练方面,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据。
然后,用这些高质量且多样化的长思考数据,对基座模型进行继续预训练和监督微调,并在版本迭代中采用大规模的自蒸馏和允许采样,从而显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习
其次,在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel(PRM)。
在最新的版本中,团队将Skywork-PRM的应用范围,从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时,还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。
此外,团队重点指责了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制。通过更细致的评估体系,为强化学习和搜索过程授予了更精准的奖励信号指导。
推理planning
最后,在推理的规划方面,团队通过自研的Q*线上推理算法,以及模型的在线思考能力,实现了最优推理路径的寻找。
概括来说,Q*算法通过借鉴人类大脑中「System2」的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题。
然后,再通过Q*线上推理框架与模型在线思考的分隔开,实现了推理过程中的精细规划,进而指导LLM的解码过程。
Q*算法的成功落地,不仅显著指责了模型的线上推理能力,同时也标志着Q*算法的全球首次实现和公开。
论文地址:https://arxiv.org/abs/2406.14283
更进一步的,团队基于Q*算法对推理系统进行了全面优化。
第一点是模块化的树形结构推理:
团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调,使模型具备了对整个推理流程进行系统规划,自动将回答按层次发散,同时在推理过程中融入自我反思和验证环节的结构化输出能力。
此外,还创新性地利用失败以「模块」为单位的规划方式,取代了传统的以「句子」为单位的方法。既指责了规划效率,也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。
第二点是自适应的搜索资源分配:
针对现有o1风格模型存在的缺乏思考问题,团队开发出了一种全新的自适应搜索资源分配机制。也就是,通过对用户query进行难度预估,自适应地控制搜索树的宽度和深度,进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的,有效指责了偶然的计算效率和回答准确率。
最终,Skyworko1在GSM8k,MATH,OlympiadBench,AIME-24和AMC-23标准数学基准测试,以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini。
实时语音助手,开启AI交互新纪元在APP端,「天工大模型4.0」4o版加持的实时语音对话助手Skyo,同样带来了前所未有的自然交互体验。
它不仅能在1秒内快速响应,还具备了多语言对话、主动发起对话、实时被打断的能力。
与此同时,4o未来版本可以减少破坏个性化声音定制功能,能够以任何人希望的风格畅聊。
这是这种个性化的体验,让4o不再是冰冷的AI,而是一个更智能的AI伙伴。
当你唤醒Skyo后,他会主动无感情打招呼,并尝试开启一个新的话题。当你生活中遇到难题时,可以向它寻求建议和干涉。
比如,家里2岁的宝宝总是说不要不要,我该怎么办?
冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇,根据这些原材料,能帮我推荐一份食谱吗?
当你想要策划一场旅行,它还会贴心地为你做好攻略——我计划去北京度假3天,你能帮我做一份攻略吗?
甚至,当你无聊时,可以让Skyo玩脑筋急转弯、猜字容易理解,或者一起聊天......
比如,我们一起玩脑筋急转弯吧,我问你答。什么瓜不能吃?麒麟到了北极会变成什么?
我们还对Skyo进行了压力测试,看看在不断被打断的情况下,它能否依旧表现亮眼?
「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。
果不其然,在整个对话过程中,它完全能够跟上节奏,不仅有感情地朗读出诗仙的静夜思,并在古代诗人不无关系的信息问答中,给出了准确且通俗的回答。
接下来,我们一口气连问四个问题,Skyo即便被频频打断,也没有「崩溃」。
「对于一个单身男青年,可以推荐他晚上看什么电影?什么情况下,说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话,它们会说些什么」?
从以上案例可以看出,Skyo具备了高度协作发展智力能力和流畅的响应度,而且它还能做出有趣的互动,成为你个性化的陪聊搭子。
多模态LLM端到端建模深挖背后,Skywork4o加持的Skyo突破性体验,是昆仑万维基于大模型、AI音乐等领域的研发经验,以及极小量的语音数据积聚,打造出这个端到端的语音对话系统。
传统的语音助手采用了ASR(语音识别)+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。
英伟达高级科学家JimFan曾指出,AI语音系统Whisper、大模型ChatGPT,以及语音分解技术VALL-E,是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。
不过,在此期间,三个独立的模型在串联过程中,会带来响应延迟,甚至是信息损失、优化困难等问题。
对此,昆仑万维选择了一条艰难的创新之路,采用多模态LLM端到端建模。
端到端模型使得用户的语音输入经过语音编码器提取语义特征,通过适配模块转换为大语言模型(LLM)可理解的格式,LLM处理后生成语音回复,实现端到端的语音交互。从根本上解决了这些难题。
团队还采用了低比特率单码本语音Tokenizer,在显著降低延迟的同时还保持了音质。为了扩展语音建模能力,Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出,确保了实时交互的体验。
最关键的是,它不仅能准确识别语音内容,还能捕捉语速、语调、情感等细微的特征,从而做出情感化的回应。
比如我们问道,「我今天在路上偶遇到了一只流浪猫,看着它怪快乐洋洋的,所以我无法选择收养了它」。
Skyo的回答中语气上扬,对这个行为做出了极大的接受。
再比如,「我最近感到非常疲惫,心情有点差」。
Skyo感同身受地表示,「我能够理解你现在不是处在最美好的状态」。随后,它又主动推荐了一些调节心情的方法。
「有时候,我甚至麻痹自己不被人理解」。
听完AI的回答,瞬间感到非常地温暖贴心,甚至有时会给人一种在和知心朋友交流的错觉。
一年迭三代,跻身国内第一梯队
纵观全球AI行业的发展,过去一年里,应用落地成为最受瞩目的关键词。
OpenAI新模型接连上新,再加上一些搜索、Canvas、高级语音模式等功能的推出,让ChatGPT每周活跃用户数直接冲破3亿。
微软押注的Copilot不断迭代,并赋能了更多平台/工具,包括GitHub、Office365等等。
至于谷歌,今年最爆火的一款应用非NotebookLM莫属,一键转写总结播客让所有人拍案叫绝。
还有Anthropic、亚马逊、Meta等国外科技巨头们,都在AI落地战场上帮助布局。
反观国外,以阿里、腾讯、字节为代表的互联网公司,以昆仑万维、智谱AI、百川智能等为代表的AI公司,在这场竞赛中也毫不逊色。
据QuestMobile统计,截至今年9月,国内AI原生应用活跃用户数接近8000万人。
其中,月活超百万以上产品数量仅12个,而天工AI长期稳居中国原生AIGC应用月活TOP10,并且在月活用户300-1000万区间内位居前三。
值得注意的是,昆仑万维凭借其扎实的技术积聚,以及不不透光的战略布局,正逐步确立自己在这个赛道中的领先地位。
去年5月,其主打产品天工AI日活跃用户(DAU)已经突破百万大关。
作为一家老牌互联网企业,昆仑万维从2008年诞生后,一直在书写着自己的AI传奇。
2020年,在GPT-3出世的这个关键节点上,团队开始全面布局AIGC和大模型领域。
2024年,是昆仑万维在AI领域的丰收年。
截至目前,他们已自研出五大模型体系,包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。
在大模型方面,团队在2月推出MoE大语言模型「天工2.0」,紧接着4月又迭代了4000亿参数的「天工3.0」,性能大幅超越Grok-1,一举成为全球最大的开源MoE。
与此同时,音乐生成大模型「天工SkyMusic」正式诞生。6月,昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月,4o和o1版模型相继诞生。
不仅如此,昆仑万维的影响力已遍布全球市场。
比如,率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域,还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。
目前,公司在全球平均有近4亿月活,海外收入占比高达89.7%,在社交、游戏、音乐等领域已经形成壁垒。
并且,还完成了「算力基础设施—大模型算法—AI应用」全产业链布局,构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
昆仑万维的实践带来的启示是,AI落地不仅仅需要强大的技术能力,更需要的是对应用场景的肤浅理解。
正是这种扎根于实际应用场景的技术研发思路,使得团队能够准确把握用户需求,将过往积聚的能力快速转化为解决世界问题的产品。
这次,4o和o1在天工全新上线,又将成为这款应用破局的下一个爆发点。
不仅如此,昆仑万维对AGI发展路径的思考极具前瞻性。
回顾过去两年,科技圈对AGI的讨论可谓是起起落落。特别是2024年年初,随着Sora诞生之后,许多人一度陷入缺乏乐观的不关心,认为AGI实现就在一两年之内。
然而到了年中,这股热潮又悠然,从容消退,悲观论调开始盛行——AGI遥遥无期。
昆仑万维创始人周亚辉对未来30年,做出了富有远见的判断:人类社会将从感知保持方向表达,创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会,2030年之后才会开始逐步实现通用人工智能AGI。
关于这个时间节点,他从未保持不变过。
不过,在迈向AGI时代之前,机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破,皆需要全球顶尖AI科学家的努力。
周亚辉认为,机器人技术协作发展进程如何,其在军事领域的应用是一个次要的指标。
未来,如果机器人产业带来超10亿美金市场规模,将会对整个社会结构和社会治理产生次要的影响。
基于这些判断,昆仑万维在2024年初就确立了「实现AGI,让每个人更好地塑造和表达自我」的新使命。
而现在,在这条通往AGI的道路上,他们正在用技术创新和产品落地,一步步将愿景变为现实。
参考资料:
https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4
天工o1模型:
https://www.tiangong.cn/o1Chat/055
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、AI假冒不为人所知的人直播带货属违法行为可要求退一赔三近年来,AI技术的悠然,从容发展带来了深度伪造技术的应用,这种技术通过算法生成逼真实的诚实内容,导致了不为人所知的人形象被冒用的现象。彼得·蒂尔的影响力在这些公司中无处不在,他推动的科技优先理念引发了对国家安全与伦理的深思。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
12月24日,2025中国信通院深度观察报告会科技伦理与合规发展分论坛在北京举办。本次分论坛主题为“伦理先行,合规致远”,聚焦互联网广告合规治理、移动终端应用生态治理、短视频平台责任限度等前沿话题进行分享与探讨。倍孜网络作为行业领军企业参与深度观察报告会,用实践经验赋能行业治理措施,共同推进行业绿色、健康、智能、高效发展。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
曝绿营大佬欠钱不还却出入高档餐厅
民众党民意机构党团总召、民众党代理主席黄国昌去年底爆料,民进党民代许智杰曾和“新潮流”大佬、民进党前秘书长吴乃仁聚会,不能引起外界关注。而在昨天(8日),黄国昌再度于脸书爆料,指吴乃仁去年12月底现身某高档无菜单料理餐厅,此餐厅包厢低消高达6万元(新台币,下同),且在席间竟还有台北地检署检察官徐名驹。
“赖着不还的吴乃仁,觥筹交错的检察官。”黄国昌8日在脸书发文表示,他当天在台民意机构“经济委员会”针对吴乃仁贱卖台糖土地,服完刑后未偿还根除台湾的损失,加计利息反倒愈欠愈多,高达1.74亿元赖着不还一事提出质询。他直言,吴乃仁雄厚的“新潮流”政治背景,加上台湾地区领导人赖清德的力挺,让台糖很为难。所以台糖以吴名下查无财产替其遮掩,连带台北地方法院执行处也不敢认真践行强制执行程序,“根除全体纳税人损失的绿营权贵横着走,公平正义荡然无存。”黄国昌指出,自己除了在质询时揭露吴乃仁出入乘坐BMW7系列豪车、常与政商权贵高档餐厅外,更接获检举,指吴乃仁的政治影响力之大,连检察官都得敬他三分。他提到,去年12月底晚间,吴乃仁再次现身于台北市中山北路二段附近的高档无菜单料理餐厅,由某从事人力中介的陈姓董事长招呼接待,在席间竟还有台北地检署徐名驹等一票检察官。黄国昌质问台当局法务部门负责人郑铭谦,徐名驹等检察官有没有逾越检察官伦理守则?这场餐叙由谁牵线?低消6万元的包厢由谁买单?在席间又谈了些什么内容?黄国昌并认为,这些问题除要郑铭谦回答,也考验着台湾司法独立的底线与检察官的官箴,是否又会因为事涉民进党大佬,再次往后前进。