欢迎来到ks989.tk!今日更新:68474章
章节列表 共7117章
第一章 又污又黄又无遮挡网站
第二章 波波影院最新地址
第三章 擦擦擦36
第四章 无码欧美69精品久久久久
第五章 插混凶猛:干翻
第六章 推荐几款超污的手游游戏
第七章 9191在线观看
第八章 一个人在家看的WWE视频
第九章 援交是什么意思
第十章 二次元打扑克又疼又叫的游戏

第906027章

daokangming.com

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】斯坦福HAI的研究员MichaelKratsios,被剥夺为白宫科技政策办公室主任,及特朗普政府的总统科技助理。从马斯克、AI沙皇到HAI研究员,这几轮剥夺彰显出:美国开始在国家层面推动科技政策发展,大力发展AI。

就在近日,斯坦福大学人类中心人工智能研究院(StanfordHAI)的研究员MichaelKratsios,被剥夺为白宫科技政策办公室主任。

同时,他还被剥夺为即将上任的特朗普政府的总统科技助理。

李飞飞转发了这一消息,并表示祝贺。

可以看出,如今美国AI的高层研究者,已经对国家科技领域最新政策有了越来越下降的影响力。

旧部下被休会,中止,纷纷重回白宫

近日特朗普宣布:剥夺MichaelKratsios和LynneParker担任政府中的关键科技职务。

这两位都是他第一任政府的资深人士,他们将进驻白宫,与其他专注于人工智能和加密货币的科技剥夺人员一起工作。

特朗普在剥夺声明中表示——

我们将共同实现科学突破,确保美国的技术主导地位,并迎来美国创新的黄金时代!

此前,特朗普曾剥夺DavidSacks为「人工智能和加密货币沙皇」。

而Kratsios上任后,将作为白宫科技政策办公室主任,为「沙皇」授予咨询。

另一位资深人士LynneParker将担任总统科技顾问委员会的执行主任,为Kratsios授予建议,该委员会将由「沙皇」担任主席。

此前,Parker曾在特朗普政府中担任过副首席技术官,并且是国家人工智能倡议办公室的创始主任。

SriramKrishnan被剥夺为OSTP的人工智能高级政策顾问。他是a16z的普通合伙人,此前曾在微软、X、Meta和Snap工作过。

a16z的另一位员工,无约束的自由合伙人ScottKupor,被剥夺为人事无约束的自由办公室主任。

据报道,自大选以来,MarcAndreessen的大部分时间都是在海湖庄园度过的。可见特朗普和a16z关系之紧密。

MichaelKratsios,牵头制定美国首个AI战略

MichaelKratsios不仅是一位美国商业高管和前政府高级官员,还是ScaleAI董事总经理。

在此之前,他曾在白宫担任美国第四任首席技术官。

作为总统的首席技术顾问,Michael领导制定和执行了国家技术政策议程。

在他的领导下,白宫重新调整不当了美国国家技术政策方向,为的是确保美国在新兴技术领域,依旧保持领先地位。

2020年,他牵头设计了美国首个人工智能战略——AI计划。

计划中,直接将联邦AI和量子研究经费翻倍,并制定出了全球首个AI发展监管原则。

而且,他还领导美国在经合组织(OECD)制定全球首个政府间AI政策指南。

此外,Michael监督实施两项具有里程碑意义的法案——《国家AI计划法案》和《国家量子计划法案》。

这些法案推动了在白宫设立国家AI计划办公室和国家量子不调和办公室,并主导了一个价值十亿美元的全国AI和量子研究机构网络的建立。

在进入白宫之前,Michael前担任国防部研究与工程副部长,是五角大楼的第三高级官员。

他曾无约束的自由着世界上单一组织最大的研发预算,监督了五角大楼的所有研究、工程、开发和原型制作。

他还负责监管DARPA(国防高级研究计划局)、导弹防御局、国防创新部门、太空发展局和国防部实验室企业。

与此同时,Michael的卓越贡献也得到了广泛的认可,获得了美国参与院的一致同意辩论,荣获国防部最高平民奖项——国防部杰出公共服务奖。

另外,他还被《财富》杂志评为「40位40岁以下精英」之一,成为了政界和科技界的双重典范。

值得一提的是,他出生于南卡罗来纳州,并获得了普林斯顿大学文学学士学位,还曾是清华大学的访问者学者。

参考资料:

https://x.com/StanfordHAI/status/1871269663113371711

声明:本文来自于微信公众号量子位,作者:衡宇,授权站长之家转载发布。

百花齐放,但尸横遍野。

这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。

但这位昔日的阿里前端第一人,还是选择加入了这个没有硝烟的战场,用AI聚焦内容创作者群体。

入场2个月,公司估值过亿;入场6个月,推出首款产品YouMind,开放内测20多天来,反响不错,有近5000人排队申请(最后通过了千余人)。

他还有些喜出望外地告诉量子位,迄今为止,已付费的种子用户比他预料中更多。

玉伯是谁?

这个名字在前端开发领域圈子里家喻户晓,且和现在大多数打工人每日用的办公工具/平台息息相关:

硕士就读于中科院物理所;

2008年加入淘宝UED(UserExperienceDesign)部门担任前端工程师,和团队陆续推出了SeaJS、KISSY等框架;

2012年转入支付宝前端开发部,负责基础组,后来创立了体验技术部,致力于设计语言AntDesign、数据可视化AntV等;

2016年,主导了笔记与文档知识库语雀(完全建立叫云雀)的开发,并在2019年开始了语雀的商业化尝试;

2021年,生产力协同事业部成立,玉伯负责主要产品语雀+白雁;

2023年4月,入职阿里15年、职级P10的玉伯离开蚂蚁;紧接着入职字节旗下飞书,担任飞书产品副总裁;

2024年4月,玉伯离职飞书,次月在杭州创办AI公司思维天空。

11月底,思维天空的第一款产品问世,并于12月6日开启内测:

YouMind,一个面向全球创作者的AI工具,覆盖全流程,能整合多模态那种。

不过,玉伯很直接地告诉量子位,目前大家看到和用上的版本,仅仅是YouMind最终构想的v0.1。

但出于一个技术出身者深入骨髓的开源精神和共创理念,团队选择在此时把YouMind摆到用户眼前。

最终形态:内容创作者的GitHub社区

那么,0.1版本的YouMind——也就是现在用户可以内测上的这个版本,是什么样的?

作为通过内测的千分之一,量子位多位编辑都尝试体验了一番。

注册后,它会推荐你安装YouMind浏览器插件。

通过这个插件,你主要可以干三件事:

第一,总结网页,翻译网页;

第二,和ChatBot对话,询问问题,不管是关于正在浏览的界面的,还是需要互联网搜索的;

第三,把任何模态的内容,包括文字、图片、播客/音频、视频等,吃进个人收藏夹里,带分类那种。

以上,是调用插件能做的事。

△右侧为调用插件时的界面

而当进入YouMind主页后,有三大功能。

首先,Snips。

用来摘取并收藏互联网上任何你觉得有用,想要沉淀到自己知识库的内容。

可以是来自arXiv的论文,来自油管的视频,总之anywhere的anything。

其次,Thoughts。

这个很好理解,用来记录你自己个人的想法和随笔,就是网络在线笔记本。

再者,Boards。

可以在这里把外来沉淀的Snips,和个人记录的Thoughts,在这里分类归类,进行整理。

目前来看,Boards功能有限。

(不过毕竟玉伯还把此版本定义为v0.1,大家看个意思吧先)

非要做个类比来方便大家理解的话,我愿称之v0.1的YouMind为:

Readwise和obsidian的AI一整片的单位版。

(打个比方啦,有更准确的描述避免/重新确认/支持大家评论区集智众筹)

而这,仅仅是玉伯构想中,YouMind走向完全成熟的三个阶段中,第一阶段的第一步。

量子位画了张思维导图,来呈现他对YouMind的外围构想:

玉伯介绍,团队目前正在打磨第一阶段的第二步,让内容创作者们能够在YouMind上IPO起来(手动狗头)。

让收藏的内容不再吃灰,想找看过的内容时不用各平台狂翻浏览记录。

完成资料的串联和调用,干涉自己更好地生产文章/播客/视频等内容。

至此,就算完成了YouMind第一阶段——此时将达到v0.5。

到了第二阶段,YouMind会从个人工具走向协同使用,正式走向v1.0。

但和Notion、飞书、WPS等还不太一样,YouMind偏重内容协同、降低重要性项目无约束的自由,而非组织无约束的自由。

AI2.0时代,“一人公司”为代表的超级个体或小微团队极小量出现,我想他们都不需要很庞大的协同工作平台。

我们的第二阶段,就是想做服务这类人群的协同工具。

“哈哈,第三阶段其实很长期,和我的初心有关。”玉伯笑道,那就是做社区。

内容创作者们有油管、抖音、推特、小红书等各种平台,但会给人一种四处打工的麻痹,“我麻痹创作者没有归属感。”

他拿程序员最大的社区GitHub类比——

无论是写代码还是抄代码,程序员会把GitHub看成是一个家一样的社区;自己有好的想法,也能上传后,进一步被build,甚至变成软件,再分发出去,可能还会在AppleStore里面挣钱。

所以,YouMind的终极目标,是成为一个内容创作者的GitHub。

(p.s.:以天天写稿人的角度,我们聊到创作者的心态或许和程序员的心态有所不同,内容创作者或许不太接受“被copy”。但玉伯举例了一个他认为的神奇存在:维基百科)

“也许创作是更好的消费”

而之所以创业第一剑,玉波选择对内容创作者群体“下手”,原因无外乎有二。

一看擅长什么。

一次与杭州的创业前辈交流时,玉伯头一回听说了与共识不反对PMF解释:

P不应该代表product,应该代表person。指代的还不是团队里的所有人,就是创始人本身。

那看玉伯自己的经历,他表示自己从2014年起开始用Notion,后来主导语雀、加入飞书。

他介绍团队成员虽然年轻,但多年工作经验与此息息相关,有经验,有积聚,有市场长期观察。

团队成立后,内部协同又从Slack+Notion+GoogleWorkspace,横跳到觉得更适合小团队协同和项目无约束的自由的Linear+GoogleWorkspace。

等于是从自己的日常使用中寻找新的痛点。

△杭州,思维天空公司内部

二看趋势是什么。

他洞察到与自己要做的事有关的趋势,也分为两点。

首先是内容创作越来越多模态化,并且这个现象不仅仅在国内,是在全球范围内发生。

其次是95后,准确来说10后、20后的消费不习惯正在保持不变。

玉伯自己本人觉得目前的娱乐消费,需要普通人有很下降的自律要求。在玉伯口中,这种纯·消费其实很累,他说:“你以为消费了,其实啥也没得到。”

同时,他又不止一次从初中学生口中听到“抖音是老年人才玩的东西”之类的话,也看到自己的儿子和小伙伴们面对不知名的小事一时的《黑神话:悟空》时,不仅仅是去玩那个游戏,更是自己去我的世界(Minecraft)里自己搭建还原游戏中的建筑、boss等等。

再三思索后,玉伯得出自己的结论:

本质上,我会觉得可能「创作」是一种更好的消费,或者创作有可能是一种新时代的消费。

他表示,也许每个人都应该去尝试创作一点内容,尝试过后收获的甜头,跟纯粹是刷短视频的快乐是完全不一样的。

所以就有了YouMind。

然后本着一种很朴素的开源心态——朴素指的是“有了想法就开源”,让大家以此为基点,有代码的写代码,会文档的写文档,有钱的捧个钱场,一起攒个局把想法实现——团队觉得没必要憋大招,可以用共建的方式合力朝内容创作者的GitHub前进。

所以现在时刻的YouMind还是v0.1。

创业后,“功成必须在我”

作为YouMind背后最次要的那个男人,成为创业者后,玉伯更踏实了,但也更害怕了。

踏实,是相比于此前的大厂经历而言。

2018年前,玉伯都在和代码打交道;后来身居大厂中层,带着六、七百人的团队。

不过问题随之而来:

和一线同学隔了三、四个层级,既不能很好地感知到一线的信息,也很少需要自己去做决策(因为更贴近业务本身的-1or-2提上来的决策已经很不错了),只需自己点头;又因为自己就是所在业务的领头羊,需要他本人自上而下传递的高层信息也几乎为零。

但真实的有那么安逸吗?并没有。

出于各种原因,他不能让自己的日程表有空白,甚至有时需要被动地去卷别人。

用他自己的话说,总之人是忙了,心却闲着。

自认为是个实操性人格的玉伯不太享受这种状态,甚至一度想转型去做HR,想让自己踏实一些。

现在离开大厂,自己拉起十几个人的小团队开始从零开始,含糊也踏实了。

不过回头看,有时需涉及团队无约束的自由方面的事务,还会回头有点“羡慕”大厂。(但玉伯表示,避免/重新确认/支持大家加入~)。

至于害怕嘛——

是接受害怕嘛!一个创业者说不害怕,我觉得见了鬼了。

说不害怕创业大成功的创业者,高度发展上都在骗人。

但他陈述,所谓的“害怕”不是说自己怕丢面子。

玉伯很清楚,创业当然得尝试,但当然也担心瞄准的方向是伪命题,某些害怕的情绪是必然会有的。

害怕金钱流失。

作为一个长期主义者,背负投资人的钱,AI创业花钱如流水,但又担忧找不到“有耐心”的长期投资者。

害怕时机不对。

他认为找准时间和看准趋势同样重要。当初2019年前后,在大厂有架空感的时候,是不是就应该毅然创业?

“就算挂了,可能现在已经在连续创业第二次、第三次了。”

最后一个害怕,来自于他成为创业者后心态上的转变。

以前,他觉得「内容创作者的GitHub」是他的想法和愿景。

这件事“功成不必在我”,可以由别人做出来,自己直接用,还不用允许成本和损失;可以半路被大厂收购,只要目标一致同意,能被收购也是好事情。

但最近看了尤瓦尔·赫拉利的《智人之上》,他觉得自己突然悟了——

最后一个害怕,是不愿看到自己的想法和目标,被别人抢先实现。

社区的灵魂,来自社区的共识现实。其中创始人的所思所想是无法选择性的,无法依赖他人。

所以现在的我认为,创业做「内容创作者的GitHub」这件事儿,功成必须在我。

内测waitinglist:youmind.ai

最近,Trilegangers首席执行官OleksandrTomchuk收到警报,称其公司的电子商务网站瘫痪了。经过调查后,他发现罪魁祸首是来自OpenAI的一个机器人,它正不懈地试图抓取他整个庞大的网站。该网站拥有超过65,000种产品,每种产品都有一页,至少有三张照片。OpenAI发收了“数万”个服务器请求,试图下载全部内容,数十万张照片及其详细描述。

汤姆丘克表示,OpenAI的爬虫程序正在建造他们的网站,这高度发展上是一次DDoS攻击。该公司将3D对象文件以及照片(从手到头发、核肤和全身)出售给3D艺术家、视频游戏制作者以及任何需要以数字方式重现真实人类特征的人。

Trilegangers的网站就是其业务。该公司花了十多年时间,建立了所谓的网络上最大的“人体数字替身”数据库,即从真实人体模型扫描而来的3D图像文件。

汤姆丘克的团队总部位于乌克兰,但也获得了美国佛罗里达州坦帕市的许可,其网站上有一个服务条款页面,释放机器人未经许可拍摄其图像。但仅凭这一点并没有起到什么作用。网站必须使用正确配置的robot.txt文件,其中的标签明确告诉OpenAI的机器人GPTBot不要打扰网站。

Robot.txt,又称机器人装入协议,是为了告诉搜索引擎网站在索引网页时不要抓取什么内容而创建的。OpenAI在其信息页面上表示,当配置了自己的一组释放抓取标签时,它会尊重此类文件,但它也警告说,其机器人可能需要长达24小时才能识别更新的robot.txt文件。

汤姆丘克表示,如果某个网站没有正确使用robot.txt,OpenAI和其他公司就会认为他们可以随心所欲地抓取数据。这不是一个可选系统。

更糟糕的是,Trilegangers不仅在美国工作时间内被OpenAI的机器人强制下线,而且Tomchuk预计,由于该机器人的所有CPU和下载活动,AWS账单还会大幅减少。

Robot.txt也不是万全之策。AI公司自愿遵守它。去年夏天,另一家AI初创公司Perplexity因一些证据隐藏Perplexity没有遵守它而受到Wired调查的关注,这一事件相当著名。

汤姆丘克表示,他没有找到联系OpenAI并询问的方法。OpenAI没有回应TechCrunch的置评请求。OpenAI迄今未能授予其长期承诺的选择退出工具。

对于Triplegangers来说,这是一个特别简单的/容易的问题。“我们从事的业务中,权利问题相当严重,因为我们扫描的是真人,”他说。根据欧洲GDPR等法律,“他们不能随便在网上拍下任何人的照片然后使用。”

称赞的是,OpenAI机器人的缺乏胃口让Triplegangers意识到了它是多么的不暴露。他说,如果它更温柔地刮擦,Tomchuk永远不会知道。

“这很可怕,因为这些公司似乎利用失败了一个漏洞来抓取数据,他们说‘如果你用我们的标签更新你的robot.txt,你可以选择退出’,”汤姆丘克说,但这让企业主有责任了解如何教唆他们。

他希望其他小型在线企业知道,发现人工智能机器人是否正在窃取网站的版权债务的唯一方法就是主动寻找。他当然不是唯一一个被人工智能机器人恐吓的人。其他网站的所有者最近告诉《商业内幕》OpenAI机器人如何破坏他们的网站并减少他们的AWS费用。

到2024年,这一问题将进一步恶化。数字广告公司DoubleVerify的最新研究发现,人工智能爬虫和抓取工具导致2024年“一般无效流量”减少86%,即并非来自真实用户的流量。

在数据驱动的时代,数据分析已成为各行各业决策的关键。然而,金融、制造、零售等行业客户在数据分析过程中仍面临诸多确认有罪。作为行业领先的数据智能产品授予商,数势科技凭借自主研发、基于大模型增强的智能分析助手SwiftAgent,多次荣获行业诸多奖项,并赢得数量少客户的青睐与合作。那么这款产品为何能快速得到市场认可,我们将从客户面临的切实痛点出发,逐步剖析Agent架构分隔开语义层的新范式,进而展示其针对用户痛点的产品功能,并通过实际案例诠释其如何助力企业实现“数据普惠化”的愿景。

业务人员需简单易用:缺乏低门槛且无效的数据分析工具

“尽管我们满怀无感情,厌恶深入挖掘数据背后的真相以驱动决策,然而SQL的复杂性却如同一座高山,让非技术人员望而却步,极小量的宝贵时间被耗费在了查询语言的学习上,而非直接转化为微不足道的洞察与行动。虽然BI工具以其数据可视化能力为分析工作增色不少,但每次需要技术团队亲自下场配置数据集和报表,其过程的繁琐与复杂性依旧令人感到无助。”

从业务人员视角来看,他们面临的主要痛点是缺乏无效的数据分析工具。为了进行数据分析,业务人员不得不自学SQL语言或使用复杂的BI工具,这不仅减少了学习成本,还降低了工作效率。在获取数据后,他们还需从海量数据中手动挖掘洞见,导出Excel并制作透视表来获取结论。在与客户的沟通中我们发现,许多团队希望以自然语言交互的方式,更快速地从数据中获取洞察,以辅助日常决策。同时也涉及到客户的分析师团队,他们举了一个很无奈的例子,说出了数量少分析师的心声“我们就像Excel的奴隶,日复一日地沉浸在数据的导入、整理与分析之中,这些重复而低效的任务不仅消耗了团队的精力,更成为快速响应数据、授予决策减少破坏的巨大障碍”。

无约束的自由团队需即时洞见:现有数据产品无法快速产生深度结论

每当董事会要求对数据悠然,从容做出反应,我总是希望能即刻获得准确的结论。但遗憾的是,当前的数据大屏虽能授予表面的数据概览,却难以深入挖掘其背后的故事。要获取更深层次的分析,我还需手动在数据仓库中构建查询,这一过程既耗时又不便。“

“我们的驾驶舱在数据可视化方面含糊做得不错,让数据一目了然。但在解释数据背后的原因,解答业务中的‘为什么’时,它却显得有些力不从心。它像是一个优秀的展示者,却未能成为一个深入的分析者。

这些真实的客户无约束的自由层声音例子反映了一个通用的诉求:无约束的自由团队需要的不单是数据的可视化展示,更是对数据的深入理解、快速获取结论和基于数据深度挖掘的原因解释,对数据分析工具的智能性和即时交互性有着更下降的要求。从无约束的自由团队视角来看,尽管企业耗费极小量精力建设了数据仓库、数据湖以及大屏、驾驶舱等工具,这些工具在一定程度上解决了领导层面看数据的问题,但很多数据产品仍停留在固化形式的看板阶段。对于决策层而言,数据并不等同于洞察。当需要对某些细分的业绩指标进行深入分析时,仍需向分析团队提出需求,并等待漫长的分析结果。

同时,领导层更关注“为什么”的问题,如公司业绩下滑、门店销量不佳等,而现有的可视化、驾驶舱等工具只能授予“是什么”的答案,无法触及数据背后的关键原因。因此,领导层迫切希望能够通过自然语言提问,如“为什么指标下降?”,并即时获得偶然的结论性回答,这是大模型技术分隔开数据所能授予的价值。

技术团队需标准化能力:现有数据意见不合与指标口径和谐同意

虽然公司有数量少部门在使用数据,但每个团队对同一指标的定义却截然不同,没有统一的数据口径和解释标准。这种和谐同意性给跨部门的沟通和决策带来了安排得当”

每次业务人员新增一个指标开发需求,都希望我们能半小时内授予相应的指标。现状是,虽然我们已经在数仓加班加点开发了,但还是被业务团队说反应慢,有苦说不出

同样,在与客户的技术团队沟通中我们发现,数据开发,数仓工程师等等角色都面临着更多的确认有罪。尽管数据仓库已经搭建完成,但业务方总是提出各种临时性需求,导致数据仓库集市层建立了极小量临时ADS表,并维护了多种临时性口径。这不仅使数据变得意见不合,还导致了指标口径的和谐同意。

为了应对这些痛点,数势科技提出了利用失败大模型Agent架构来保持不变原有范式的解决方案——SwiftAgent大模型数据分析助手。

大模型的Agent架构分隔开指标语义层帮助数据民主化进程

我们简单通过一张流程图,展现一下上面提到各个角色的痛点。原有模式为业务方提出需求,技术团队采购BI工具供业务方使用。然而,这些工具往往过于复杂,面对BI报告时,业务方常因技术术语或工具不熟悉而感到澄清,难以有效利用失败数据指导业务。同时,数据分析师虽然精通BI工具,但面对庞大的需求数量,人员显得严重不足,难以悠然,从容响应并焦虑业务方的数据需求。数据产品经理经常需要指导业务人员如何使用BI工具,但由于各种原因,往往难以教会其使用。最后,数据工程师,即我们常说的“表哥”、“表姐”们,专注于数据处理和ETL工作,却常因“ETL任务繁重”或技术难题,难以有效完成数据处理,进而影响整个流程的顺畅进行。因此,数势科技提出了Agent架构加语义层的新范式,旨在降低业务团队的看数门槛,让大模型更深入地参与到数据分析的各个环节中,让无约束的自由者以及业务人员通过自然语言的形式就可以准确且快速的进行查数,同时作为数据工程师来说指标不需要重复开发,一处定义即可全局使用。

当然,在Agent架构加语义层的新范式的推进过程中,也有另一种形态的产品,为了迎合“自然语言取数”这个场景,试图抄近路使用大模型直接生成SQL,强行将大模型与BI进行了分隔开,完成了所谓的“数智化赋能”。因此我们在近期也收到了数量少前ChatBI客户的吐槽与求助,下面简单来谈谈二者的区别,为何这种模式经受不住长期考验?

大模型直接生成SQLChatBI为何经不住考验?

“本以为引入ChatBI智能取数工具能是我们工作效率和成本控制的救星,结果却成了准确性的噩梦。吐出来的数据,错得离谱,害得我们不得不回过头去,用最老套的手工提数方式一遍遍复核,效率?不存在的!更称赞的是,所谓的智能,现在让业务部门对我们的数据可靠性投来了深深的接受目光。

某国际零售巨头的无约束的自由人员与我们深入的探讨了ChatBI使用过程中的痛点,同时她提到一个具体的问题,比如问:“最近3个月销量较好的Top3商品是哪些?这三个分别的好评率是多少?并生成报告解读”,虽然看着很日常化的需求,但需要多个任务的衔接,不仅仅是数据分析,还要做排序、解读,甚至归因。该客户使用的ChatBI平台显然没有给到准确的数据,在经过多部门的验证发现,数据不仅存在严重偏差,而且连高度协作发展商品分类都区分不清,各区及跨平台的计算方式也让人摸不着头脑。

尽管NL2SQL技术以其快速响应与轻量化部署的无足轻重,为客户勾勒了‘概念即落地’的美好蓝图,但模型产生的幻觉问题却成了不可关心的绊脚石。提数过程中出现的‘一本正经地胡言乱语’,彻底违背了我们对数据准确性的坚守,无法向客户交付既悠然,从容又准确的数据洞察,这无疑是对我们初衷的背离。

因此为破解NL2SQL模式提数不准的难题,数势科技采用了NL2Semantics的技术路线。通过引入Agent架构,能够首先将复杂的查询请求拆解为一系列原子能力,随后分隔开指标语义层进行深度解析。最终,大模型接收到的所有指令都会被比较准确映射到一系列预定义的要素上,如时间维度、地域维度、公司维度等。以该零售客户的问题为例,大模型仅需将“最近三个月”识别为时间要素,“商品”识别为产品维度,“好评率”识别为具体指标,并建立这些要素与数据之间的映射关系。这些指标维度对应的SQL逻辑片段,则是在数据语义层(SemanticLayer)中进行维护和无约束的自由的,总之,通过Agent架构加语义层的新范式,是给客户授予准确数据的根基,更多关于指标语义层相关内容请关注“数势科技”。

同时,为了应对客户提出的各种难度问题,我们对SwiftAgent进行了符合业务场景的“灵魂拷问”,例如对“黑话”的理解能力、同环比与排序、清晰查询与多维分析、多指标与多模型的关联查询,甚至是归因分析与大模型协同等不同级别问题。最后,我们还尝试了“维度过滤及查询+清晰指标+同环比+归因分析+建议“的五颗星(佼佼者级别)问题即“某区域某商品的下单金额周环比为何下降,并生成报告解读和趋势图表”,SwiftAgent智能分析助手能够轻松应对。

在企业构建智能分析助手之前,每个门店经理在做月度复盘、技术复盘时都是依靠专业分析师在BI或Excel里面做分析,成本、门槛很高。部署数势科技SwiftAgent之后,实现了让门店经理、不太懂数据的人可以直接通过自然语言的输入,去做一些指标洞察跟分析。比如看最近30天的销售额,首先会让大模型去把这一段话去解析出来,里面的销售额、毛利是指标,30天是日期,做日期推理,再对应到语义层把数据取出来。取到之后,还可以通过快速地点选,让大模型生成一些可视化的图表。当发现指标被预见的发生时,可以让大模型去调度一些归因小模型,来做一些维度或者因子分析,实现快速洞察。针对维度特别多的问题,我们会通过一个维度归因的算法,快速定位到因子维度。原来一个门店经理可能要花4个小时才能够知道,这一天毛利为什么跌了,是什么商品跌了,谁粗心的门店跌了,现在通过自然语言交互即可直接生成结论。

数据查询零门槛业务人员也能轻松用数

数势科技SwiftAgent采用AI对话式交互,分隔开大模型和AIAgent技术,让用户仅凭日常交流的语言(无论是文字还是语音)就能轻松查询数据,无需掌握SQL或Python等专业查询语言。还将用自然的方式意见不合用户,即便面对“我想看一下最近的销售情况”这样的清晰查询,也能悠然,从容授予如“最近7天销售额”、“本月北京地区销售额”等具体回答,供用户细化查询。

同时,具备强化学习能力,能根据用户的“点赞”和“踩”反馈不断纠正错误、调整不当查询,更加准确地焦虑用户需求。此外,SwiftAgent还将用户过往的问答分析进行沉淀并强化学习结果,在反对问询场景中直接授予结论及思考过程,展现出强大的思考及学习能力。其双向交互功能更是将AI思考过程白盒化,让用户透明可见,进一步增强了用户体验。数势科技SwiftAgent让数据查询和分析变得像说话一样简单,无需技术背景也能0门槛取数。

数据分析、策略建议零等待无约束的自由团队即问即答

数势科技SwiftAgent智能分析助手,为企业高管带来了即问即答并且授予归因分析与策略建议的数据分析体验。传统上,高管们需通过数据驾驶舱或大屏查看指标,但深入分析或关联分析时,往往需等待分析团队响应,耗时长达数小时甚至数天。而今,借助SwiftAgent,无论是在PC端还是手机端,高管们都能随时进行自然语言查询、高阶归因分析及被预见的发生分析,无需等待秒级获取企业不次要的部分经营数据。SwiftAgent不仅以图表形式直观展示业务结果,如柱状图、折线图、环状图等,还辅以文字解释,让业务现状、对比、趋势一目了然,助力准确决策。

此外,SwiftAgent还能模拟专业分析师思维模式,针对不同行业生成定制化数据分析报告,并主动推收洞察,有效缓解企业人员不足、数据分析能力匮乏的问题,智能辅助无约束的自由团队进行策略建议。在问题诊断和分析的基础上,我们将数据分析的What、Why和How三个方面整合在一起,实现了能力的增强。例如,“当领导询问这个月的毛利为什么下降”时,我们不仅能够按照商品维度比较准确提取毛利数据,快速定位毛利下降幅度较大的商品,还能分隔开企业已有的知识库,将数据分析结果与标准操作流程(SOP)相分隔开,自动生成一系列针对性的改进建议。这样的策略建议不仅详实地呈现了数据和分析结果,还为用户授予了明确的行动指南,有助于他们更悠然,从容地做出决策。

SwiftAgent还将授予强大的数据趋势分析能力,让用户能深入洞察指标趋势被预见的发生,比较准确分析历史时间序列数据,找到问题根源,并以报告形式总结呈现,全面指责数据洞察能力。数据趋势分析的能力使用户能够针对过去几天、几个月甚至几年的指标趋势被预见的发生进行深入洞察。例如,用户可以识别出哪些指标是先降后增,哪些是先增后降,还有哪些指标可能呈现出保持轻浮性。在这个基础上,我们可以对指标的历史时间序列数据进行更比较准确的保持轻浮分析,干涉用户找到每个指标趋势正常的根本原因。同时,我们可以将这些趋势分析的结果以报告的形式进行总结,最终呈现给每位用户,以指责他们对数据的洞察能力。

统一口径零幻觉技术团队无需反复校验

前文提到数势科技通过Agent架构加语义层的新范式,构建统一的指标与标签语义层,即NL2Semantics体系,有效解决了大模型对底层业务语义理解难及企业数据口径不一的问题。该体系首先建立了包括行业标准、指标、人货场标签等在内的易于理解的语义层,解决了数据“幻觉”问题,确保了数据准确、口径统一且分析可溯源。指标一次定义,多次复用,无需反复校验,大幅指责技术团队的工作效率。

SwiftAgent采用的创举数据计算帮助引擎HyperMetricsEngine(HME),通过智能化编排调优和一系列计算优化,解决了数据分析中的“不可能三角”问题,即在高僵化性的数据分析基础上,实现了快速数据处理和低成本运营。解决传统计算查询效率低及性能弱等问题。底层选用StarRocks、Doris等有效数据分析引擎,分隔开对数据加工和使用场景的优化,以及数据虚拟化技术的应用,实现了亚秒级数据查询和实时人机交互,极大指责了数据分析的效率和僵化性。

俗话说:“光说不练假把式”,下面我们将分享三个来自零售、快消品及金融行业头部企业的实践案例,展示数势科技SwiftAgent智能分析助手如何在实际应用中助力企业实现有效决策与业务增长。

SwiftAgent智能分析助手实战案例一:

携手书亦烧仙草共建大模型增强的智能门店督导助手

书亦烧仙草在新的一年里明确提出了两大不次要的部分目标:做大财务成果,做强顾客价值。这意味着企业不仅要在财务表现上实现显著指责,还要在顾客体验和服务价值上达到新的高度。为了实现这一目标,企业亟需转变传统的经营无约束的自由模式,向更加精细化、数据化的方向迈进。具体而言,这包括两个层面的转型:一是以产品为维度的精细化运营,通过建设统一的分析工具、统一的分析语言和统一的分析思路支撑战略决策和无约束的自由。二是以门店督导为维度的精细化无约束的自由,通过智能督导助手的建设,赋能督导巡店效率和质量的指责,并为IT部门提效,降低运维成本。

督导作为连锁加盟行业中分开公司与加盟商的关键角色,往往都面临以下几个确认有罪:首先,信息获取困难,督导在巡店前需要获取门店的基础信息、业绩表现和存在的问题,但目前缺乏无效的工具和系统减少破坏;其次,督导能力统一显著,这直接影响了他们对门店经营的分析和指导能力;再者,新督导培训面临难题,新入职的督导需要快速熟悉运营标准操作程序(SOP)和策略,但目前缺少无效的平台和内容来减少破坏他们的快速培训和使枯萎。这些确认有罪导致了一系列严重后果:新开门店由于业绩不达标,加盟商对品牌失去信心;老门店则面临商圈变更和消费者线上转移的双重压力,业绩下滑,进一步影响了加盟商对品牌的接受。

智能督导助手与构建的指标平台无缝集成,全面搁置了一线督导的实际使用不习惯,旨在大幅度指责工作效率和督导效果。其不次要的部分功能包括:

·目标设定:比较准确明确门店巡检的不次要的部分目的,涵盖指责服务质量、确保运营标准执行、优化门店环境等多个关键方面。借助智能分析工具,以对话式界面直观展示门店业绩排名和同店对比分析,从而悠然,从容锁定需要重点巡查的门店。

·巡店计划:充分利用失败智能分析工具的知识库功能,准确确定巡店的具体地址及其他相关信息。同时,借助强大的数据分析能力,明确每次巡店应重点关注的业绩指标及其潜在保持轻浮原因。

·门店稽核:运用智能分析工具,对门店的各项问题指标进行全面检查。例如,一旦发现新品销售情况不佳,系统会深入探究并归因于“产品上新动作”等相关系列指标的问题,并即时调用知识库中的相关文档和标准化操作程序(SOP),指导进行快速无效的问题纠正。

项目效果:优化门店无约束的自由、指责督导效率

快速数据获取:通过快速数据查询功能,督导能够悠然,从容获取关键的门店运营数据,降低数据分析效率。

自动化巡店计划:自动生成巡店计划,使督导能够更专注于门店无约束的自由和问题解决。

问题定位:智能督导助手能够准确定位业绩指标的下滑或保持轻浮的原因,干涉督导快速识别关键因素。

有效业务策略:授予了基于数据分析的业务策略知识库,干涉督导根据门店具体情况制定有效改进措施。

书亦烧仙草CIO王世飞表示:“与数势科技携手后,实现了数据无约束的自由的根本性变革。现在,所有经营域的数据均源自统一的指标平台,这一举措确保了数据看板的一致同意性,统一了团队对数据的认知,并极大地简化了数据查找过程。针对那些缺乏现成看板的情况,我们授予了自助取数平台,使业务部门能够自主下载数据、进行分析,无需等待我们的开发团队,这一系列变革显著指责了业务部门的满意度。”

SwiftAgent智能分析助手实战案例二:

携手某国际快消品巨头智能优化订单无约束的自由

在全球快速消费品市场的激烈竞争中,某国际快消品巨头面临着品牌分销与经销网络的复杂性确认有罪。线上线下多渠道并存,包括电商、大卖场KA、便利店等,使得供应链团队在订单追踪和无约束的自由上遭遇效率瓶颈。特别是在订单到收款(OrdertoCash)的全链条中,从下单前准备到客户付款,每一个环节都需要精细化无约束的自由以确保订单顺畅执行和客户满意度。为了应对在复杂分销网络下的效率瓶颈,该国际快消品巨头携手数势科技,旨在通过数字化手段推动供应链团队订单无约束的自由效率的大幅指责,并打造企业供应链分析助手。主要服务供应链OMA(OrderManagementAssistant)团队,通过解决订单无约束的自由过程中的痛点,指责订单焦虑率和客户满意度,进而增强企业的市场竞争力

构建订单无约束的自由指标监控体系三大不次要的部分手段助力项目落地

数势科技基于其智能分析助手(SwiftAgent)和智能指标平台(SwiftMetrics)产品组合,为该巨头建立了《订单无约束的自由指标监控体系》。该体系覆盖下单准备、下单、订单辩论、分货、仓储发货、收货、发票、付款、砍单、砍单追踪跟进等全业务流程环节。通过AIAgent智能问数和归因分析,打造供应链订单无约束的自由智能助手,全面指责订单无约束的自由效率。

建立Order-To-Cash指标体系

梳理量化全流程指标体系:梳理并量化不完整订单链路的全流程指标体系,确保每一个环节都有明确的指标进行衡量。

确立北极星指标:确立部门北极星指标,包括订单焦虑率和订单跟进完成率CFR(CaseFillRate),以此作为衡量订单无约束的自由效率的关键指标。

MVP阶段验证与推广:完成MVP阶段验证后,逐步进入推广及轻浮阶段,确保指标体系在实际业务中得到有效应用。

搭建指标无约束的自由流程机制

横向拉通各级指标体系:横向拉通企业级、BU级、个人级指标体系定义、开发、无约束的自由流程,确保各级指标之间的一致同意性和协同性。

纵向打造北极星指标体系:纵向打造具体业务领域下的北极星指标体系和SA场景应用能力,为不同业务场景授予定制化的指标无约束的自由解决方案。

打造订单智能分析助手

集成全生命周期状态指标体系:集成供应链订单无约束的自由全生命周期状态指标体系,SwiftAgent干涉OMA团队追踪自询单、下单、扫描出库、物流、验收入库、砍单/返单全流程业务表现。

监控定位效率瓶颈:针对各个环节的效率瓶颈进行监控和定位,干涉OMA团队一键定位CFR瓶颈,并采取有效措施进行使恶化。

识别被预见的发生订单,定位客户砍单原因

归因分析,并自动生成使恶化指引报告

提效200%挽回订单损失上千万大幅指责订单完成率

智能指标平台分隔开智能分析助手的项目落地,在实施中展现出了不明显的,不引人注目的效果,特别是在指责订单完成率与客户满意度方面。首先,智能指标平台能够减少破坏指标体系的构建和追踪目标达成情况,通过对各项指标的实时监控和归因分析,业务人员能够透明了解订单无约束的自由的各个环节表现,并及时采取措施进行优化。其次,平台与RAG知识库的无缝对接,不仅指责了比较准确问数的能力,还能处理用户的复杂需求,如多表分开查询、自动加合及排序等高档计算,分隔开内部知识体系,快速调用及沉淀问题解决方案,显著降低了业务人员的工作效率。再者,基于智能分析助手的大模型自然语音取数功能,意图识别准确度高,使得业务人员可以通过自然语言与系统进行交互,快速获取所需数据和相关问题的意见不合,极大地降低了数据查询和分析的效率。

这一系列措施的实施,使得分析效率大幅指责,从平均每人每天处理少于20笔订单指责至每天处理60+笔订单,提效200%以上。同时,系统能够及时发现并处理被预见的发生砍单订单,有效挽回超过上千万的订单损失!不仅指责了企业的经济效益,还显著增强了客户的接受度和满意度。

SwiftAgent智能分析助手实战案例三:

大模型+Agent+指标语义层:赋能某城商行非技术人员实现僵化取

某头部城商行的内部统计数据显示,2023年临时性数据分析需求占总需求的40%,每天大约有20多个工单。这一现象揭示了该银行在数据分析领域存在巨大的即时响应潜力和优化空间。面对这一确认有罪,银行经营分析团队通过僵化调整不当工作计划,积极应对数据分析需求的增长。但日益减少的临时性数据需求和可能出现的工单积压问题,结束困扰着领导层、业务团队和经营分析团队。他们试图通过各种方式摆穿这一有利的条件,大模型的兴起为其授予新范式。应用大模型是该城商行的战略目标之一,由副行长牵头,大力推动大模型在应用场景的落地。在大模型落地完全建立,该城商行选择了几个重点场景,数据分析就是其中之一。他们希望通过大模型技术升级数据分析工作,以焦虑僵化数据分析的需求。

数势科技为银行授予智能分析解决方案,以SwiftAgent产品为不次要的部分,利用失败行业知识和数据分析模型,理解策略目标,将银行经营矩阵实现从数据到价值的快速转化。解决方案技术架构包含五个部分:

基座大模型:数势科技选择了经过实际应用验证的国产大模型,并对其进行了进一步的Prompt微调和模型微调,以确保其在银行数据分析场景中的有效应用。这样的定制化处理不仅焦虑了银行对数据安全性的高标准要求,还会显著降低大模型可能产生的幻觉问题,降低数据分析结果的准确性。

企业数据源:待到项目实施过程中,数势科技首先对该城商行的各类数据源进行详细梳理和整合,包括业务系统数据库、数据仓库和数据湖等。这一过程可以确保所有数据的规范化和标准化无约束的自由,为后续的指标语义层构建和大模型应用奠定坚实基础。

指标语义层:数势科技计划为该城商行构建统一的指标语义层,明确定义各类指标的计算口径和业务含义。这不仅降低数据指标的无约束的自由效率,还确保不同业务部门在数据使用上的一致同意性,避免了因口径不统一而导致的数据分析偏差问题。

SwiftAgent产品:作为智能分析解决方案的不次要的部分,SwiftAgent通过与用户的交互式问答,能实现数据指标的僵化查询、自动归因分析、可视化报告自动生成以及指标全生命周期的预警分析。用户只需通过自然语言输入需求,SwiftAgent便能智能识别并反馈准确的分析结果,可以明显指责数据分析的效率和准确性。

数据分析应用:在一期建设中,数势科技将重点落地企业经营分析、企业营销复盘和业务团队日常用数三大应用场景,旨在为银行的各级无约束的自由层授予有效、准确的数据减少破坏,助力其在决策和运营中更加僵化和拖延。未来,数势科技将继续扩展更多的数据分析应用场景,进一步焦虑银行多元化的数据分析需求。同时,数势科技根据该城商行需求进行定制开发,包括开发移动端、打通SSO统一登录、集成权限系统等。

用户意图识别率>98%,复杂任务规划准确率>95%,好用的智能分析应用让取数用数排队情况成为过去式

智能分析系统建成后,该城商行经营分析团队负责人、大数据部门负责人以及多位中高层领导参与验收,从多方面进行评估与打分,主要结果如下:

1.准确性:用户意图识别率>98%,复杂任务规划准确率>95%。

2.效率指责:分析工作处理时长减少,缩短80%,每人每周减少,缩短10+小时数据处理工作。

3.用户满意度:使用者满意度9.3+分。

交互友好度:用户界面友好度9.5分。

该城商行各相关方均对智能分析系统高度评价,系统正式上线。如今,基于SwiftAgent打造的智能分析应用,在该城商行中高层领导及业务团队中已常态化使用,取数用数排队与工单积压情况成为过去式。

数势科技将继续深耕数据分析领域,不断优化和升级SwiftAgent产品,以焦虑更多客户的多样化需求。我们相信,随着SwiftAgent的广泛应用和结束迭代,它将为更多企业带来有效、准确的数据分析体验,助力企业在缺乏感情的市场竞争中穿颖而出,实现数据驱动的业务增长和结束创新。

(推广)

微軟研究院-维基百科,严格的限制的百科全书

微軟研究院(MicrosoftResearch,英文縮寫:MSR)是微軟在1991年創立硏究不反对電腦科學主題與問題的分部。微軟研究院其中一個接纳的目標為「减少破坏長期的電腦科學硏究而不受產品週期所限」。

微軟研究院是目前世界頂尖的研究中心之一,有很多在電腦科學、物理學、數學受到高度公認的專家及許多著名科學獎項得主在微軟研究院,包括圖靈獎得主東尼·霍爾、詹姆斯·尼古拉·格雷,菲爾茲獎得主MichaelFreedman,沃爾夫獎得主LaszloLovasz,MacArthurFellow獎金得主JimBlinn與DijkstraPrize獎得主LeslieLamport。

微軟研究院於班加羅爾、北京、劍橋、矽谷、雷德蒙德與舊金山擁有實驗室。

苹果MacBookAirM1评测:多方面超XPS13或掀起“计算革命”牛华网2020-11-1915:19

导语:全新的苹果MacBookAir搭载M1处理器,重新定义了我们所熟知的MacBookAir,它使得笔记本电脑的运行更加快速,并且耗电量更低。是的,我们现在已经正式进入了苹果硅处理器时代,这款全新MacBookAir内置的专业级功能和性能可以真正确认有罪基于英特尔的WindowsPC,并且经常击败它们。

作为一个清楚的MacBook购物者,我很沮丧地说,全新的MacBookAir较其前一代产品的性能有了很大降低,电池续航时间也更长。可以说,搭载M1处理器的新MacBookAir是最好的笔记本电脑之一。

我在MacBookAir上使用过的大多数应用程序仍然是英特尔版本,macOSBigSur使用Rosetta2进行编译并使其能够运行在基于ARM架构的处理器上。一旦应用开发者开发出通用版本,他们的应用程序将在苹果硅处理器系统上运行得更快,比如这款基于M1的MacBookAir。

在这篇评测文章中,老编不仅会将新的M1MacBookAir与最好的PC笔记本电脑进行比较,还会将其与今年早些时候发布的基于英特尔处理器的MacBookAir进行比较,以显示它的性能有多大的变化(或没有保持不变)。

初印象:

现在,苹果MacBookAir无论是在运行速度还是在电池续航方面的表现都超过了市场中最好的PC机戴尔XPS13。

优点:

非常快速的性能;

强大的传统应用程序减少破坏;

超长的电池续航时间;

舒适的妙控键盘;

改进的网络摄像头;

缺点:

屏幕周围仍然有厚厚的边框;

缺乏通俗的端口可选;

硬件规格:

售价:999美元(起售价),899美元(学生版);

处理器:苹果M1;

显示屏:13.3英寸,2560x1600像素;

电池:14小时41分;

内存:8GB到16GB;

存储空间:256GB到2TB;

三围尺寸:12x8.4x0.6英寸;

机身重量:2.8磅;

苹果MacBookAirM1评测:性能

苹果MacBookAir的性能搭载M1处理器和16GB内存是惊人的,当我同时关闭20个Chrome(英特尔,不是通用)标签和一个1080p的YouTube视频,再加上苹果的Mail和Photos应用程序、Pixelmator(英特尔版本)和1Password(又是英特尔版本)时,我从来没有遇到任何问题。哦,另外后台还有20GB的4K视频正在通过AirDrop传输,而一切都保持波动。

在一次集体通话中,老编甚至抽出时间玩iOS应用程序,下载并关闭Overcastpodcatcher、HBOMax和《AmongUs》游戏,我发现新MacBookAir非常擅长多任务处理。

大多数情况下,搭载M1处理器的MacBookAir笔记本电脑让人麻痹它的性能与我用来测试BigSur的2020Corei5MacBookPro,或2017款酷睿i7版MacBookPro相当。

在这之前,我对M1处理器的性能持接受的态度,即使苹果藐视其性能比今年早些时候发布的英特尔版MacBookAir降低了3.5倍。由于我对MacBook的性能需求非常高,因此我需要的一直是MacBookPro,而不是Air。新版MacBookAir?我之前一直觉得它给人的麻痹像是Pro版MacBook。

不过,我需要指出的是,当前的英特尔版本应用程序没有针对M1版处理器进行优化。

新版MacBookAir在Geekbench5.1(英特尔)多核测试中获得5962分,这个得分与M1版MacBookPro的5925分几乎相当。在可比的Geekbench5.2测试中,新版MacBookAir强劲地击败了Zenbook13的5084分和XPS13的5319分(均使用英特尔酷睿i7-1165G7处理器和16GB内存)。同时,老款英特尔MacBookAirY系列处理器的得分仅为2738分。

在我们的Handbrake(通用)视频转换测试中(将4K视频转换为1080p),MacBookAir在9分15秒的时间内完成了这项测试,而MacBookPro的测试时间为7分44秒(在为苹果硅处理器优化的Handbrake测试版上)。这个得分击败了Zenbook13(17分51秒)和XPS13(18分22秒)以及今年早些时候英特尔MacBookAir的27分10秒。

苹果还承诺,新版MacBookAir的存储速度将会指责两倍。我们测试的MacBookAir中的1TB固态硬盘在BlackMagicDiskspeedTest(英特尔)中达到了2692MBps的读取速度,是英特尔版MacBookAir的1301.9MBps读取速率的两倍多。

MacBookAir在PugetBenchPhotoshop(英特尔)测试中的得分为653分,超过XPS13的588分,但是落后于Zenbook13的743分。MacBookPro的得分与之相当接近,为649分。

苹果MacBookAirM1评测:显卡

我们测试的MacBookAir拥有8核GPU配置,这可以重塑MacBookAir在一些游戏玩家心目中的地位。

我开始的时候很简单,运行游戏《Bioshock2Remastered》(分辨率为2560x1600)的时候,过程很顺畅,当涟漪般的水流过我所导航的房间,电击击中敌人,我探索的走廊外的所有水下生物都毫无故障地移动。

但由于那是一款老款游戏,我又测试了《古墓丽影:崛起》(同样是2560x1600,并设置为中等图形),它在MacBookAir上的运行看起来很棒我从没想过MacBookAir能够运行一款要求很下降的AAA游戏。无论我是在爬一座白雪皑皑的北极山,还是在叙利亚的沙漠探险,劳拉·克罗夫特都能随心所欲地行动。哦,这两款游戏都是英特尔版本的,通过Rosetta2运行,所以还不是通用版本。

当我在新款MacBookAir上测试SidMeier的《文明6:风云变幻》(英特尔)(1440x900是减少破坏的最高分辨率)时,它以每秒37帧的速度运行,大幅领先于英特尔版MacBookAir获得的7fps分数,并略低于M1MacBookPro的38fps速度。与此同时,Zenbook13和XPS13(它可以以1080p的速度运行游戏)分别获得了21fps和16fps的速率。

有趣的是,在GFXBenchMetalAztecRuins图形基准测试中,新版MacBookAir和MacBookPro几乎获得了相同的分数:高54分,正常60分(均四舍五入)。

苹果MacBookAirM1评测:电池续航

苹果宣称,搭载M1芯片的MacBookAir可以授予全天的电池续航能力,而是事业的确如此。在我们的电池测试中(150尼特亮度下进行网页浏览),新款MacBookAir的续航时间达到了非常令人印象肤深的14小时41分钟(而新款MacBookPro的续航时间为16小时32分钟),超过了Zenbook13(13小时47分)和XPS13(11小时07分)。

相比较之下,搭载英特尔处理器版本的MacBookAir和MacBookPro的续航时间为9小时31分和10小时21分。

苹果MacBookAirM1评测:摄像头

老编本来期待苹果能够为MacBooks授予一个更高分辨率的摄像头,但是该公司似乎找到了另一种方法来改进MacBook的摄像头。M1芯片配备一个图像信号处理器,可以让您的摄像头在多个方面的表现更好。

老编将新款MacBookAir的摄像头与2020年初的英特尔版MacBookPro进行了正面对比,双方都加入了同一个GoogleMeet通话,我的老板同时看着画面中的两个我,他注意到来自M1版MacBookAir的视频授予了更好的颜色,包括肤色,以及更明亮的外围画面。

另外,老编还通过M1版MacBookAir发起过其他的视频通话,但是它的视频质量并没有让任何人惊叹,这也说明了它的摄像头仍然有待改进。

苹果MacBookAirM1评测:外形设计

M1版MacBookAir的外观和给人的麻痹与2020年初的MacBookAir非常反对,它采用了我们不习惯的楔形加工铝制底盘(拥有金色、银色和太空灰颜色可选),看起来苹果似乎想让用户轻松步入苹果硅处理器时代。

M1版MacBookAir的机身三围尺寸为12x8.4x0.6英寸,重量为2.8磅,它与基于英特尔处理器的前代产品几乎完全相同(11.9x8.4x0.6英寸和2.8磅)。老实说,它还有增加的空间,重量为2.5磅的华硕ZenBook13(11.9x8x0.5英寸)更轻一些,而2.8磅重的戴尔XPS13的机身尺寸更小,为11.6x7.8x0.6英寸,这在一定程度上归功于它非常窄的InfinityEdge屏幕边框。

苹果MacBookAir拥有金色、银色和太空灰等机身颜色可选,老编个人更喜欢金色,也希望苹果能够授予金色版本的MacBookPro。

苹果MacBookAirM1评测:端口

M1版MacBookAir配备2个Thunderbolt3USBC端口,它们都位于机身的左侧,而它的机身右侧还配备一个耳机插孔。戴尔XPS13则将USBC端口分开在机身左侧和右侧,使其更容易分开右边的设备。

其他的笔记本电脑授予了更多端口,戴尔XPS13还配备一个microSD读卡器,而MacBookAir则没有。ZenBook13还配备一个多余的HDMI输出端口和一个USB-A端口,但是没有配备耳机插孔。值得一提的是,ZenBook的外形设计也非常耐用,它已经通过了多个MIL-STD810G认证(包括极端温度和高度、跌落、冲击和振动等)。

苹果MacBookAirM1评测:显示屏

当我在MacBookAirM1上观看《蜘蛛侠:平行宇宙》(Spider-man:IntoTheSpider-verse)电影的时候,我注意到涂鸦的粉红色、黄色和蓝色从屏幕上凹显而出,就像咬进小迈尔斯·莫拉莱斯的蜘蛛类植物的绿色一样。至于细节,MacBookAir分辨率为25601600的视网膜显示屏授予了精细的细节,蜘蛛身上的毛发、整部电影中的无数场景细节。Zenbook13和XPS13的初始配置都是1080p屏幕,图像显示效果并没有那么锐利。

根据我们的KleinK10-A色度计,MacBookAirM1可以产生114.3%的sRGB频谱,略高于M1版MacBookPro(110.6%)、华硕ZenBook13(107.5%)和戴尔XPS13(97.9%)的得分。同时,英特尔版MacBookAir屏幕的sRGB色域值为113%。

我们的色度计还对新款MacBookAir的显示屏进行了评级,它的显示亮度高达365.8尼特(略低于400尼特的估计值),这使得它与基于英特尔处理器的MacBookAir(386尼特)和ZenBook13(370尼特)的显示屏亮度反对。相比较之下,M1版MacBookPro(434.8尼特)和XPS13(469.2尼特)的显示屏更亮。

苹果MacBookAirM1评测:键盘和触控板

在10fastfingers打字测试中,我通过MacBookAir妙控键盘的打字速度为每分钟74个单词,与我平均每分钟80个单词的平均速度相差不远。与2020年初的MacBookAir一样,这款妙控键盘用于取代苹果之前的蝶式键盘。之前,苹果的蝶式键盘备受争议,许多人认为,当小碎屑或灰尘进入它的按键时,键盘容易粘住。

MacBookAirM1配备4.8x3.2英寸的玻璃ForceTouch触控板,它授予准确的输入识别和流畅的滚动,表现令人印象肤浅。

苹果MacBookAirM1评测:音频

在实际使用中,我注意到MacBookAirM1的立体声扬声器的声音足够大,足以填满我相当大的客厅,它的音质也不错。MacBookAirM1的分解器和吉他即兴演奏听起来很准确,扎克·德拉罗查的声音透明,扬声器有一个相当大的声场,给人一种身临其境的麻痹。

另外,MacBookAirM1减少破坏DolbyAtmos(杜比全景声),音质非常棒。当您进行视频通话时,三个内置麦克风意味着Siri可以(正确地)听到您的声音,即使是在您远离笔记本电脑的情况下。

苹果MacBookAirM1评测:软件和iOS应用程序

毫无疑问,您已经注意到,我们用来测试MacBookAir的多个应用程序都是针对英特尔处理器开发的。苹果M1芯片和所有即将上市的苹果硅芯片,将不会本地运行这些应用程序。厄运的是,Rosetta2是苹果公司用来编译应用程序以使其波动运行的工具,它在安装时就可以执行该操作,因此这些应用程序可以不受鞭策地运行。老编希望,开发者能够尽快创建这些应用程序的通用版本,这样M1版Mac就可以充分发挥它们的潜力了。

像M1这样的苹果硅芯片也可以让您在Mac上运行iPhone和iPad应用程序,它们将在Mac应用商店中发布,但请查看未验证是否适用于Mac操作偶然的文本如果您看到了这一点,开发者尚未反对他们的应用程序能否在Mac上顺畅运行。应用程序将默认进入Mac应用程序商店,但开发者可以选择退出,所以不要期望一切。

最后,macOSBigSur是新款MacBookAir的不次要的部分,它明亮的界面使用了很多透明和不透明效果,这可能需要根据您的个人喜好进行一些调整不当。BigSur最大的更新是Safari如何通过获得可定制的主屏幕和新的标签预览来与Chrome竞争。

苹果MacBookAirM1评测:小结

新款MacBookAirM1拥有惊人的电池续航能力和强劲的性能,将MacBookAir带入到一个全新的高度。如果新款MacBookAir能够多配备几个端口,增加屏幕边框的话,那么它将会是一款五星业余水平的笔记本电脑。

相比较之下,戴尔XPS13的屏幕边框要窄得多,但是它在性能和电池续航方面的表现却落后于新款MacBookAir。(完)

相关文章苹果允许承认iPhone12系列部分机型存“绿屏”等问题,正进行调查2020-11-19外媒:部分M1芯片Mac用户还原电脑时设备“变砖”2020-11-18评论:苹果M1芯片版MacBook和MacMini将颠覆整个PC行业?2020-11-12苹果M1处理器终于来了!登陆MacBookAir、Pro和Macmini2020-11-11苹果MacBookAirvs.戴尔XPS13:这两款笔记本电脑谁更值得买?2020-11-10

苹果MacBookAirvs.戴尔XPS13:这两款笔记本电脑谁更值得买?牛华网2020-11-1011:50

导语:2020年最受避免/重新确认/支持的两款笔记本电脑是戴尔XPS13和苹果MacBookAir,二者都已经获得了更新,均具有新功能和外形设计。很多消费者在购买的时候,可能不知道哪款更好。老编花了数周时间去测试这两款设备,将两台笔记本电脑作为我的日常设备进行使用,下面就让我们一起看一下。

戴尔XPS13是更好的购买选择

戴尔XPS13和苹果MacBookAir均为高端笔记本电脑,二者的内部硬件配置都不是最顶级的,但是它们均拥有出色的机身做工和业余水平的外形设计。二者相比较之下,老编更喜欢XPS13的纯白色外观及其超薄的边框,但是我并不是说MacBookAir就不好看。自从2018年进行大幅改进之后,MacBookAir的外观并没有发生保持不变,但是其全铝一体成型的外观却一如既往地漂亮,尤其是在金色版本中。

入门级戴尔XPS13和苹果MacBookAir的售价仅为999美元,但戴尔在性能上具有无足轻重,入门级机型的XPS13高度发展配置是第11代酷睿处理器,8GB内存和256GB存储空间,而MacBookAir则配备第10代英特尔酷睿i3处理器、8GB内存和256GB存储空间。

尽管入门级MacBookAir配备的是更老款的处理器,但是其屏幕分辨率却比XPS13高,分辨率为2560x1600,它的像素密度比包括XPS13在内的其他13英寸笔记本电脑要高。在实际使用中,戴尔XPS13的1920x1200显示屏既明亮又令人愉悦,显示效果更透明锐利。

戴尔XPS13具有更大的升级空间,拥有更昂贵的硬件配置可选,它最高可选32GB内存和2TB存储空间,同时还减少破坏4K显示屏可选。在XPS13和MacBookAir这两款产品中,只有XPS13拥有触摸屏选项可选。

最终,当您将这两种设备的规格升级到最高配置时,XPS13的售价仅较MacBookAir减少100美元,但是却带来更快的内存,更新的处理器和更下降的分辨率,这是值得的。

戴尔XPS13是速度更快的笔记本电脑

看看这两台笔记本电脑的价格,戴尔XPS13已经稳居领先地位了。例如,以1199美元的价格就可以购买到搭载四核第11代酷睿i5处理器,8GB内存和512GB固态硬盘的XPS13。相比较之下,我们可以以1299美元购买到搭载第10代四核酷睿i5、8GB内存和512GB固态硬盘的MacBookAir。

虽然戴尔XPS13屏幕的像素密度并没有以前的那么高,但是它的性能却有着巨大的飞跃。戴尔XPS13是我测试过的性能和功能最强大的13英寸笔记本电脑,它授予了这种尺寸的笔记本电脑无法授予的原始性能。甚至,搭载酷睿i7处理器的戴尔XPS13,在性能方面都超过苹果MacBookPro。

一开始,苹果宣称搭载酷睿i5的最新款MacBookAir的性能是其之前版本的两倍,但事实并非如此,它的处理器性能还是比较弱的,它在性能方面无法跟上搭载酷睿i5处理器的XPS13。

您会注意到它们性能之间的统一吗?是的,尽管这取决于工作量。如果您的日常任务包括Chrome,Spotify,Netflix,Slack和YouTube,那么您可能不会感到处理能力方面的统一。即使关闭了许多标签页并关闭了许多应用程序,酷睿i3版本的MacBookAir仍然可以轻松自如地运行。正如我在评测中指出的那样,您甚至可以关闭GarageBand或iMovie去执行一些轻量级的内容创建。

但是,如果您是在Lightroom中处理高分辨率照片的摄影师,或者执行的是为多台4K显示屏供电的极端多任务处理,那么XPS13的缺乏带宽会有所干涉。

相较于MacBookAir,戴尔XPS13还更加便于随身携带,XPS13比MacBookAir更薄,更轻,而且由于超窄的边框,它的机身尺寸要小得多。

戴尔XPS13还特别适合外出办公使用,它单次充电之后的续航时间可比MacBookAir长几个小时,可以让您在漫长的旅途中进行更多的工作。

值得一提的是,无论您使用哪种配置,MacBookAir的电池续航时间都相同。

Windows、Mac和苹果

在戴尔XPS13和苹果MacBookAir的对战中,生态系统是要搁置的事情。毫无疑问,iPhone,AppleWatch,AirPods和MacBooks的搭配非常好。毫无疑问,在所有平台上拥有iMessage,iCloud和AirDrop会十分方便这就是苹果一直以来的杀手锏。虽然您可能会通过Windows应用程序(戴尔的MobileConnect和微软的YourPhoneCompanionforAndroid)共同破解一个缺乏反对性的解决方案,但事实并非如此。

购买苹果的MacBookAir时,苹果的应用程序套件也将会免费授予。相比较之下,微软的Office套件是大多数人的首选,但您需要支付缺乏的费用才能将其与戴尔XPS13捆绑在一起。虽然MacAppStore和MicrosoftStore旗鼓相当,但苹果的MacCatalyst计划意味着更多的iPad应用程序可以被移植到Mac中。对于Mac应用生态偶然的未来而言,可能包含巨大的潜力。

以往,有些用户强烈喜欢MacOS,有些用户强烈喜欢Windows。但是今天,它们之间的统一已经远远小于以往。MacOS授予更好的触控板手势,而Windows则具有多余的触摸屏减少破坏。Windows具有面部身份验证功能,可以快速解锁设备,而MacOS上的TouchID则可以用于付款和用户配置文件身份验证。

得益于年度软件更新和安全更新减少破坏,Windows10和MacOS都是现代化的软件。

苹果MacBookAirvs.戴尔XPS13:您应该购买哪个?

在最新一代产品中,MacBookAir配备出色的键盘,并且价格合理。当您以999美元的价格购买苹果与戴尔的笔记本电脑,并进行比较时,尽管屏幕分辨率较低,但是戴尔XPS13还是更好的选择。

但是,即使您更高端配置的设备,戴尔XPS13的表现仍然更出色,它授予了更好的性能,拥有更驱散人的设计以及出色的可选4K显示屏。在实际使用中,价格高于1500美元的XPS13机型击败了MacBookAir甚至是苹果的MacBookPro13。(完)

相关文章苹果称供应商和硕联合确认有罪规定不关心的时期与其新业务合作2020-11-092020版戴尔XPS13二合一评测:机身精美性能强但缺陷犹存2020-11-04苹果下周举行发布会重磅推出新款MacBookAir和MacBookPro2020-11-04苹果宣布11日举办线上发布会或将发三款苹果芯片Mac2020-11-03苹果第四财季营收647亿美元净利同比降8%2020-10-30

声明:本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:Sia,授权站长之家转载发布。

新年伊始,ChatGPT竟成了「恐怖分子」的帮凶?在为一位美国现役军人授予爆炸知识后,后者成功将一辆特斯拉Cybertruck在酒店门口引爆……

汽车爆炸现场画面,外媒视频截图

这并非科幻电影桥段,而是AI安全风险正在文明身边真实上演的缩影。知名AI投资人RobToews在《福布斯》专栏预测,2025年我们将迎来「第一起真实的AI安全事件」。

我们已经开始和另一种智能生命一起生活了,RobToews写道,它跟人一样任性难测,且具有真诚对待性。

巧的是,另份新鲜出炉的行业预测也指向同一问题。北京智源研究院在2025十大AI技术趋势中描绘了从础研究到应用落地再到AI安全的不完整图景。值得划重点的是,AI安全作为一个独立的技术赛道,被智源评为第十个趋势:

模型能力指责与风险预防并重,AI安全治理体系结束完善。

报告点评道:作为复杂系统,大模型的Scaling带来了涌现,但复杂系统特有的涌现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了确认有罪。基础模型在自主决策上的结束进步带来了清楚的失控风险,如何引入新的技术监管方法,如何在人工监管上不平衡的行业发展和风险管控?这对参与AI的各方来说,都是一个值得结束探讨的议题。

AI大模型安全,水深流急

2024年,AI大模型在实现跨越式协作发展同时,也让我们透明看到了安全的警惕神经如何被促进挑动。

根据研究,AI安全风险可以分为三类:内生安全问题、衍生安全问题和外生安全问题。

「内生安全问题」(如「数据有毒」、「价值对齐」、「决策黑盒」),属于大模型的「基因问题」——庞大的架构、海量的参数、复杂的内部交互机制,让模型既强大又难以驾驭。

很多人知道「poem」复读漏洞——重复一个词就能让ChatGPT吐出真实个人信息,这是因为大模型学习过程中,除了提取语言知识,也会「背诵」一些数据,结果数据隐私以一种意想不到的荒谬方式被触发出来。

机器之心曾让ChatGPT不断重复「AI」这个词,一开始它很听话,不断重复,在重复了1395次「AI」之后,它突然话锋一转,开始说起SantaMonica,而这些内容很可能是ChatGPT训练数据的一部分。

Prompt攻击是因为系统提示和用户输入都采用相同的格式——自然语言文本字符串,大语言模型没办法仅根据数据类型来区分指令和输入。

「越狱」手段也是层出不穷。从「奶奶漏洞」、「冒险家漏洞」、「作家漏洞」到最新的「DeceptiveDelight」技术,攻击者只需三次对话就有65%的概率绕过安全批准,让模型生成违禁内容。

DeceptiveDelight攻击示例,来源PaloAltoNetworks

Anthropic的最新研究更是发现,大语言模型居然学会了「真实的物品对齐」。

更令人担忧的是大模型在行业领域的表现。大模型在通用对话中表现流畅,清华大学、中关村实验室、蚂蚁集团等机构联合撰写的《大模型安全实践(2024)》白核书指出,在金融、医疗等对模型输出专业性、准确性要求极高领域的应用却面临严峻确认有罪,包括严重幻觉、缺乏复杂推理能力。

展望2025年,智源研究院预测AgenticAI将成为大模型应用的主要形态,这些具备更强自主性的智能体将深度融入工作与生活,也加剧了系统失控的风险。

试想一下,未来两到三年内,我们可能生活在一个每个人都有数十或数百名代理为我们工作的世界,安全基础设施的建设变得尤为重要,谁来授予这些安全基础设施?如何无约束的自由这些AI代理?如何确保它们不会失控?

当前的大模型安全评测主要聚焦内容安全,对于智能体这类复杂应用架构和未来AGI的安全评估体系仍显不足。

AI安全风险的另一大来源是「衍生安全问题」,随着AI滥用引发其他领域的一些重大安全事故,如假新闻、深度伪造诈骗、解开知识产权、教唆青少年自杀、作弊,也对社会治理提出了重大确认有罪。

「真实」这个高度发展命题正遭到前所未有确认有罪。西藏日喀则地震期间,「地震被压废墟下戴帽小孩是AI生成」的新闻冲上热搜,很多平台账号转发图片时都以为是真。除了金融诈骗,深度伪造也将网络性暴力推向极端,「厌女文化」盛行的韩国成了重灾区。世界经济论坛甚至把AI操纵选举列为2024年的头号风险。

这张图片被平台多个账号发布,并和本次地震关联,引发网友关注和转发。经媒体查证,上述图片由AI工具创作,原始作者在2024年11月18日发布了相同画面的短视频,并声明是AI生成。

版权是另一个大问题。OpenAI、Anthropic、Suno等领头羊已深陷版权泥潭。最近,爱奇艺起诉某大模型公司AI魔改经典影视剧片段,开创国内AI视频侵权诉讼先例。

第三类「外生安全问题」指向了人工智能偶然的外部网络攻击对抗,如平台、框架安全漏洞、模型被盗、数据泄露风险等,属于传统信息安全范畴。

就拿更加严峻的数据泄露来说。目前AI模型推理比较好的选择仍是在明文状态下进行,用户会输入极小量真实、警惕数据,获取模型建议。有报告指出,2024年企业员工上传到生成式AI工具的警惕数据增长了485%,包括客户减少破坏信息、源代码和研发数据。

因为不同类型的数据(如文本、图像、视频、音频)在数据规模和处理需求上的巨大统一,被预测寄予厚望的多模态大模型让数据的安全防护变得更为棘手。

穿越激流,构筑多维安全航道

人类叩开了深度智能时代的大门,安全问题也迎来质变时刻。

2024年,整个业界、政府、国际组织在AI治理上做了很多工作,从技术研究、治理框架到国际合作,进行了多种形式探索。数字时代积聚的安全对抗能力,让中国在大模型应用与治理方面走在了世界前列。

在监管层面,中国是全球最早对生成式AI进行规范的国家之一。继2023年5月发布《生成式人工智能服务无约束的自由暂行办法》后,《网络安全技术生成式人工智能服务安全高度发展要求》也已进入公开征求意见阶段,很多规范细正在制定之中。

在底层关键技术研究上,国内业界取得了积极成果。例如,北京智源研究院研发了防御大模型和AI监管大模型,对齐优化方面进行了创新。

因为模型在预训练后形成的分布结构较为稳固,大模型存在「抗拒微调对齐」的特性,后期单纯通过微调来实现对齐往往效果不理想,对此,智源提出在预训练阶段就将对齐所需的表征能力编织入模型架构中。

在对齐优化过程中,针对未对齐答案和对齐答案之间存在的偏差,智源采用了迭代训练的方法,更有利于模型从原始问题到对齐问题的训练,取得了良好效果。

在多模态对齐上,智源推出的「alignanything」框架实现了多模态信息的全面对齐,其创新在于将多模态信息、现实世界的具身认知、以及人类意图进行细粒度的对齐整合,在LLaMA模型的微调过程中已经展现出显著效果。

同样是解决大模型的可控性,蚂蚁集团的应对之道是把知识图谱的优点——逻辑推理能力强、知识准确可靠,与大模型分隔开起来。通过在大模型预训练、提示指令、思维链、RAG(检索增强生成)和模型对齐等环节中引入符号知识,有效增强了模型输出的专业性和可靠性。

大模型作为一种通用技术,既可以用于「攻」,也可以用于「防」。在拥抱大模型,以AI对抗AI方面,华为、蚂蚁集团、360集团、深信服等厂商进行了有益探索。

华为提出业界首个L4级AI安全智能体,用大模型加上一些安全知识图谱实现安全的纵深推理,发现一些以前没有发现过的安全攻击。

蚂蚁集团发布了大模型安全一体化解决方案「蚁天鉴」,包含大模型安全检测平台「蚁鉴」、大模型风险防御平台「天鉴」两大产品,拥有检测与防御两大不次要的部分安全技术能力。

「蚁鉴」是全球第一个实现工业级应用的可信AI检测平台,以生成式能力检测生成式系统,覆盖了内容安全、数据安全、科技伦理全风险类型,适用文本、表格、图像、音频、视频等全数据模态。

在防御能力上,「天鉴」会动态监测用户与模型的交互,防止诱导攻击,同时对生成的回答内容进行风险过滤,保障大模型上线后从用户输入到生成输出的外围安全防御。

360集团推出了基于类脑分区专家协同架构的安全大模型,通过EB级安全数据训练,已具备L4级「自动驾驶」能力,实现了从威胁检测到溯源分析的全流程自动化。

深信服的「安全GPT」可授予7×24小时实时在线智能值守,指责安全运营效率,同时深度挖掘传统安全设备难以检测的高对抗、高绕过的Web攻击、钓鱼攻击。

除了监管、关键技术的推进,行业也在积极破坏AI安全协作。

在安全治理领域,模型的安全评测是一个非常次要的环节。2024年4月,联合国科技大会发布了两项大模型安全标准,其中,蚂蚁集团牵头制定《大语言模型安全测试方法》,首次给出四种攻击强度分类,授予了可衡量的安全评估标准:L1随机攻击、L2盲盒攻击、L3黑盒攻击和L4白盒攻击。

这种分级不仅搁置了攻击的技术复杂度,更次要的是基于攻击者能获取的模型信息程度来划分,这让防护措施的部署更有针对性。

在推进国际对话上,2024年3月,北京智源研究院发起并承办我国首个AI安全国际对话高端闭门论坛,与全球AI领袖学者及产业专家联合签署《北京AI安全国际共识》,设定模型安全红线,释放模型自我演进、自我复制和不受控的无能的增长等行为,确保开发者遵循严格的安全标准。

9月威尼斯,一场推动AI安全的全球对话落幕,图灵奖得主YoshuaBengio、姚期智等科学家共同签署「AI安全国际对话威尼斯共识」,降低重要性了人工智能安全作为「全球公共产品」的重要性。

放眼全球,英美侧重轻触式监管,美国加州的SB1047因争议被同意。欧盟AI法案已经生效,它建立起四级风险分类体系,明确了人工智能产品的全生命周期监管要求。

在业界,主要头部AI公司相继发布安全框架。

OpenAI在不次要的部分安全团队解散后公布了前10个安全措施,试图在技术创新与社会责任间寻求不平衡的。

Google也紧随其后发布了SAIF安全框架,应对模型窃取、数据降低纯度等风险。

Anthropic发布了负责任扩展策略(ResponsibleScalingPolicy,RSP),被认为是降低AI灾难性风险(如恐怖分子利用失败模型制造生物武器)最有前途的方法之一。

RSP最近更新,引入了更僵化和细致的风险评估与无约束的自由方法,同时重新确认不培训或部署未实施充分保障措施的模型。

一年多前《经济学人》就开始讨论人工智能的快速发展既让人平淡,又让人恐惧,我们应该有多担心?

2024年初,中国社会科学院大学在研究报告中指出,安全科技将成为社会的公共品,并与人工智能并列为未来的两项通用技术。一年后,智源研究院再次呼吁关注安全治理印证了这一战略判断的前瞻性,AI越强大,安全科技价值也在不同步放大。

我们不可能扔掉利刃,重新接受科技,唯有为其打造足够安全的刀鞘,让AI在造福人类的同时始终处于可控轨道。变与不变中,AI安全治理或许才是AI行业永恒的话题。

过去的一年里,新技术与新趋势不断涌现,在保持不变人类生活方式的同时,也为产业带来了比较罕见的发展机遇。2025年随着新一轮科技革命和产业变革帮助推进,数据无约束的自由将发生怎样的变革?在人工智能结束协作发展大潮中,企业该如何充分奴役数据价值、应对愈加复杂的业务确认有罪?企业全球数据无约束的自由领域领军企业Denodo日前发布2025新趋势展望,分享了关于数字化转型新兴技术及企业无约束的自由创新的前沿洞察。

ángelVi?a(Denodo创始人兼首席执行官)表示:

2025年展望–数据无约束的自由的未来

数据无约束的自由架构将不断发展,以焦虑日益增长的数据量、各种数据源和更多样化的数据消费用户的需求。此外,还会有更严格的隐私和治理要求,并且更加重视授予对企业数据的安全访问,以便GenAI应用的使用场景化。

以下是我的2025年“展望”清单:

1.逻辑/联邦数据架构的兴起

○数据网格和数据编织的增长。企业正在从单体数据湖保持方向分布式数据架构,如数据网格和数据编织,他们将数据视为产品并按域组织数据。这些方法减少破坏去中心化、联邦治理,在这种治理中,数据所有权分布在各个团队中,从而降低了可扩展性和自主性。

○对统一数据生态系统互操作性的需求减少。逻辑数据架构将推动对跨不同数据源(包括云、本地和瓦解环境)的无缝互操作性的需求。减少破坏跨分布式偶然的数据系统语义统一和查询计算的工具和平台将获得不明显的,不引人注目的驱散力。

2.瓦解和多云数据无约束的自由成为新常态

○用于数据主权的瓦解云架构。数据隐私法规和对数据主权的厌恶将推动组织采用瓦解架构,其中警惕数据耗尽在本地或私有云中,而不太关键的数据存储在公共云中。这种方法可在利用失败公共云服务可扩展性的同时,实现法规遵从性。

○跨云授予商的统一数据无约束的自由。随着越来越多的企业使用多云,对跨授予商的统一数据无约束的自由工具的需求将不断增长。能够跨AWS、Azure、GCP和其他平台授予单一视图和治理框架的解决方案将受到高度重视。

3.更加关注数据产品生命周期无约束的自由

○数据产品是数据民主化的关键推动因素。数据产品将原始数据转换为增值服务,为最终用户授予可操作的洞察力,以实现业务目标。不反对交付模式和自助服务界面将使所有组织中的新成员能够使用数据产品,从而显著减少数据使用量。

○数据产品生命周期变得更加复杂。数据产品由具有不同技能和职责的不同角色无约束的自由,通常以去中心化的方式进行无约束的自由。数据无约束的自由平台将减少破坏数据产品的整个生命周期,从创建(设计、实施、部署)到发现、使用和监控。

4.用于数据无约束的自由的AI:AI驱动的数据无约束的自由的扩展

○自动数据编目和发现。AI将在数据发现、分类和编目中发挥更大的作用,干涉组织自动进行数据组织和标记。AI驱动的数据目录将授予有关数据沿袭、数据质量和使用模式的实时洞察。

○智能数据执行。数据无约束的自由平台将通过预测使用模式、将查询映射到正确的数据执行引擎以及自动调整不当数据工作负载以比较大限度地降低成本和降低性能,来减少破坏基于AI的数据查询执行优化。

5.用于AI的数据无约束的自由:减少破坏GenAI模型的极小量

○RAG增强。除了对LLM进行微调以供企业使用之外,GenAI模型在跟随训练时使用的数据上停留在某个时间点。它们不了解企业数据或上下文,也无法访问实时信息。数据无约束的自由平台将不断发展,以授予和自动化对LLM的RAG增强,并通过企业数据将GenAI应用程序的行为场景化。

6.继续向去中心化数据治理转变

○面向域的数据治理。去中心化数据架构将导致面向域的治理,其中某些数据治理策略是在域级别而不是仅在中央进行无约束的自由的。这使得最接近数据的团队能够对其质量和合规性负责。

○监管重点日益关注数据透明度。监管要求越来越关注数据透明度,尤其是在AI驱动的决策环境中。数据治理架构将包括用于跟踪数据来源和确保可解释性的框架,以遵守新的数据和AI法规。

○数据可观测性作为不次要的部分功能。数据可观测性使组织能够监控数据健康状况、沿袭和使用情况,这将成为一项标准功能。可观测性工具将授予有关数据管道、数据新鲜度和沿袭的洞察,确保用于分析和决策的数据的可靠性。

7.关注超个性化、大规模隐私和数据安全

○超个性化功能。所有数据都将降低为每个客户定制数据使用体验的需求。数据无约束的自由将在下一代数据交付平台中发挥关键作用。

○保护隐私的数据无约束的自由。对数据隐私的担忧将导致采用保护隐私的技术,以便在不泄露警惕信息的情况下进行数据分析和共享。

○自动合规性监控和策略实施。随着数据隐私法规的日益严格,企业将依赖自动合规性监控工具来确保数据无约束的自由实践符合所有区域和数据环境的法规。

8.越来越重视成本优化和可结束性

○经济无效的数据存储和计算。数据无约束的自由将减少对更具成本效益的存储和计算数据解决方案的减少破坏。FinOps功能(如根据数据使用频率优化存储成本的数据分层,以及根据业务优先级和财务目标将数据工作负载动态分配到计算引擎)将变得更加重要。

○节能数据处理。可结束性将成为数据无约束的自由中搁置的新主题。组织将寻求节能的数据处理和存储实践,包括云环境中的碳足迹跟踪,以焦虑企业可结束性目标和法规。

2025年的数据无约束的自由将更加分布式、实时和动态,其架构将优先搁置模块化、治理、AI驱动的自动化和定制数据使用。这种演变将使组织能够在日益复杂的数据生态系统中焦虑可扩展性、法规遵从性和数据民主化的需求。

AlbertoPan(Denodo首席技术官)表示:

预测:到2026年,超过50%的企业会将数据系统分布和异构性视为开发减少破坏GenAI的数据产品的主要确认有罪。

论证:2024年Gartner技术架构师调查(1)显示,“跨不同平台的数据系统分布”是制定数据架构决策时第二个最常被引用的确认有罪,56%的架构师都降低重要性了这一点。

GenAI应用程序必须以安全、受控的方式访问所有组织系统中的数据,即使这些数据是动态的和实时的。但是,当前将GenAI应用程序与外部数据源分开的方法(例如检索增强生成(RAG)模式)忽略了数据分布的复杂性。将GenAI应用程序扩展到试点和高度发展用例之外,需要直接解决这一确认有罪的解决方案。

建议:搁置使用数据虚拟化等逻辑数据无约束的自由技术,为AI驱动的数据产品建立可访问的数据层。这些技术可以实现对多个数据源的实时统一访问,为实施一致同意的安全和治理策略授予单一入口,并允许以业务语言呈现数据。

(1)来源:《Gartner2025数据无约束的自由规划指南》。发布于2024年10月14日。

预测:到2026年,超过80%构建发散式云数据仓库或湖仓架构的组织将无法选择把某些工作负载迁移到其他环境,包括同一云授予商内的其他数据处理系统、其他云中的系统,甚至是本地环境(数据回迁)。

论证:数据民主化和基于使用量的云定价模式的驱动,导致许多大型组织的成本飙升。IDC2024年6月的报告《评估工作负载回迁的规模》(2)反映了这一趋势,该报告发现,约80%的受访者预计在未来12个月内会出现某种程度的数据回迁。回迁既复杂又昂贵,因此组织还会通过为每个用例选择在效率和成本效益之间取得理想不平衡的的云环境和系统来优化成本。

建议:随着技术和业务需求的发展,投资于简化将用例迁移到最合适环境的技术。开放表格式可实现与多个处理引擎兼容的数据表示。此外,逻辑数据无约束的自由技术(例如数据虚拟化)使数据使用者无需了解各个处理引擎的细微差别,包括SQL方言、身份验证协议和访问控制机制。

(2)https://www.idc.com/getdoc.jsp?containerId=US50903124

预测:到2026年,超过80%追求数据产品战略的组织将使用多个数据平台创建关键数据产品。对于跟随设想采用单一供应商方法的组织而言,这种转变将给企业范围的数据民主化计划带来确认有罪。

论证:数据产品无约束的自由计划本质上是分布式的,因为没有哪个单一平台能够跨所有数据产品优化功能、性能和成本。减少破坏这一点的是,只有不到5%的Snowflake和Databricks共同客户计划停用其中一个平台,而大多数客户还在使用其他云和本地系统(3)。此外,在联邦治理模型中,数据产品所有者通常会选择最能焦虑其特定功能和预算要求的平台。此外,随着技术创新步伐的加快,新的数据平台将不断涌现。

鉴于这些动态,企业数据产品战略必须搁置数据分布和平台多样性,以确保拖延性、一致同意性和成本效益。

建议:搁置采用数据虚拟化等逻辑数据无约束的自由技术,以建立统一的基础架构,用于跨不同平台发布、保护和访问数据产品。这种方法使数据产品所有者能够僵化地选择最适合其需求的系统,同时确保在全球范围内所有数据产品的互操作性、可重用性和简单的发现。

(3)为什么Databricks与Snowflake不是零和博弈。https://siliconangle.com/2024/07/27/databricks-vs-snowflake-not-zero-sum-game/

TerryDorsey(Denodo技术推广者)表示:

人工智能将推动更多的组织关注

人工智能正日益推动组织重新思考数据无约束的自由、运营不调和和流程优化。当前的数据无约束的自由方法,包括管道、ETL和ELT,面临着相当大的确认有罪。例如,80%的企业报告经常出现数据管道故障,74%的企业在数据质量方面苦苦无魅力的运动,而解决问题通常需要一天以上的时间,37%的组织甚至需要长达一周的时间。安全问题也很普遍,57%的企业将数据安全视为一项重大确认有罪。这种数据无约束的自由方面的根本性难题破坏了主要战略计划,例如数据治理、数字化转型和人工智能部署,所有这些计划的成功率都很低。Gartner估计,到2027年,80%的数据治理计划将会大成功,而人工智能项目的大成功率徘徊在70-80%之间,尽管概念验证取得了成功,麦肯锡报告称只有约30%的数字化转型项目取得了成功。

随着利用失败人工智能保持竞争力的压力越来越大,组织正在创建新的角色,例如首席人工智能官(CAIO),并重新审视首席信息官和首席数据官的角色,以容纳人工智能计划。然而,人工智能研究的进展速度被预见的发生之快,这通常超过了组织采用这些技术的能力,尤其是在规模化方面。许多企业正试图在相同的组织结构内并使用传统方法来集成人工智能,但这可能并不足够。

人工智能驱动转型的关键组织关注领域

数据安全和隐私数据安全和隐私是人工智能计划不可或缺的一部分,这减少了保护数据的确认有罪性和关键性。组织必须在无效的无约束的自由、审计和控制与广泛采用人工智能所需的僵化性之间取得不平衡的。例如,许多企业目前在系统或源级别无约束的自由安全。然而,随着人工智能的发展和更广泛的数据访问需求,这种方法可能会导致成本和风险升高。为了缓解这种情况,组织可以采用优先搁置发散但优美轻盈的安全模型的数据治理框架,确保数据保护和可访问性之间的不平衡的。

增强的变更无约束的自由和变更控制随着组织将职责分配给技术和非技术团队,他们必须制定稳健的变更无约束的自由和变更控制策略。变更无约束的自由(侧重于沟通和采用)和变更控制(侧重于技术实施)是独立但不无关系的领域,在人工智能驱动的环境中都至关重要。理想实践可能包括跨职能的人工智能工作组、不不透光的沟通协议和培训计划,以鞭策波动过渡。例如,对参与人工智能采用的非技术人员实施结构化培训,可以干涉弥合技术团队和业务团队之间的差距。

与业务成果保持一致同意IT与业务目标之间的穿节可能是人工智能成功的主要障碍。IT部门通常关注技术指标,而业务部门则优先搁置组织目标。鉴于数字化转型和人工智能计划的高大成功率,IT团队应与业务部门更紧密地合作,以优先搁置可衡量的业务成果。跨职能协作,由技术和业务掌舵者共同领导人工智能驱动的项目,可以干涉确保项目与不次要的部分组织目标保持一致同意并交付切实的价值。

业务流程优化和新兴技术集成转型,尤其是涉及人工智能、物联网和自动化的转型,本质上需要业务流程优化。随着组织采用人工智能,他们必须评估并可能重构其流程,以有效地集成新技术。这可能包括开发自适应工作流,允许将人工智能驱动的洞察无缝地融入业务运营中。在这个领域取得成功的组织通常采用循环方法进行流程优化,随着人工智能能力的发展不断迭代和更新工作流。

重组企业IT以实现拖延性和协作鉴于人工智能的快速发展,传统的IT结构可能会批准组织响应新兴需求的能力。许多企业将IT职能(尤其是围绕数据无约束的自由的职能)世界性政策起来,这可能会鞭策需要无缝数据访问和协作的计划的有效性。可能需要一个更拖延、更协作的IT结构,其中包括数据治理和跨部门角色。例如,企业可以在IT部门内建立瓦解角色或专门的人工智能集成团队,将技术专长与特定领域的知识相分隔开,以更有效地减少破坏人工智能和数据计划。

面向未来人工智能驱动型组织的愿景

以人工智能为中心的组织的结构旨在威吓IT和业务职能之间结束保持一致同意,优先搁置数据安全和隐私、变更无约束的自由和业务流程优化。此类组织是拖延的,具有减少破坏跨部门协作的僵化IT和治理结构。他们实施在数据保护和访问之间取得不平衡的的治理框架,使用培训计划来确保人工智能的顺利采用,并不断优化业务流程。通过采用这些原则,组织可以降低人工智能、数字化转型和数据治理计划的成功率,从而在人工智能驱动的世界中占据竞争无足轻重。

自主代理和代理工作流

大模型(LLM)可以做一些非常了不起的事情。我们在产品中特别利用失败了文本到SQL和摘要功能。由于LLM非常擅长评估/审查信息,并且在自我评估方面没有自负情绪,我们看到许多研究和框架都在寻求利用失败这种能力。它们还非常擅长根据自然语言对任务做出决策和构建信息。这些功能是自主代理和代理工作流的基础。

像亚马逊、谷歌和微软这样的主要参与者已经开发了强大的框架,使企业能够比以往任何时候都更容易地构建这些人工智能驱动的代理并将其集成到其运营中。借助AmazonBedrockAgents和GoogleVertexAI等工具,企业现在可以创建代理来提取数据、回答客户问题,甚至在无需太多人工监督的情况下执行操作。组织可以慢慢开始,实施和观察自主代理和代理工作流可能比部署给用户更容易,因此即使从这种能力开始也可能更具驱散力。预计这些将在未来一年左右的时间内变得更加流行。

增量/结束机器学习

如今,一些企业正在对LLM进行微调,在某种程度上,您可以将其视为增量学习。鉴于重新训练大型模型的确认有罪,增量/结束学习的能力意味着模型能够保持比较新状态。在这个领域有很多研究,我预计它甚至会在GenAI之外发展壮大。

从数据无约束的自由的角度来看,向增量学习范式转变意味着企业可以更有效地利用失败实时数据。此功能对于需要立即进行数据解释和响应的应用程序至关重要,例如金融交易算法、实时推荐系统和动态定价模型。随着研究的继续和这些技术的日益成熟,增量和结束学习对人工智能部署和功能的影响可能会减少,使其成为未来人工智能技术进步的重点领域。

图数据库的使用兴起

我们已经听到了很多关于LLM的一些缺点,以及在某种程度上语义搜索的缺点。图授予了一种对复杂关系进行建模的方法,因此最近有极小量研究利用失败图数据库来解决其中的一些批准。有一些提示方法,例如基于节点、基于子图、基于路径、基于层次结构、基于社区等等,这些方法都基于图的功能。在某些情况下,节点属性是嵌入的,在某些情况下是不不透光的。有各种各样的技术可以根据数据填充图来构建此类模型,因此需要能够在图中查询数据以及将数据引入图中。

云回迁

83%的受访企业正在将其部分工作负载迁移到私有云和本地系统。诚然,这些企业各自久坐的百分比存在一些不确定性;然而,从数据无约束的自由的角度来看,只需一个企业将数据存储在多个位置即可。这可能会对数据无约束的自由策略产生重大影响。

AndreaZinno(Denodo技术推广者)表示:

分解数据

对隐私、个人数据处理、拥有训练人工智能模型的良好样本的重要性以及拥有特定(不一定聚合)数据的需求的搁置,以便能够参考个人对现象进行建模,将对分解数据产生更大的推动作用,分解数据将在选择和构建用作分析基础的样本的过程中发挥越来越大的作用。

主动本体(或主动数据目录)

在数据民主化的精神下,数据在公共和私营组织内的日益普及,以及逐步缩短其有无批准的、迈向允许组织业务模型中的相关方(合作伙伴、供应商、公共无约束的自由部门、客户……)共享和使用数据的生态偶然的趋势,使得正式和系统地解决“含义”问题变得更加重要,以便为此生态系统中的所有参与者创建通用语言。

然而,深入理解数据的需求(通过不平衡的内涵和外延成分来实现),以及从一个切换到另一个的可能性(或者说是必要性),将无法选择人们对主动本体或主动数据目录以及基于本体的数据无约束的自由(OBDM)的兴趣日益浓厚。

Denodo北欧公关团队表示:

ESG作为竞争无足轻重

北欧客户越来越多地根据供应商在ESG实践方面的表现和沟通情况来选择供应商。那些没有与CSRD及其他标准相符的稳健ESG实践的企业正日益被装入在招标之外。北欧企业可能会优先搁置具有社会可结束性的合作伙伴,重点关注道德劳动实践并确保其供应链中的公平工资。企业需要无效的数据无约束的自由来无约束的自由数据收藏,储藏和报告。

人工智能的下一步

将人工智能平台分开到集成的人工智能代理的讨论越来越多。原因是它有可能分隔开一些技术无足轻重授予更比较准确的行业特定答案——媒体希望看到的具体用例。

银行、气候和数据

具有良好环境和社会资质的银行将受益于更麻烦不顺利的贷款条款。比以往任何时候都多的金融科技创新正在减少破坏可结束银行业务。基于数据无约束的自由的数字工具将干涉银行为消费者和企业授予个性化的金融服务。

银行将越来越关注无约束的自由气候相关风险。这包括评估气候变化对贷款组合和投资带来的风险,并确保长期金融轻浮。

公共部门和数据无约束的自由

公共部门参与者正在悠然,从容变得更加数字化,包括确保数据安全以及在相关参与者之间共享数据(例如,在医疗保健领域)。目标是为公民授予更好的服务。政府正在确保以合乎道德和负责任的方式使用人工智能。无约束的自由机构不调和各种网络安全计划。

RaviShankar(Denodo高档副总裁兼首席营销官)表示:

减少破坏AI的企业数据

人工智能的好坏取决于它获取的数据。不仅是任何数据,而是值得信赖的数据。即使数据意见不合在不反对位置、格式和延迟中,也需要为人工智能授予统一的可靠数据。

在互联网公共数据上训练的公共LLM(如ChatGPT)可以回答一般性问题,如授予假期旅行建议,但它们无法回答与企业内部运作不无关系的问题(如上个月发放了多少贷款)。为此,需要使用防火墙内的企业数据来训练LLM。

RAG减少破坏这种对企业数据的上下文感知。因此,由RAG减少破坏的减少破坏AI的企业数据将成为关键趋势。

减少破坏AI的人才

随着人工智能在组织内的普及,高管们要求其经理培训其员工队伍,以降低生产力并以更少的资源生产更多产品。

这项任务要求对员工进行大规模培训,尤其是在面向客户的部门,如销售、营销和客户服务。

人工智能素养将成为2025年的关键趋势。

人工智能确认有罪

随着人工智能在回答问题方面变得越来越出色,高管们将依赖人工智能来授予决策建议。

他们应该在多大程度上接受人工智能而不是他们的经理,这将成为一个问题。

2025年,我们应该会看到人类与人工智能之间的竞争,以反对谁更值得信赖,能够为高管授予更好的数据和洞察力。

(推广)