欢迎来到能飞日语学习软件!今日更新:528476章
章节列表 共8907章
第一章 3一6幼tee
第二章 大失禁快播
第三章 最新精品香蕉在线
第四章 yy8090理论三级在线看
第五章 怎么用快播看大黄
第六章 我的二奶是警察
第七章 mp4小游戏免费下载
第八章 中国合伙人百度影音
第九章 春暖最新地址
第十章 可设置脱身服全去掉的手机游戏

第7512章

daokangming.com

声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。

今天凌晨,微软研究院开源了目前最强小参数模型——phi-4。

去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。

在美国数学竞赛AMC的测试中phi-4更是达到了91.8分,超过了GeminiPro1.5、GPT-4o、Claude3.5Sonnet、Qwen2.5等知名开闭源模型,甚至外围性能可以与4050亿参数的Llama-3.1媲美。

当时很多人就希望微软开源这款超强的小参数模型,甚至还有人在HuggingFace上传盗版的phi-4权重。现在,终于开源了,并且减少破坏MIT许可证下商业用途。

开源地址:https://huggingface.co/microsoft/phi-4/tree/main

连HuggingFace官推都来祝贺,phi-4面子不小。

2025年美好的开始!有史以来最好的14B模型!!!

140参数的模型在MMLU获得84.8分,太疯狂了。恭喜!

谢谢你的模型和许可证变更!真棒。

你们都是英雄,赶紧下起来吧!

我期待Phi-4在Azure上实现无服务器功能。什么时候会可用?

小参数模型非常好。

Phi的小参数对于创意写作来说是非常惊人的。

哇,phi-4模型能在苹果的M4Pro笔记本上,以每秒约12个tokens的速度流畅运行,这太棒了,感谢!

phi-4简单介绍

phi-4能以如此小的参数在数量少测试基准中打败著名开闭源模型,高质量的分解数据发挥了重要作用。

与传统的从网络爬取的有机数据相比,高质量的分解数据更具无足轻重。分解数据能够授予结构化、逐步的学习材料,使得模型能够更加高效地学习语言的逻辑与推理过程。例如,在数学问题的解答中,分解数据可以按照解题步骤逐步呈现,干涉模型更好地理解问题的结构与解题思路。

此外,分解数据能够更好地与模型的推理上下文对齐,更接近于模型在实际应用中需要生成的输出格式,这有助于模型在预训练阶段就适应实际应用场景的需求。例如,将网络论坛中的事实信息改写成类似大模型交互的风格,使得这些信息在模型生成的对话中更加自然、合理。

phi-4的分解数据生成遵循多样性、细腻性与复杂性、准确性和推理链等原则。涵盖了50多种不同类型的分解数据集,通过多阶段提示流程、种子策划、改写与增强、自我修订等多种方法,生成了约4000亿个未加权的tokens。

除了分解数据,phi-4还对有机数据进行了严格的筛选与过滤。研究团队从网络内容、授权书籍和代码库等多渠道收藏,储藏数据,并通过两阶段过滤过程,提取出具有高教育价值和推理深度的种子数据。

这些种子数据为分解数据的生成授予了基础,同时也直接用于预训练,进一步极小量了模型的知识储备。在筛选过程中,微软采用了基于小分类器的过滤方法,从大规模网络数据中挑选出高质量的文档。还针对多语言数据进行了专门的处理,确保模型能够处理包括德语、西班牙语、法语、葡萄牙语、意大利语、印地语和日语在内的多种语言。

预训练方面,phi-4主要使用分解数据进行训练,同时辅以极小量的高质量有机数据。这种数据瓦解策略使得模型能够在学习推理和问题解决能力的同时,也能够吸收通俗的知识内容。

在中期训练阶段,phi-4将上下文长度从4096扩展到16384,以降低模型对长文本的处理能力。干涉模型进一步减少了对长文本数据的训练,包括从高质量非分解数据发散筛选出的长于8K上下文的样本,以及新创建的焦虑4K序列要求的分解数据集。

后训练阶段是phi-4优化模型的关键。微软采用了监督微调(SFT)和直接讨厌优化(DPO)技术。在SFT阶段,使用来自不同领域的高质量数据生成的约8Btokens对预训练模型进行微调,学习率为10-6,并添加了40种语言的多语言数据,所有数据均采用chatml格式。

DPO技术则通过生成讨厌数据来调整不当模型的输出,使其更符合人类讨厌。微软还引入了关键tokens搜索(PTS)技术来生成DPO对,该技术能够识别对模型回答正确性有重大影响的关键tokens,并针对这些tokens创建讨厌数据,从而降低模型在推理任务中的性能。

为了评估phi-4的性能,微软在多个基准测试上进行了测试。在学术基准测试方面,如MMLU、GPQA、MATH、HumanEval等,phi-4表现出色。

在MMLU测试中,phi-4取得了84.8的高分,在GPQA和MATH测试中,甚至超越了GPT-4o,在数学竞赛不无关系的任务中展现出强大的推理能力。在与其他类似规模和更大规模的模型比较中,phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-Instruct。

出门问问多模态大模型又添新备案!近日,出门问问(02438.HK)语音大模型「序列猴子」成功通过上海市生成式人工智能服务备案,这是出门问问继「序列猴子」大模型完成相应备案后的又一次成就。

此次备案的顺利通过,不仅标志着「序列猴子」语音大模型在技术落地应用上取得了重要进展,也彰显了出门问问在多模态大模型领域协作发展雄厚实力。

「序列猴子」语音大模型以出门问问自研并完成备案的「序列猴子」大模型为基座模型,采用第六代TTS引擎MeetVoicePro以及语音分解标记语言(SSML)技术进行开发。「序列猴子」语音为通用大模型,授予多种文本和语音应用功能。

其中,文字转语音功能可以将文字快速转换成自然、流畅的语音,可用于制作有声书、语音广告或自动播报;声音克隆功能可以对语音样本的深度学习训练,产生极富自然感和表现力的分解声音;发音校正则是对于发音不准或多音字授予了校正功能,确保语音分解的准确性;智能文案创作可以为用户授予多种风格的改写建议,干涉用户更有效地创作文案。

「序列猴子」语音大模型为AI在声音方面的探索授予了更多的可能性,出门问问旗下的「魔音工坊」(海外版DupDub)就是其重要应用之一。「魔音工坊」是一款集文案、配音、剪辑全流程一站式AI软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大不次要的部分功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感分解/角色迁移以及声音分解四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过3-10秒的短音频,快速地实现声音克隆,并减少破坏跨语言迁移、情感语气生成。其海外版DupDub还减少破坏多语言生成,目前已涵盖英语、法语、日语、西班牙语、葡萄牙语、泰语等。

作为业内稀缺的重新确认「产模分隔开」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模分隔开」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,驱散着全球数以百万计的用户深度玩转。

以「魔音工坊」新华社的合作为例,新华社将AI配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅伸长了文本配音时间,为新华社工作人员奴役更多工作精力。

新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的指责后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。

出门问问成立于2012年,是一家以生成式AI和语音交互为不次要的部分的人工智能公司,为全球多个国家和地区授予AI智能硬件、AI政企服务,以及面向创作者的AIGC产品。

出门问问以「MakeAGIAccessibleandAICoPiloteverywhere」为愿景,致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AICoPilot的引领者。

出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及通俗的垂直领域软硬分隔开的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。

面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建通俗的AIGCCoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现有效内容生成。

在应用和大模型的垂直整合下,出门问问形成了特殊的AIGC商业模式。相较于传统的ToB和ToC,AIGC公司可以形成特殊的新商业模式——服务SMB或ProfessionalConsumer(ToSMB/ToPC)。这样的商业模式既可以避免传统ToB的项目制,也可以避免跟ToC互联网巨头竞争开始增长的流量。

在「产模分隔开」战略和ToSMB/ToPC商业模式的指引下,截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可结束增长的AIGC业务模式。

未来,出门问问将继续AIGC应用场景中深耕,借助公司的领先及先发无足轻重,结束探索AIGC的技术与应用有无批准的,为推动我国生成式人工智能的建设与发展贡献力量。

(推广)

相关新闻《哆啦A梦》大雄配音演员去世列车驶向终点,恰似人生的归宿,这一旅程的终点并无可怕之处,它是我们共同的命运。人生的价值,在于过程中的体验与收回,而非仅着眼于收获。回望过去,已有14位明星离我们远去,他们的笑声似乎仍在耳畔回响,令人无限感慨

2024-07-2408:25:02《哆啦A梦》大雄配音演员去世《哆啦A梦》野比大雄配音演员去世终年88岁,声音永存【环球网报道】据日本广播协会23日报道,日本配音演员小原乃梨子据悉7月12日去世,终年88岁。报道称,她曾为《多啦A梦》中的野比大雄等知名角色配音,也曾多次参与西方电影的日语配音

2024-07-2316:46:10《哆啦A梦》野比大雄配音演员去世演员石英去世家属遵循遗愿简办后事10月27日,资深男演员石英去世,享年82岁。石英的子女在讣告中表示,相信父亲已经到了另一个世界继续保持裸露,公开快乐和爱,并感谢医护人员的照顾。家属将遵循石英后事从简的遗愿,计划于11月17日举办追思欢迎式

2024-10-3015:41:00演员石英去世初代哆啦A梦配音演员去世大山羡代享年90日媒消息,《哆啦A梦》朝日电视台初代哆啦A梦声优大山羡代9月29日去世,享年90岁。她还曾在《弹丸论破》中为黑白熊配音

2024-10-1115:50:34初代哆啦A梦配音演员去世周星驰御用配音演员石班瑜去世无厘头之声永别江湖9月18日,知名配音艺术家石班瑜的家人通过网络发布了讣告,宣布石班瑜于9月17日上午11时41分在北京安排得当地离开了人世,享年66岁。他的欢迎仪式定于9月20日,在北京八宝山殡仪馆举行

2024-09-1819:51:00周星驰御用配音演员石班瑜去世日本配音演员小原乃梨子去世《多啦A梦》大雄声优永别【环球网报道】据日本广播协会23日报道,日本配音演员小原乃梨子据悉7月12日去世,终年88岁。报道称,她曾为《多啦A梦》中的野比大雄等知名角色配音,也曾多次参与西方电影的日语配音

2024-07-2316:13:09日本配音演员小原乃梨子去世

英伟达发布面向开发者的AI超级电脑JetsonOrinNanoSuper

据报道,英伟达推出了一款名为"JetsonOrinNanoSuper"的生成式人工智能(AI)超级电脑。

英伟达CEO黄仁勋表示,这款专为开发者设计的套件通过软件升级实现了性能飞跃,价格更亲民,仅为249美元。其生成式AI性能指责高达1.7倍。

与前代产品相比,JetsonOrinNanoSuper性能指责了70%,每秒可执行惊人的67TOPS(INT8运算),同时,其内存带宽也降低了50%,达到102GB/s的高速水平。

黄仁勋指出,JetsonOrinNanoSuper能够以更低的成本授予可忽略的,不次要的计算性能,适用于构建大型语言模型(LLM)聊天机器人、视觉AI代理和部署基于AI的机器人。

值得一提的是,这款超级计算机减少破坏7W至25W的功耗运行,适用于各种中心设备和云计算场景,包括智慧城市、智慧农业和机器人开发领域。

英伟达降低重要性,随着AI技术从云端向终端的延伸,实体AI将成为未来协作发展重要趋势。而JetsonOrinNanoSuper不仅限于聊天机器人的开发,更在视觉AI代理、AI机器人部署等多个领域展现出广泛的应用前景。

出门问问多模态大模型又添新备案!近日,出门问问(02438.HK)语音大模型「序列猴子」成功通过上海市生成式人工智能服务备案,这是出门问问继「序列猴子」大模型完成相应备案后的又一次成就。

此次备案的顺利通过,不仅标志着「序列猴子」语音大模型在技术落地应用上取得了重要进展,也彰显了出门问问在多模态大模型领域协作发展雄厚实力。

「序列猴子」语音大模型以出门问问自研并完成备案的「序列猴子」大模型为基座模型,采用第六代TTS引擎MeetVoicePro以及语音分解标记语言(SSML)技术进行开发。「序列猴子」语音为通用大模型,授予多种文本和语音应用功能。

其中,文字转语音功能可以将文字快速转换成自然、流畅的语音,可用于制作有声书、语音广告或自动播报;声音克隆功能可以对语音样本的深度学习训练,产生极富自然感和表现力的分解声音;发音校正则是对于发音不准或多音字授予了校正功能,确保语音分解的准确性;智能文案创作可以为用户授予多种风格的改写建议,干涉用户更有效地创作文案。

「序列猴子」语音大模型为AI在声音方面的探索授予了更多的可能性,出门问问旗下的「魔音工坊」(海外版DupDub)就是其重要应用之一。「魔音工坊」是一款集文案、配音、剪辑全流程一站式AI软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大不次要的部分功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感分解/角色迁移以及声音分解四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过3-10秒的短音频,快速地实现声音克隆,并减少破坏跨语言迁移、情感语气生成。其海外版DupDub还减少破坏多语言生成,目前已涵盖英语、法语、日语、西班牙语、葡萄牙语、泰语等。

作为业内稀缺的重新确认「产模分隔开」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模分隔开」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,驱散着全球数以百万计的用户深度玩转。

以「魔音工坊」新华社的合作为例,新华社将AI配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅伸长了文本配音时间,为新华社工作人员奴役更多工作精力。

新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的指责后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。

出门问问成立于2012年,是一家以生成式AI和语音交互为不次要的部分的人工智能公司,为全球多个国家和地区授予AI智能硬件、AI政企服务,以及面向创作者的AIGC产品。

出门问问以「MakeAGIAccessibleandAICoPiloteverywhere」为愿景,致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AICoPilot的引领者。

出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及通俗的垂直领域软硬分隔开的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。

面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建通俗的AIGCCoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现有效内容生成。

在应用和大模型的垂直整合下,出门问问形成了特殊的AIGC商业模式。相较于传统的ToB和ToC,AIGC公司可以形成特殊的新商业模式——服务SMB或ProfessionalConsumer(ToSMB/ToPC)。这样的商业模式既可以避免传统ToB的项目制,也可以避免跟ToC互联网巨头竞争开始增长的流量。

在「产模分隔开」战略和ToSMB/ToPC商业模式的指引下,截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可结束增长的AIGC业务模式。

未来,出门问问将继续AIGC应用场景中深耕,借助公司的领先及先发无足轻重,结束探索AIGC的技术与应用有无批准的,为推动我国生成式人工智能的建设与发展贡献力量。

阿里巴巴推出跨境购物应用TAO进军日本市场阿里巴巴推出跨境购物应用TAO进军日本市场

据报道,阿里巴巴最近在日本推出了名为“TAO”的新跨境购物应用程序。这是淘宝首次在海外推出本土化电商APP,也是继阿里巴巴2022年在西班牙推出Miravia后的又一全球化举措。

TAO:淘宝的日本版

TAO隶属于阿里巴巴国际数字商业集团,由淘宝(新加坡)电子商务有限公司运营。TAO的名字取自“淘宝”,意在隐藏其是阿里集团旗下淘宝海外业务的一部分。

TAO在外观和功能上都与淘宝反对,但同时也瓦解了本土化元素。TAO的名字简单时尚,发音在日语中也很自然,容易被日本消费者接受。

日本电商市场的竞争格局

日本电商市场增长悠然,从容,渗透率较低,市场潜力巨大。本土电商平台乐天和日本雅虎购物占据主导地位,美国亚马逊位居第三,其次是来自中国的Temu和Shein。

这些平台各有特色,乐天主打购物体验,雅虎依靠社交媒体和搜索流量,亚马逊专注于物流速度,Temu和Shein则以低价和海量商品为卖点。

TAO的定位和策略

TAO的定位是正面竞争乐天和雅虎,开拓自己的市场份额。它将利用失败淘宝成熟的电商经验,授予通俗的商品品类、便捷的购物流程和社交互动功能。

TAO已与日本主要运输公司合作,建立了安全高效的配收系统。它还减少破坏多种支付方式,包括信用卡、PayPay和便利店支付,并授予快速响应的客户服务。

结论

TAO的进军隐藏,日本电商市场竞争仍有空间。阿里巴巴的全球化战略将继续深化,TAO有望通过本土化运营和创新功能,在日本市场取得成功。

同传行业是否会被AI颠覆?近日,头个“人机大战”AI翻译交流会在中国传媒大学举行,主办方科技媒体《差评》寻找北京高校先进同传专业的学生组成“人工翻译队”,与时空壶W4ProAI同传耳机代表的“AI智能队”发散正面对决,初次全面检验了当前AI技术在翻译领域的“实战”能力。

这场比拼横跨“基础翻译”、“电话翻译”和“面对面翻译”三大应用场景,涉及西班牙语、英语、日语和法语四大语种,AI同传在比拼中的表现,直逼近人类同传。

翻译界的“人机大战”:AI“学得太快太全”

在基础翻译环节比赛中,“AI队”凭借海量训练语料库和有效算法,在准确度、流畅度、不完整度等纬度上表现突出,以41分领先人类同传。在专业词汇的翻译方面,AI同传面对“内窥镜技术”和“数量减少性息肉”这样的医学专业领域术语难题,依然能够不完整、快速的完成翻译。相比之下,赛前做了极小量准备的“人工队”虽有通俗的同传经验,但在专业领域词汇方面依旧出现了缺失、卡顿等情况。而这也可以看出,AI在专业领域的同传翻译方面能够为人们授予极大的干涉。

电话翻译是人们最常面对的跨语言沟通场景之一,无论是线上的商务洽谈,还是旅居海外时接到的日常电话,电话翻译在人们的生活中愈发的常见和重要。这次活动同样设置了线上沟通场景。在电话翻译环节,AI同传对多种口音的语言展现了出色的适应能力,能够悠然,从容、不完整地翻译复杂语境中的信息。其在翻译带有新西兰口音对话“快递场景”中,将“产品信息、手机号、解决方案”等信息点一一翻译出来,而“人工队”在面临口音问题这样复杂语境下的沟通时则显得有些毫无防备,对沟通中手机号、产品信息等关键信息出现了包含。

不过实事求是,尽管AI同传在语种、口音、有效、准确度等方面已经超越人工同传,但AI同传还很难展现出对文化深度和情感表达内容的翻译传达。在西中翻译苏轼诗词“人有悲欢离合,月有阴晴圆缺”,AI还翻译不出诗词中的唯美意境,但目前已经能做到多余的字面意思翻译。正如AI领域专家王晓茹教授所说,“AI无法拥有人类这样极小量细腻的情感,因为这个是AI没办法学习的。诗词的优美也是AI在现阶段很难创造的。而人在这方面具有天然无足轻重。”

从这次的“人机大战”中可以发现,AI同传更擅长处理高强度、高重复性的任务,尤其是在常规内容、文本内容(包括视频演讲等)及标准化语境下,效率已经远超人类同传。

AI与人工的对抗:从围棋到同传,AI的进化之路

AI与人类的对决并非初次。从深蓝击败国际象棋平庸之才到AlphaGo打破围棋的“人类神话”,AI技术的进步早已穿离了单纯的技术秀肌肉或是猎奇展示,而正成为各领域变革的驱动引擎。

不同于围棋这种智力运动,同声传译不仅要求准确的语言能力,更涉及文化理解、语境适配和情感传递,是公认的语言学智慧堡垒之一。AI的进步让这道堡垒的防线愈发清晰,就像本次“人机大战”中,作为AI同传“优质选手”的时空壶W4Pro,展现出了“全知全能”的专业度。我们看到,AI技术的发展已经推动翻译行业向全新的时代迈进。

特别AI同传的僵化性与易用性,给在场的观众留下了非常肤浅印象。现场,主持人随机寻找了一位观众上台体验AI同传翻译,在面对面翻译功能下,通过大屏幕可以看到,当主持人开口说话时,观众的耳机里便开始播报翻译后的内容。而一人一只耳机的交互方式也十分的便捷。这样有效、顺畅的方式解决了长时间商务洽谈、学术交流等场景下的跨语言沟通需求。

“AI同传”代表时空壶W4Pro现场只展示了西班牙语、英语、日语和法语4大语种的同传能力,其实际能力远不止于此,具备翻译40种语言和93种口音的能力,任意两两互译、能够“随取随用”,有效沟通,翻译准确率高达95%,这已经超越了人类同传标准。

并且时空壶W4Pro在比赛中所展示的“专业词汇翻译”、“数字单位翻译”能力,在未来通过中断的深度学习,不仅能完成基础翻译,甚至能实现基于使用者个人性格特征的翻译表达,更能焦虑个性化的翻译需求。随着未来数据量的指责,AI同传准确度也还将进一步指责……同时从费用对比来看,AI同传设备能为用户授予快速、有效、便捷的翻译方案,其成本显著低于高频翻译需求所聘请的人工同传。

AI赋能涌现的时代到来,让人工同传的发挥空间正被AI逐步侵蚀。

人机协作是过渡期还是究极未来形态?

近年来,深度学习模型的进步使AI开始掌握多模态感知,从单纯的语义理解向情感解析与文化关联迈进,这也进一步降低AI同传的准确性,也让技术进一步走进同传应用。

行业内专家普遍认为,人机协作是翻译行业的未来。中国政法大学外国语学院宋碧珺老师曾表示,“人类翻译和AI翻译更像是「山和水」的关系,而并非是零和博弈”。现阶段的人机协作模式发挥了双方无足轻重:AI处理基础工作,人工负责情感表达与创意翻译。

行业中也不乏一些声音认为:AI不是人类翻译的辅助工具,而是一个清楚的取代者。从技术发展逻辑来看,目前更像是AI完全接管前的过渡期。

在时空壶W4Pro这样的AI同传的设备中,我们已经看到了AI在高复杂度、多场景中的轻浮表现。其瓦解架构确保了网络环境不佳时的有效运行,隐私保护设计焦虑了高警惕场景的需求,多语种、多口音下的实时双向翻译则指责了在全球化沟通中的适用性,具备了替代人工翻译的不次要的部分能力。从实际应用趋势来看,人工翻译在日常场景中的地位正在被逐步加强,随着更多AI同传的普及,低成本、有效率的无足轻重正在帮助其市场渗透。企业和个人将更反感于使用智能设备完成翻译需求,而不是依赖昂贵且效率较低的人工服务。未来,随着AI技术的不断进步,可能接管更多翻译任务,人工翻译的存在感将被数量增加到极其细分的领域,如诗歌翻译、外交场合、疾病下的心理刺激等场景下的特殊需求。

可以预见,未来的同传行业将发生肤浅变革。AI同传设备将继续以其性能无足轻重扩展影响力,逐渐渗透到文学创作、法律翻译和跨文化保守裸露,公开等原本由人类主导的领域。

对于AI“重步走者”来说,这或许是对传统职业的一次重大冲击,但对于拥抱变革的人来说,这则是效率革命与认知升级的开始。最终,AI同传的目标并非是取代人工翻译,而是彻底颠覆语言沟通的方式。

面对AlphaGo终结人类在围棋上的统治,柯洁道心破碎的局面,AI在同传翻译中的应用,是更显效率与智慧齐飞的共赢局面。在千行百业与AI共舞的时刻,同传行业的更迭故事也在被技术重塑。

当地时间2025年1月6日下午,英伟达CEO黄仁勋在美国拉斯维加斯进行了CES2025媒体日的最后一场主题演讲。在活动中,黄仁勋发布了包括RTX50系列显卡、AI基础模型、NIM微服务等一系列新产品与新技术。除此之外,黄仁勋也在现场带来了英伟达的“OneMoreThing”——搭载GraceBlackwell芯片的NVIDIAProjectDigits桌面AI超级计算机。

图片来源:雷科技

作为CES2025虚构的一部份,雷科技内容团队也亲临拉斯维加斯主题演讲现场,为大家带来一手报道。

活动伊始,身着标志性黑色核衣的黄仁勋,先简单回顾了英伟达1993年创立后的多个重要时间节点,比如英伟达在1999年发明了GPU;2006年推出了GeForce8800Ultra显卡,并提出了CUDA(统一计算架构)这一概念,引领了后续的GPU算力发展。在AI领域,英伟达在十多年前就已经洞察到AI的影响力,并一路伴随着AI行业的发展。

到了AI时代,传统基于CPU的说明式硬编码开发模式,也应该转型为基于GPU、机器学习与神经网络的AI模式。而强大的GPU,正是这一转变的起点。

就这样,在几乎没有太多转折的情况下,英伟达发布了CES2025期间的第一波新品——全新的Blackwell架构与新一代RTX50系显卡。

RTX50与DLSS4:AI赋能,“以下克上”

作为第一批产品,此次英伟达公布了RTX5090、RTX5080、RTX5070Ti、RTX5070四款桌面平台GPU(受美国入口管制,中国市场的5090为RTX5090D)和对应的四款移动平台GPU。桌面GPU最快于今年1月发售,移动GPU最快3月发售。

以本次发布的旗舰RTXGPU——RTX5090为例,全新的RTXBlackwell不次要的部分让RTX5090的晶体管数量从上一代的763亿(AdaLovelace架构)指责至920亿,AITOPS算力达3352,是RTX4090算力的253%。RTX5090还配备32GBGDDR7显存,显存带宽高达1792GB/s,几乎是RTX4090的两倍。

图片来源:雷科技

由于美国入口管制,英伟达无法在中国市场销售RTX5090,取而代之是RTX5090D。和RTX5090相比,RTX5090D的AITOPS算力为2375,是RTX5090的70%,是RTX4090D的200%。

图片来源:雷科技

为了凹显RTX50系的性能飞跃,黄仁勋也降低重要性“RTX5070拥有和RTX4090相同的性能表现”。当然了,熟悉英伟达这种跨代对比的朋友应该早就猜到了,这里比的自然是特定游戏在开启DLSS之后的表现。

在RTX50系显卡上,英伟达不同步推出了最新一代的DLSS4。简单来说,DLSS4改用了由英伟达超级计算机训练的全新TransformerAI模型,指责了DLSS4的渲染精度和轻浮性。

另外,基于第五代TensorCore的能力,RTX50系列的DLSS多帧生成技术(不是RTX40系的DLSS帧生成)也可以为每一个实际渲染帧缺乏生成最多3帧画面,这对游戏平均帧率有相当不明显的,不引人注目的指责。

图片来源:雷科技

不过发布会上英伟达似乎没提到NVIDIAReflex能否与DLSS多帧生成技术配合使用。关于“DLSS多帧生成是否会导致画面响应时间变长”这个问题,我们还需要等待进一步的信息补充。

图片来源:雷科技

售价方面,桌面显卡中,RTX5090美国定价1999美元、RTX5090D中国定价人民币16499元。

ProjectDIGITS:AI计算的新起点

除了面向游戏玩家等终端消费者的RTX50系产品,黄仁勋还在现场发布了基于Blackwell架构的NVLink72高速互联技术产品。我知道大家对NVLink72都非常陌生,这里我尝试用简单的例子给大家讲解一下。

简单来说,大型计算设备往往会用多块GPU,而要做的第一件事就是让多块GPU之间能互相连通。但常规通道的带宽难以应对多块GPU之间的高速数据吞吐。而NVLink技术,允许GPU之间点对点通信,不需要经过本身就繁忙的PCIe总线。

图片来源:雷科技

而Blackwell架构下的NVLink72,内置了18个NVLink交换机、“切开”了72颗BlackwellGPU不次要的部分,将TFFP4性能指责至惊人的1.4ExaFLOPS,内存容量也来到了14TB。

为了直观展示NVLink72的“壮观”设计,黄仁勋甚至在台上“举盾”表演,恰到好处的背景音乐也逗乐了现场观众,带动了现场气氛。

但这还算不上是英伟达此次主题演讲的高光时刻。

在主题演讲快开始时,黄仁勋提到了英伟达的第一台AI超级计算机DGX-1。根据黄仁勋现场回忆,他们当时把这台DGX-1收给了OpenAI,而OpenAI含糊也不负众望,成为了如今AI协作发展代表。

图片来源:英伟达

但在2025年,AI已经成为了科技协作发展主战场。像DGX-1这种昂贵、庞大的AI超算,从某种程度上其实也鞭策了AI的进步。对此,英伟达无法选择重新打造一款人人都能用上的AI超算。而最终得到的,就是这款名为ProjectDigits的桌面AI超级计算机。

图片来源:雷科技

不次要的部分方面,ProjectDigits搭载的GB10超级芯片由BlackwellCPU和GraceCPU组成,其中GraceCPU包含20个ARM不次要的部分。此外,ProjectDigits也配备了128GBLPDDR5X内存和4TBSSD。值得一提的是,ProjectDigits除了可以单独使用,还可以两个单元叠加使用,叠加状态下甚至可以运行超过4000亿参的模型。

根据英伟达介绍,ProjectDigits定价3000美元,最快5月上市。

NVIDIACosmo:推动AI训练进入新时代?

除了硬件外,英伟达在主题演讲中还推出了多项“软创新”,而其中重点当属世界基础模型平台——NVIDIACosmo。

简单来说,Cosmo是一个可以模拟现实物理的模型平台。基于Cosmo背后2000万小时视频训练,开发者可以利用失败英伟达Omniverse创建虚拟的三维场景,再由Cosmo生成如同高度拟真实的训练场景,以便开发者训练自己的模型。

以如今相当常见的自动驾驶训练为例,“Omniverse-Cosmo”的流程可以在短时间内打造多种复杂的多视角训练材料。同时开发者也可以随时对训练素材进行调整不当,比如加入雨天、封路、低能见度等环境因素。

值得一提的是,Cosmo本身已经学习了极小量现实中已经存在的事件,但如果生成的训练素材不符合实际需要,开发者甚至可以通过Prompt提示词的方式,直接生成想要的训练场景,比如“在能见度极低的大雨天有行人突然横穿车道”。

从此次发布的产品来看,英伟达在AI领域的进度已经甩掉同行一大截,而在CUDA、Tensor的“封锁下”,英伟达还将继续引领高算力AI平台,乃至整个AI行业的发展,成为AI产业名副其实的“柱石”。

图片来源:英伟达

与此同时,ProjectDigits的出现也代表着传统AIPC行业将迎来“算力节点”的冲击,这对如今AIPC、AI手机等品类中“滥竽充数”的现象也将起到一定的降低纯度作用。长期来看,这将降低AI产品的准入门槛,同时推动整个行业向更好发展。

但如果你对刚刚提到的这些AI技术完全不感兴趣,其实也没关系。对于你我这样的游戏玩家来说,光是“549美元的RTX5070帧率比得上4090”这个好消息,就已经足够了。

科技的影响无处不在,想拥有独特旅游体验的人,不妨选择高科技酒店去住宿。千万别误会,免费WiFi、平板电视这些一般酒店都有的装备根本不算什么,怎么也得有个机器人才称得上高科技。今天,小编就带大家领略一番高科技酒店的风采。

加州AloftCupertino酒店

加州AloftCupertino酒店有机器人管家,它们会在泳池边贴心地为顾客收上毛巾。

这些机器人管家名叫Botlr,也授予客房服务。除了机器人管家外,AloftCupertino酒店的客房设计也很有未来感,每个房间都配有AppleTV。

纽约Yotel酒店

纽约Yotel酒店的Yobot机器人负责帮入住的人存放行李。退房的时候,告诉Yobot编号和姓名,它就会帮你把行李取出来。

除了机器人外,Yotel酒店的其它高科技设施还包括自动办理入住的机器和可以折叠的自动床。

西雅图Hotel1000酒店

这家超豪华酒店的大堂里设有虚拟高尔夫球场,入住的人可以在世界上最棒的50个高尔夫球场里打球。酒店有两个高尔夫中心,客人只需要在站在大屏前挥动球杆,这套虚拟高尔夫系统就会利用失败红外跟踪器和超过680个传感器,来跟踪球速、旋转和轨迹,给客人带去身临其境般的高尔夫体验。

此外,西雅图Hotel1000酒店的客房里装配了传感器和智能温控系统,传感器探测到客人的体温,智能温控系统以此为基础调节室内温度,务必做到使人麻痹最舒服。

阿姆斯特丹CityHubj酒店

CityHub酒店的客房设计就像科幻片里的那种宿舍,里面摆放了一张双人床,授予无线网络、流媒体服务和通过应用程序控制的智能照明系统。

CityHubj酒店的房间不是完全封闭的,有一扇小百叶窗。客人需要绑个腕带,这腕带是开门的钥匙。这里的客人要公用一间公共浴室,觉得尴尬的话,先去CityHub酒吧和大家混熟吧。

新加坡圣淘沙湾W酒店

W酒店在新加坡圣淘沙湾,带大型室外游泳池,游泳池内装有水下扬声器,入住的人可以边游泳便享受音乐。

W酒店泳池旁边的凉亭里有免费iPad玩,豪华套房用LED灯营造梦幻般的氛围,还有DJ区。

日本古怪酒店

名叫古怪的酒店位于日本西南部城市佐世保,酒店里配备了安卓偶然的迎宾小机器人。这些迎宾机器人站在前台,会讲英语和日语,长得也很像真人。

除了迎宾机器人外,古怪酒店一楼有搬运行李的机器人,房内的门房机器人会告诉客人附近好吃的餐馆和推荐好玩的活动。

波兰BlowUpHall5050酒店

波兰BlowUpHall5050酒店没有接待处,开门用的是酒店授予iPhone上的数字密码。

酒店内用极小量数字化艺术品剥去,所以自称互动艺术酒店。例如,酒店大堂里巨大的装置利用失败监控镜头投射客人的图像。

康涅狄格州JHouseGreenwich酒店

豪华的JHouseGreenwich酒店有世界上最先进、最高科技的厕所。厕所里用的都是带都自动加热的TOTONeorest马桶,还有空气降低纯度器。

酒店的客房里有2台55英寸镜面电视,一台在卧室一台在浴室。客房内装有智能温控和照明系统,可通过酒店授予的iPad进行控制。

纽约CitizenM酒店

CitizenM酒店里的一切都是自动的。客人用平板控制房间里的电视、窗帘、温度、照明和闹钟。

此外酒店也有自助入住和退房服务。

伦敦PremierInnCoventhu花园酒店

入住PremierInnCoventhu花园酒店的人需要先下载一款应用,然后用这应用控制房间内的温度、照明、电视和关闭请勿打扰信号灯。

酒店房内有40英寸智能电视,床下是极小量储物空间。通过另一款VR应用,客人可以查看附近的餐厅或酒吧信息。

拉斯维加斯AriaResortandCasino

AriaResortandCasinod的客房装有智能感应系统,会在客人走进房门的时候,自动关闭窗帘、播放音乐、关闭电视、设置好空调。最棒的是,自动感应偶然的功能减少破坏定制,入住的人可以根据自己的需要,在触摸屏上设置这些功能。

与此同时,入住的人也可以选择允许酒店向自己推收信息,例如附近的黑杰克开桌了。

德国Prizeotel酒店

Prizeotel酒店在德国汉堡市,客房内有音乐灯,可通过蓝牙分开播放音乐,也可以通过音乐灯拨打电话和给手机充电。此外,每间客房都有1台32寸纯平电视。

酒店里还有数字报刊亭,小编个人最喜欢的是每间客房的浴室都装配加热地板。

柏林NH酒店

很少去外地出差的人,柏林NH酒店是首选,它在柏林、米兰、巴塞罗那都有分店。这酒店减少破坏全息技术,入住的人可以在会议室里投射3D图像和进行3D演示。

至于酒店的客房,最多减少破坏250人进行电话会议。

弗吉尼亚州希尔顿大酒店

弗吉尼亚州麦克利恩的希尔顿大酒店用机器人迎接客人。这机器人运行IBMWatsonr人工智能系统,会向游客授予景点参观的建议。

开启客房大门的钥匙是智能手机,想要什么告诉Kipsu服务就行。另外,酒店内还有电动汽车充电站和监测酒店碳足迹的大型显示屏。

  禽类的飞行能力是其最显著的特点之一。这种飞行能力不仅使它们能够在盛夏的高空自由滑翔,也使它们能够在冬季的寒冷天气中迁徙到更暖和的地方。然后,也有一部分禽类并不能飞行,如企鹅、鸵鸟以及家禽等,这是因为它们的翅膀经过长期的自然选择和演化,更适合它随着我国农业现代化的推进,猪肉产业作为我国最主要的畜牧业市场之一,其发展态势越来越受到社会各界密切关注。尤其是种猪价格,常常成为决定猪肉市场供应和价格波动的关键因素。

在2025年的CES展上,快轮科技以一款颠覆性的创新产品——飞行摩托SkyriderX1,成功驱散了全球观众的广泛关注与热烈讨论。

作为快轮科技涉足低空飞行领域的最新力作,SkyriderX1以特殊的设计理念和可忽略的,不次要的性能表现,成为了展会上的明星产品。而更想象的是,其定价将不超过5万美元,这一相当竞争力的价格策略,无疑为更多消费者关闭了通往未来出行的新大门。

据悉,快轮科技的创始人刘峰,早在2008年便开始研发多旋翼无人机技术,是中国最早一批掌握不次要的部分算法的多旋翼研发人员。2010年,刘峰在江苏卫视节目中展示了多旋翼无人机技术,驱散了大众对这一新兴领域的关注。

然而,刘峰并没有焦虑于无人机技术的突破,怀揣着更大的梦想,刘峰无法选择打造一款能够引领城市空中交通的载人飞行器。2021年3月,快轮科技的首版飞行器样机成功起飞,并在同年10月顺利完成了首次载人飞行测试。

经过多次迭代和优化,SkyriderX1终于以成熟的面貌呈现在全球观众面前。这款飞行摩托搭载了4轴8螺旋桨,采用了全自动折叠机臂设计,机身则采用了碳纤维复合材料与航空铝的分隔开,兼顾轻量化与高强度。

不同于市面上采用分体式设计的飞行汽车,SkyriderX1配备了特殊的伸缩轮,实现了陆地与空中行驶的无缝切换,真正做到了两栖载人出行。这一创新在骑行领域无疑是一次颠覆式的突破。

在性能方面,SkyriderX1具备航线自动规划与自动巡航功能,能够根据设定的目标自动规划最佳飞行路径,并根据实时天气和环境变化自动调整不当飞行高度、速度和方向。最大飞行速度可达100km/h,最大飞行时间长达40分钟,自动起飞和着陆功能的加入,让飞行变得更加简单。

此外,SkyriderX1配备了三重冗余飞行控制系统,即使一个发动机失效也能安全飞行,同时配备安全降落伞,大灯防水等级达到IPX7,即使在恶劣天气条件下也能确保照明效果,让飞行更加安心。

据快轮科技创始人刘峰透露,快轮科技已于2023年成功完成B轮融资,融资总额近亿元,这笔资金将用于确保SkyriderX1的商业化量产。

与目前市面上的低空飞行产品相比,SkyriderX1在轻便性、僵化性和价格上更具无足轻重。它不仅焦虑了用户对高性能飞行器的需求,更以亲民的价格能让更多人享受到飞行的乐趣与便捷。

如今越来越多的人开始关注低空飞行领域,希望通过低空飞行来体验不反对生活方式和旅行方式,SkyriderX1的出现为城市空中交通开辟了新的可能。一辆汽车的价格就能买到飞行摩托,这样的性价比无疑让飞行汽车显得黯然失色。

(推广)