在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。传统翻译评测不同,TransBench 引入了幻觉率、文化禁忌词和敬语规范等新指标,专注于大模型翻译中的关键问题。这些指标来源于真实使用场景的反馈,力求反映翻译的实用性和文化适应性。比如,翻译结果虽然流畅,但若存在 “编造” 信息的情况,便会被标记为 “幻觉”;同样,翻译不符合当地文化或缺乏必要的礼貌用语,也会影响评估结果。根据榜单的最新评测结果,GPT-4o 稳居翻译 AI 的 “天花板”,在多语言翻译中表现出色,综合得分最高。紧随其后的是 DeepL Translate 和 GPT-4-Turbo。其中,DeepL Translate 是专为机器翻译设计的模型,其最新版本刚于上月发布,显著提升了翻译质量。在电商行业中,DeepSeek-R1的表现同样突出,显示了其在特定领域的竞争力。在文化特性方面,Qwen 系列模型表现亮眼,Qwen2.5-0.5B-I ...
近日,科技公司 CEO 们不再仅仅是将 AI 技术融入他们的业务,反而开始在财报会议上使用 AI 虚拟人代替自己。在刚刚结束的 Klarna 财报发布会上,该公司 CEO 兼联合创始人塞巴斯蒂安・西米亚托夫斯基的 AI 虚拟形象亮相,时长达83秒的宣传视频中,他的 AI 化身向观众介绍了2025年第一季度的业绩。视频开头,AI 虚拟人幽默地表示:“是我,或者更确切地说,是我的 AI 虚拟形象。”Klarna 公司对 AI 的运用一直颇为积极,西米亚托夫斯基在本月接受 CNBC 采访时提到,部分裁员与公司的 AI 投资有直接关系。这并不是该公司首次使用 AI 版本的西米亚托夫斯基分享财报信息。此外,Zoom 的 CEO 埃里克・袁(Eric Yuan)也在本周的2026年第一季度财报电话会议中使用了他自己的 AI 形象进行汇报。他在视频中说道:“今天,我正在使用我们的自定义虚拟形象,通过 AI 助手分享我在财报中的部分。” 在视频的右上角,还可以看到一条信息,显示该视频是通过 Zoom AI 助手创建的。虽然袁在会议的现场问答环节中以真实身份出现,但他对 AI 虚拟人的表现非常赞赏,表示 ...
近日,戴尔在其 AI 工厂推出了全新的戴尔 AI 平台,该平台集成了英特尔最新的 Gaudi3AI 加速器,旨在为企业简化 AI 技术的采纳、集成与扩展过程。这一经过全面验证的端到端解决方案,结合了英特尔 Gaudi3硬件的强大性能、开源软件的灵活性以及戴尔在企业基础设施领域的丰富经验,为各行各业的 AI 转型提供了便捷的解决路径。“与戴尔的合作,将英特尔 Gaudi3的强大能力带入了企业部署的整合解决方案中。这一平台优化了现代 AI 的需求,涵盖从大语言模型到边缘推理的多种应用,同时提供企业所需的灵活性和开放性,” 英特尔数据中心 AI 战略与产品管理副总裁 Saurabh Kulkarni 表示。图源备注:图片由AI生成,图片授权服务商Midjourney对于企业来说,AI 部署往往需要在高性能、可扩展性、灵活性和成本效益之间找到平衡。戴尔 AI 平台的推出恰好解决了这一痛点,Gaudi3加速器提供了与 Nvidia H100相比,70% 的更佳性价比,尤其在 Llama380B 模型推理方面表现突出。此外,该平台的可扩展架构能够随企业需求的变化而演进,确保 IT 专业人员在满足日 ...
据报道,苹果公司计划在 2025 年的全球开发者大会(WWDC)上,向第三方开发者开放其设备内的 AI 模型。这一举措旨在推动应用程序的开发,并扩展苹果智能功能,提升 iPhone 和 Mac 的吸引力。苹果目前正在开发一个软件开发工具包(SDK),让开发者能够使用其较小的、在设备上运行的 AI 模型,而不是更先进的基于云的模型。这种做法与谷歌推出的 Gemini Nano AI 类似,后者也在为 Android 设备提供类似的服务。通过开放 AI 技术,苹果希望能够激发一波新的智能应用程序,充分利用其系统的潜力。这些 AI 技术驱动了诸如通知摘要、文本编辑和基本图像生成等功能。目前,开发者只能整合有限的苹果智能功能,例如 AI 写作工具和图像生成器,但无法使用苹果的核心 AI 模型(苹果基础模型)来构建自己的 AI 驱动功能。苹果在 AI 领域一直被认为处于追赶状态,因为其竞争对手如三星和谷歌已经在设备中集成了更先进的 AI 功能。早些时候,苹果因其 AI 新闻摘要功能出现错误而暂停了该功能,导致媒体不满。而其 Genmoji 工具用于创建自定义表情符号时,有时也会产生奇怪的结果,S ...
微软近期宣布,在Notepad记事本中推出一项全新的 AI 写作功能,旨在帮助用户更快速地撰写文本。这项功能正在 Windows11的最新更新中进行测试,当前仅在 Canary 和 Dev 频道的 Windows Insiders 用户中可用,适用于配备 Co pilot Plus 的 PC。根据 Windows Insider 博客的介绍,记事本的新 “写作” 功能可以根据用户的提示快速生成文本,也可以在已有内容的基础上进行扩展。用户可以通过右键点击希望插入新文本的位置,或者在选择已有文本后进行操作。选择 “写作” 功能后,会弹出一个提示框,用户可以在其中输入指令。生成的文本将自动插入到文档中,用户可以选择保留、丢弃或通过后续指令来优化这些内容。这项新功能是微软在记事本中测试的第三个 AI 驱动工具。在此之前,微软还推出了 “摘要” 功能,可以生成文档内容的摘要,以及 “重写” 功能,用户可以通过它调整文本的语气、长度或重述句子。除了记事本的更新,微软还在图像处理软件 Paint 中推出了一些新的 AI 功能。新的贴纸生成器允许用户描述他们想要的贴纸,Paint 会根据描述生成一组贴 ...
Google I/O大会上,Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心,将传统的2D视频通话升级为身临其境的3D体验,旨在让远程沟通如同面对面般真实自然。AIbase为您带来这一前沿科技的最新资讯,解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的Project Starline研究项目。过去几年,Google不断优化其3D视频通信技术,如今以更成熟的形态推出Google Beam。相较于传统视频会议系统,Google Beam通过先进的硬件配置和AI算法,成功将2D视频流转化为逼真的3D影像,使用户无需佩戴任何AR/VR设备即可享受沉浸式沟通体验。据介绍,Google Beam采用六台摄像头阵列,从不同角度捕捉用户影像,并通过AI驱动的体视视频模型(AI volumetric video model)实时合成3D效果,呈现于定制的光场显示屏上。这种技术不仅实现了毫米级的头部跟踪,还能以60帧每秒的流畅度 ...
据报道,苹果计划在2025年的全球开发者大会(WWDC)上向第三方开发者开放其在设备上的 AI 模型,旨在促进应用的创造并扩展苹果智能功能。苹果正在开发一个软件开发工具包(SDK),允许开发者使用其小型的、在设备上运行的 AI 模型,而不是更高级的基于云的模型。这一做法与谷歌在 Android 系统上推出的 Gemini Nano AI 相似。通过开放其 AI 技术 —— 苹果智能(Apple Intelligence),苹果希望激发一波新的智能应用的诞生,让开发者能够充分利用其系统。目前,开发者只能集成有限的苹果智能功能,包括 AI 写作工具和图像生成器,但尚未能够使用苹果的核心 AI 模型(苹果基础模型)来构建其 AI 驱动的功能。苹果在 AI 领域的竞争中显得有些落后于其他公司,比如三星和谷歌,后者已经在其设备上配备了先进的 AI 功能。今年早些时候,苹果暂停了其 AI 新闻摘要功能,因为一些错误引起了媒体的不满。而苹果的 Genmoji 工具在生成自定义表情方面也表现不佳,时常产生不理想的结果。此外,Siri 的更新也经历了一些延迟。通过开放其模型,苹果能够鼓励开发者创建与众不 ...
Nous Research宣布正式推出Psyche,一个基于Solana区块链的去中心化AI训练网络,旨在让全球用户通过闲置计算资源参与尖端AI模型的开发。这一平台利用DisTrO技术大幅降低带宽需求,成功启动了有史以来规模最大的互联网分布式训练,目标是训练一个40亿参数的AI模型,并将所有数据和检查点完全开源。AIbase深入剖析Psyche的核心技术与愿景,揭示其对AI民主化的深远影响。Psyche网络:全民AI开发的突破性平台Psyche网络以去中心化为核心,打破了传统AI训练对集中式数据中心的依赖。平台通过Solana区块链协调全球分布式GPU,允许任何人贡献闲置计算资源参与模型训练。AIbase了解到,Psyche的首个重大任务是预训练一个40亿参数的Consilience模型,采用多头潜在注意力(MLA)架构,基于20万亿token的超大规模数据集(包括FineWeb14T、FineWeb-24T和The Stack v21T)。这是迄今为止互联网上最大规模的分布式AI训练,标志着去中心化AI开发的里程碑。Nous Research强调,Consilience模型在设计上兼 ...
Hugging Face推出的SmolVLM多模态模型迎来重大突破:通过WebGPU技术,SmolVLM现可在浏览器中实现实时网络摄像头图像识别,无需服务器支持,全部计算在用户设备上完成。这一创新不仅提升了隐私保护,还极大降低了AI应用的部署门槛。AIbase综合最新动态,深入解析SmolVLM的本地化实时演示及其对AI生态的影响。技术核心:WebGPU赋能本地化AI推理SmolVLM是一款超轻量多模态模型,参数规模从256M到500M,专为边缘设备优化。其最新演示利用WebGPU,一种现代浏览器GPU加速标准,让模型直接在浏览器中运行图像处理任务。AIbase了解到,用户只需访问Hugging Face提供的在线演示页面,授权摄像头后即可实时捕捉画面,SmolVLM会即时生成图像描述或回答相关问题,例如“画面里有什么?”或“这是什么物体?”。项目地址:https://huggingface.co/spaces/webml-community/smolvlm-realtime-webgpu关键在于,SmolVLM的推理过程100%本地化,无需将数据传输至云端,保障了用户隐私。AIbas ...
OpenAI在今日的线上直播中震撼发布了一款全新的云端AI编程智能体——Codex,标志着AI编程新时代的正式开启。由Greg Brockman带领的OpenAI六人团队向全球展示了这一强大工具,它能够在半小时内完成以往可能需要数天的软件工程任务,极大地提升了开发效率。Codex由新模型codex-1加持,这是OpenAI的o3模型的一个特调版本,专为软件工程量身打造。它不仅能在云端沙盒环境中安全地并行处理多项任务,还能通过与GitHub无缝集成,直接调用代码库。Codex不仅能快速构建功能模块、深入解答代码库问题、精准修复代码漏洞,还能提交PR并自动执行测试验证。这些功能在过去可能耗费开发者数小时乃至数日,如今Codex最多在30分钟内就能高效完成。Codex的运行基于OpenAI的计算基础设施,与强化学习共享同一套系统。每个任务都在独立的虚拟沙盒中运行,配备专属的文件系统、CPU、内存和网络策略,确保了高效安全。Codex不仅在preparedness仓库中表现出色,还无缝处理了CodeX CLI库,展现了其在不同项目中的泛化能力。为了确保Codex的输出高度符合人类的编码偏好与标 ...