Microsoft Build开发者大会上,微软正式推出了其开源项目Magentic-UI,一款以人为中心的人工智能网页代理系统。这款创新工具旨在通过智能自动化处理复杂网页任务,同时确保用户全程掌控操作流程。AIbase为您深入解析这一突破性技术的核心亮点及其潜在影响。Magentic-UI:人机协同的智能网页助手Magentic-UI是微软基于其Magentic-One和AutoGen框架开发的开源原型,旨在解决传统AI代理在网页任务自动化中缺乏透明度和用户控制的问题。该系统通过多智能体协作,能够自动完成网页浏览、点击、表单填写、文件读取、代码生成等复杂任务,同时保持高度透明,所有操作步骤都在用户界面中清晰展示。与传统全自动AI代理不同,Magentic-UI强调“以人为中心”的设计理念。用户在输入任务目标后,系统会生成详细的执行计划(如待办清单),用户可随时修改、删减或重新排序步骤,甚至暂停和重启任务流程。这种协作模式确保了自动化效率与用户控制权的完美平衡。透明与安全:用户始终掌握主动权Magentic-UI的独特之处在于其对用户信任和安全的重视。系统内置了可视化任务面板,实时展示 ...
在中国南方科技重镇深圳,人工智能(AI)硬件的发展正迎来一波新一轮的支持。近日,深圳市政府在全球人工智能终端博览会2025上宣布设立总额达70亿人民币(约合10亿美元)的投资基金,专门用于支持机器人及其他智能设备的初创企业。这两个基金分别为50亿人民币的主基金和20亿人民币的附加基金,显示出深圳对 AI 硬件产业发展的坚定决心。本次博览会吸引了300多家智能硬件展商参与,现场展示了中国在 AI 和机器人领域的最新创新成果。华为展示了其首款可折叠平板电脑,该设备运行华为自家开发的 HarmonyOS 操作系统,标志着公司在失去谷歌和微软服务后的自我突破。该产品已于本周一开启预售,预计于6月6日开始发货。在此次展会上,UBTech Robotics 展示了一款名为 “萌 UU” 的智能机器人,这是一款嵌入 AI 技术的掌中宝,能够与用户进行互动。同时,总部位于深圳的 EngineAI 则带来了其首款四足机器人,进一步扩展其在机器人领域的创新能力,之前它们专注于双足机器人的研发。此次博览会还见证了深圳 AI 眼镜产业联盟的成立,反映出业界对 AI 眼镜成为下一代消费电子产品的期待。谷歌最近与 ...
随着毕业季的临近,大学生在论文写作中使用 AI 技术的现象引发了广泛关注。近日,麦可思研究院发布了一项调查报告,显示尽管教师们普遍认可 AI 在论文写作中的辅助作用,但如何规范其使用以及防止学生过度依赖 AI,成为了亟待解决的现实问题。图源备注:图片由AI生成,图片授权服务商Midjourney调查显示,大学生使用 AI 工具来辅助论文写作的情况已经越来越普遍。在参与调查的教师中,仅有21% 明确反对学生使用 AI 写论文,而58% 的教师表示支持与否要视具体情况而定。只有21% 的教师对 AI 辅助写作持反对态度。当被问及本科生毕业论文中存在的问题时,46% 的教师认为学生在写作时 “过度依赖 AI 生成内容”。为了辨别 AI 生成的内容,高校教师在论文指导和审查过程中采取了多种方式。调查显示,64% 的教师会检查论文的整体逻辑和语言风格是否一致,这被认为是最有效的方法。其次,51% 的教师会通过问答来考查学生对研究内容的了解程度。值得注意的是,有41% 的教师表示会使用专业的 AI 检测工具来判断论文的原创性。然而,这些检测工具的局限性也引发了担忧。有报道指出,一些经典作品被错误标 ...
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。传统翻译评测不同,TransBench 引入了幻觉率、文化禁忌词和敬语规范等新指标,专注于大模型翻译中的关键问题。这些指标来源于真实使用场景的反馈,力求反映翻译的实用性和文化适应性。比如,翻译结果虽然流畅,但若存在 “编造” 信息的情况,便会被标记为 “幻觉”;同样,翻译不符合当地文化或缺乏必要的礼貌用语,也会影响评估结果。根据榜单的最新评测结果,GPT-4o 稳居翻译 AI 的 “天花板”,在多语言翻译中表现出色,综合得分最高。紧随其后的是 DeepL Translate 和 GPT-4-Turbo。其中,DeepL Translate 是专为机器翻译设计的模型,其最新版本刚于上月发布,显著提升了翻译质量。在电商行业中,DeepSeek-R1的表现同样突出,显示了其在特定领域的竞争力。在文化特性方面,Qwen 系列模型表现亮眼,Qwen2.5-0.5B-I ...
近日,科技公司 CEO 们不再仅仅是将 AI 技术融入他们的业务,反而开始在财报会议上使用 AI 虚拟人代替自己。在刚刚结束的 Klarna 财报发布会上,该公司 CEO 兼联合创始人塞巴斯蒂安・西米亚托夫斯基的 AI 虚拟形象亮相,时长达83秒的宣传视频中,他的 AI 化身向观众介绍了2025年第一季度的业绩。视频开头,AI 虚拟人幽默地表示:“是我,或者更确切地说,是我的 AI 虚拟形象。”Klarna 公司对 AI 的运用一直颇为积极,西米亚托夫斯基在本月接受 CNBC 采访时提到,部分裁员与公司的 AI 投资有直接关系。这并不是该公司首次使用 AI 版本的西米亚托夫斯基分享财报信息。此外,Zoom 的 CEO 埃里克・袁(Eric Yuan)也在本周的2026年第一季度财报电话会议中使用了他自己的 AI 形象进行汇报。他在视频中说道:“今天,我正在使用我们的自定义虚拟形象,通过 AI 助手分享我在财报中的部分。” 在视频的右上角,还可以看到一条信息,显示该视频是通过 Zoom AI 助手创建的。虽然袁在会议的现场问答环节中以真实身份出现,但他对 AI 虚拟人的表现非常赞赏,表示 ...
近日,戴尔在其 AI 工厂推出了全新的戴尔 AI 平台,该平台集成了英特尔最新的 Gaudi3AI 加速器,旨在为企业简化 AI 技术的采纳、集成与扩展过程。这一经过全面验证的端到端解决方案,结合了英特尔 Gaudi3硬件的强大性能、开源软件的灵活性以及戴尔在企业基础设施领域的丰富经验,为各行各业的 AI 转型提供了便捷的解决路径。“与戴尔的合作,将英特尔 Gaudi3的强大能力带入了企业部署的整合解决方案中。这一平台优化了现代 AI 的需求,涵盖从大语言模型到边缘推理的多种应用,同时提供企业所需的灵活性和开放性,” 英特尔数据中心 AI 战略与产品管理副总裁 Saurabh Kulkarni 表示。图源备注:图片由AI生成,图片授权服务商Midjourney对于企业来说,AI 部署往往需要在高性能、可扩展性、灵活性和成本效益之间找到平衡。戴尔 AI 平台的推出恰好解决了这一痛点,Gaudi3加速器提供了与 Nvidia H100相比,70% 的更佳性价比,尤其在 Llama380B 模型推理方面表现突出。此外,该平台的可扩展架构能够随企业需求的变化而演进,确保 IT 专业人员在满足日 ...
据报道,苹果公司计划在 2025 年的全球开发者大会(WWDC)上,向第三方开发者开放其设备内的 AI 模型。这一举措旨在推动应用程序的开发,并扩展苹果智能功能,提升 iPhone 和 Mac 的吸引力。苹果目前正在开发一个软件开发工具包(SDK),让开发者能够使用其较小的、在设备上运行的 AI 模型,而不是更先进的基于云的模型。这种做法与谷歌推出的 Gemini Nano AI 类似,后者也在为 Android 设备提供类似的服务。通过开放 AI 技术,苹果希望能够激发一波新的智能应用程序,充分利用其系统的潜力。这些 AI 技术驱动了诸如通知摘要、文本编辑和基本图像生成等功能。目前,开发者只能整合有限的苹果智能功能,例如 AI 写作工具和图像生成器,但无法使用苹果的核心 AI 模型(苹果基础模型)来构建自己的 AI 驱动功能。苹果在 AI 领域一直被认为处于追赶状态,因为其竞争对手如三星和谷歌已经在设备中集成了更先进的 AI 功能。早些时候,苹果因其 AI 新闻摘要功能出现错误而暂停了该功能,导致媒体不满。而其 Genmoji 工具用于创建自定义表情符号时,有时也会产生奇怪的结果,S ...
微软近期宣布,在Notepad记事本中推出一项全新的 AI 写作功能,旨在帮助用户更快速地撰写文本。这项功能正在 Windows11的最新更新中进行测试,当前仅在 Canary 和 Dev 频道的 Windows Insiders 用户中可用,适用于配备 Co pilot Plus 的 PC。根据 Windows Insider 博客的介绍,记事本的新 “写作” 功能可以根据用户的提示快速生成文本,也可以在已有内容的基础上进行扩展。用户可以通过右键点击希望插入新文本的位置,或者在选择已有文本后进行操作。选择 “写作” 功能后,会弹出一个提示框,用户可以在其中输入指令。生成的文本将自动插入到文档中,用户可以选择保留、丢弃或通过后续指令来优化这些内容。这项新功能是微软在记事本中测试的第三个 AI 驱动工具。在此之前,微软还推出了 “摘要” 功能,可以生成文档内容的摘要,以及 “重写” 功能,用户可以通过它调整文本的语气、长度或重述句子。除了记事本的更新,微软还在图像处理软件 Paint 中推出了一些新的 AI 功能。新的贴纸生成器允许用户描述他们想要的贴纸,Paint 会根据描述生成一组贴 ...
Google I/O大会上,Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心,将传统的2D视频通话升级为身临其境的3D体验,旨在让远程沟通如同面对面般真实自然。AIbase为您带来这一前沿科技的最新资讯,解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的Project Starline研究项目。过去几年,Google不断优化其3D视频通信技术,如今以更成熟的形态推出Google Beam。相较于传统视频会议系统,Google Beam通过先进的硬件配置和AI算法,成功将2D视频流转化为逼真的3D影像,使用户无需佩戴任何AR/VR设备即可享受沉浸式沟通体验。据介绍,Google Beam采用六台摄像头阵列,从不同角度捕捉用户影像,并通过AI驱动的体视视频模型(AI volumetric video model)实时合成3D效果,呈现于定制的光场显示屏上。这种技术不仅实现了毫米级的头部跟踪,还能以60帧每秒的流畅度 ...
据报道,苹果计划在2025年的全球开发者大会(WWDC)上向第三方开发者开放其在设备上的 AI 模型,旨在促进应用的创造并扩展苹果智能功能。苹果正在开发一个软件开发工具包(SDK),允许开发者使用其小型的、在设备上运行的 AI 模型,而不是更高级的基于云的模型。这一做法与谷歌在 Android 系统上推出的 Gemini Nano AI 相似。通过开放其 AI 技术 —— 苹果智能(Apple Intelligence),苹果希望激发一波新的智能应用的诞生,让开发者能够充分利用其系统。目前,开发者只能集成有限的苹果智能功能,包括 AI 写作工具和图像生成器,但尚未能够使用苹果的核心 AI 模型(苹果基础模型)来构建其 AI 驱动的功能。苹果在 AI 领域的竞争中显得有些落后于其他公司,比如三星和谷歌,后者已经在其设备上配备了先进的 AI 功能。今年早些时候,苹果暂停了其 AI 新闻摘要功能,因为一些错误引起了媒体的不满。而苹果的 Genmoji 工具在生成自定义表情方面也表现不佳,时常产生不理想的结果。此外,Siri 的更新也经历了一些延迟。通过开放其模型,苹果能够鼓励开发者创建与众不 ...