近日,YouTube 明星 Jimmy “MrBeast” Donaldson 在社交媒体上表达了对人工智能(AI)技术影响创作者行业的担忧。他在推特上表示,当 AI 生成的视频质量达到与普通视频相当的水平时,这将对 YouTube 及数百万以此为生的创作者造成怎样的影响,他对此感到忧虑,并称之为 “可怕的时代”。MrBeast 以其独特而引人入胜的内容而闻名,如 “我帮助 2000 人重获行走能力” 和 “你愿意为 50 万美元冒生命危险吗?” 等视频。他的作品常常围绕着金融困境中的人们,将他们的故事呈现为引人注目的娱乐,虽然这种形式引发了不少争议,但他的成功不可否认。然而,随着 AI 技术的发展,他的创作领域正面临新的挑战。最近,OpenAI 推出了名为 Sora 2 的生成性 AI 软件,用户可以轻松创建逼真的短视频。随之而来的,是各种模仿和搞笑的内容,这些新技术的使用让很多内容创作者感到压力。MrBeast 提到,这种 AI 视频的普及可能会使得他和其他创作者的作品更容易被复制,从而影响他们的生计。与此同时,MrBeast 今年早些时候曾尝试使用一种 AI 工具来制作视频缩略图 ...
根据 OpenAI 的最新研究,刚刚发布的 GPT-5模型在政治偏见方面的表现远远优于以往的同类产品。这一研究成果由 OpenAI 团队向 Axios 披露,标志着 AI 模型在偏见控制方面的重要进展。图源备注:图片由AI生成,图片授权服务商Midjourney长期以来,公众和政界人士对 AI 系统的偏见问题表示关注,呼吁提高透明度,并确保这些模型不受偏见的影响。今年7月,美国政府还发布了行政命令,要求在政府使用中剔除 “觉醒型” AI 系统,这类系统可能带有政治或意识形态偏见,但如何合规仍然不明确。OpenAI 的研究显示,无论在 “即时模式” 还是 “思考模式” 下,GPT-5的偏见水平相比于其前身下降了30%。研究报告指出,模型在面对中性或轻微倾向性的问题时,表现接近于客观,而在应对具有挑战性和情绪化的问题时,则仅显示出适度的偏见。报告进一步强调,现有的偏见主要体现在模型表达个人观点时,或在情感激烈的场景中使用夸张的讽刺语言。在接受 Axios 采访时,OpenAI 的研究人员提到,“情感激烈” 的问题是最容易引发模型偏见的因素,但仍有进一步提升客观性的空间。他们还指出,公众对于 ...
谷歌近日宣布,Chrome 浏览器将迎来有史以来最大的一次升级,主要是通过加入 AI 功能来提升用户体验。这项更新将于今日在美国的 macOS 和 Windows 用户中推送,使用英语设置的用户将率先体验到这些新功能。谷歌产品副总 Mike Torres 表示,此次升级的核心是 “Gemini 化”,用户可以通过新增加的 Gemini 按钮,获得网页的 AI 简化解释,快速总结多个标签的信息,回顾网页历史以及使用谷歌应用中的内容。此外,Chrome 还将提供一些 AI 浏览器常见的功能。除了这些功能,谷歌还计划对地址栏(omnibox)进行调整,右侧将新增一个 “AI 模式” 按钮,用户可以通过它进入谷歌的聊天机器人式搜索体验。虽然这项功能即将上线,但谷歌已确认,按下回车键仍将返回常规的谷歌搜索结果,确保内容创作者不至于因 AI 模式成为默认设置而失去流量。对于那些认为在线预约或购买杂货是一种 “繁琐任务” 的用户,谷歌还将在未来几个月内为 Chrome 添加主动功能。用户只需告诉 Gemini 在 Chrome 中想要完成的任务,它就会代为操作网页,用户可以专注于其他事情。谷歌强调, ...
近期特斯拉 CEO 埃隆・马斯克的 AI 公司 xAI 内部出现了管理危机,多位高管因对公司的管理方式和财务状况感到不满而选择离职。目前,xAI 的日常运营由马斯克的两位亲密顾问贾里德・伯查尔和约翰・赫林负责,所有重要决策仍需马斯克的批准。图源备注:图片由AI生成,图片授权服务商Midjourney消息人士透露,xAI 的一些高管在内部会议上对伯查尔和赫林代表马斯克管理公司的方式提出了异议,认为公司缺乏清晰的管理架构。此外,这些高管还对公司的财务预测表示担忧,认为部分预测不切实际,并质疑马斯克家族办公室 Excession 在管理公司财务方面的角色。马斯克的律师对此表示,任何关于财务不当行为的指控都是虚假的,并指出公司的财务报表均由普华永道审计。尽管如此,一位接近 xAI 的知情人士表示,公司对于自身财务预测依然充满信心。近几个月,xAI 内部已有多位高管辞职,包括 X 前 CEO 琳达・亚卡里诺、前 CFO 迈克・利伯托雷以及前法律总顾问罗伯特・基尔等人。这些离职事件反映出,马斯克的管理风格对公司的运营带来了挑战,使他建立世界顶级 AI 公司的愿景变得复杂。在此背景下,马斯克的盟友安 ...
Meta公司今天正式发布了其VR扫描工具Meta Horizon Hyperscape Capture (Beta),允许Quest3头显用户扫描现实世界,并以照片级画质在虚拟现实中重现这些场景。这一工具的推出兑现了Meta在2024年Connect大会上曾做出的承诺。从Demo到现实:高斯飞溅技术的用户级应用去年在Connect2024大会上,Meta曾通过一个演示应用《Horizon Hyperscape Demo》展示了高斯飞溅(Gaussian Splatting)技术的强大魅力,将现实场景以惊人的真实感呈现在VR中。如今,这一技术不再是展示品,而是正式向普通用户开放。创建Horizon Hyperscape场景分为三个步骤,其中前两步在Quest3头显上完成,第三步则依赖Meta的服务器进行处理。场景网格生成:用户首先需要戴上Quest3或Quest3S头显,环顾房间以生成场景网格。这一过程与设置混合现实功能时的操作类似,通常需要10至30秒。精细化扫描:用户接下来需要走遍房间,将头显贴近所有表面,以消除3D网格并捕获细节。这个精细化过程是目前最耗时的环节,可能花费数分钟。 ...
社交平台 Reddit 正在与谷歌进行谈判,希望在 AI 数据交易中获得更好的条款。根据彭博社的消息,Reddit 希望在与谷歌的合作中获得更多资金和支持,以吸引更多用户。这一谈判显示出大规模 AI 企业与内容提供者之间的复杂关系,双方在寻求新的收入来源时,必须避免损害到维持自身生存的流量和用户互动。在与谷歌达成首次数据共享协议一年半后,Reddit 的高管们再次坐到了谈判桌前。这份协议当时的价值约为每年6000万美元。现在,Reddit 希望在谷歌的 AI 生态系统中扮演更重要的角色。Reddit 的目标不仅是获得更多的资金,还希望通过谷歌的帮助,吸引那些在谷歌搜索中获得答案却没有参与 Reddit 论坛的用户,从而增加平台内容的产生。据了解,Reddit 正在考虑一种动态定价的模式,未来的许可协议将根据内容对于 AI 工具答案的实用性或重要性来决定费用。高管们认为,当前的协议条款并没有反映出 Reddit 数据对 AI 公司的真正价值。Reddit 相较于其他平台,拥有更为丰富的数据资源,它的内容由真实用户发布,并经过人性化的投票系统进行排序,而非算法,这使得其数据对 AI 训练模 ...
两大科技巨头的合作正在为AI驱动的购物体验铺平道路。PayPal周三宣布与谷歌建立新的多年合作伙伴关系,支付巨头将利用谷歌的AI技术创造全新的AI购物体验,而PayPal的解决方案将整合到谷歌各个产品中。这次合作的核心是智能体商务的发展。虽然两家公司没有详细说明将共同创造哪些具体类型的智能体购物体验,但明确表示谷歌将贡献其AI技术和专业知识,PayPal将发挥其全球支付基础设施、个性化和身份解决方案的优势。更值得关注的是,双方将与其他公司一起推动谷歌新推出的Agent支付协议的采用。这个在周二发布的开放协议旨在支持由AI智能体发起的购买行为,已经得到超过60家商户和金融机构的支持。具体的产品整合方面,PayPal将成为Google Cloud、Google Ads和Google Play等领域信用卡支付的核心提供商。谷歌还将整合PayPal的品牌化结账、Hyperwallet支付服务和PayPal支付服务等产品。这次合作反映出电商领域正在经历的深刻变革。传统的购物模式正在被AI智能体重新定义,消费者可能很快就能让AI代理完成复杂的购买决策和交易。从技术角度来看,Agent支付协议的推出 ...
芯片行业迎来历史性时刻。英伟达同意以50亿美元收购英特尔股份,作为双方合作开发”多代”数据中心和PC产品更广泛协议的一部分,这笔交易将彻底改变半导体竞争格局。英伟达将以每股23.28美元的价格收购英特尔股票,略低于此前交易价格。据路透社报道,这笔交易将使英伟达成为英特尔最大股东之一,持股约4%。消息传出后,英特尔股价在周四早盘交易中一度飙升30%。两家公司将通过英伟达的NVLink接口整合各自架构,该接口支持CPU和GPU之间的数据和控制代码传输。相比PCI Express等其他标准,NVLink能够实现芯片间更快速的数据传输,这对需要多个GPU协同工作处理巨大工作负载的AI应用至关重要。在数据中心领域,英特尔将制造专门为英伟达AI基础设施平台定制的新x86CPU产品线,面向企业和超大规模客户提供服务。消费PC领域的合作更加令人瞩目。英特尔将构建集成英伟达RTX GPU芯片模块的x86片上系统,这无疑将为英特尔对抗竞争对手AMD的CPU产品提供显著优势。两家公司目前将这些芯片称为”x86RTX SoCs”,声称这些芯片将为”广泛的PC产品”提供动力。这笔交易出现在英特尔艰难时期之后。与 ...
Notion在周四的”Make with Notion”活动上宣布推出首个AI智能体,这个智能体能够利用用户所有Notion页面和数据库作为上下文,自动生成会议笔记、分析报告、竞品评估和反馈页面。这个全新的AI智能体功能强大,不仅能创建页面和数据库,还可以用新数据、属性或视图更新现有内容。用户甚至可以从连接到Notion的外部平台触发智能体操作。比如,你可以要求Notion智能体根据Slack、邮件和Google Drive等多个来源创建漏洞跟踪仪表板。新发布的智能体基于现有的Notion AI功能构建,后者此前主要用于搜索或总结内容。但新智能体能够处理更复杂的多步骤任务,充分发挥了智能体AI的能力。公司表示,当前版本的智能体可以执行长达20分钟的任务,处理数百页内容。个性化设置是这个智能体的亮点功能。用户可以为智能体设置”档案”页面,指导它如何引用来源、输出风格,以及在何处更新任务和最终结果。你还可以要求智能体”记住”用户使用过程中的关键要点,这些记忆将存储在档案页面中,用户可以随时编辑。从演示视频可以看到,智能体能够为落地页提供反馈并更新内容、创建餐厅跟踪器、从会议笔记生成分析报告 ...
近日,阿里云正式宣布通义万相全新动作生成模型 Wan2.2-Animate 的开源,这一模型的推出将为短视频创作、舞蹈模板生成和动漫制作等领域带来极大便利。用户可以通过 GitHub、HuggingFace 和魔搭社区轻松下载模型及相关代码,此外,还可以利用阿里云的百炼平台调用 API,或在通义万相官网直接体验该模型的强大功能。Wan2.2-Animate 模型是在之前的 Animate Anyone 模型基础上进行全面升级的成果。在人物一致性和生成质量等方面都有了显著提升。该模型支持两种主要的应用模式:动作模仿和角色扮演。在动作模仿模式下,用户只需输入一张角色图片和一段参考视频,模型便能够将视频中的角色动作和表情迁移到用户提供的图片角色上,实现角色的动态表现。而在角色扮演模式中,模型则能够在保留原视频的动作、表情和环境的基础上,替换视频中的角色为用户提供的角色。为了提升生成效果,通义万相团队建立了一个大规模的人物视频数据集,涵盖了说话、面部表情和身体动作等多种元素,使用通义万相图生视频模型进行后续训练。Wan2.2-Animate 的设计使得角色信息、环境信息和动作等能够被规范化到统 ...