近期特斯拉 CEO 埃隆・马斯克的 AI 公司 xAI 内部出现了管理危机,多位高管因对公司的管理方式和财务状况感到不满而选择离职。目前,xAI 的日常运营由马斯克的两位亲密顾问贾里德・伯查尔和约翰・赫林负责,所有重要决策仍需马斯克的批准。图源备注:图片由AI生成,图片授权服务商Midjourney消息人士透露,xAI 的一些高管在内部会议上对伯查尔和赫林代表马斯克管理公司的方式提出了异议,认为公司缺乏清晰的管理架构。此外,这些高管还对公司的财务预测表示担忧,认为部分预测不切实际,并质疑马斯克家族办公室 Excession 在管理公司财务方面的角色。马斯克的律师对此表示,任何关于财务不当行为的指控都是虚假的,并指出公司的财务报表均由普华永道审计。尽管如此,一位接近 xAI 的知情人士表示,公司对于自身财务预测依然充满信心。近几个月,xAI 内部已有多位高管辞职,包括 X 前 CEO 琳达・亚卡里诺、前 CFO 迈克・利伯托雷以及前法律总顾问罗伯特・基尔等人。这些离职事件反映出,马斯克的管理风格对公司的运营带来了挑战,使他建立世界顶级 AI 公司的愿景变得复杂。在此背景下,马斯克的盟友安 ...
Meta公司今天正式发布了其VR扫描工具Meta Horizon Hyperscape Capture (Beta),允许Quest3头显用户扫描现实世界,并以照片级画质在虚拟现实中重现这些场景。这一工具的推出兑现了Meta在2024年Connect大会上曾做出的承诺。从Demo到现实:高斯飞溅技术的用户级应用去年在Connect2024大会上,Meta曾通过一个演示应用《Horizon Hyperscape Demo》展示了高斯飞溅(Gaussian Splatting)技术的强大魅力,将现实场景以惊人的真实感呈现在VR中。如今,这一技术不再是展示品,而是正式向普通用户开放。创建Horizon Hyperscape场景分为三个步骤,其中前两步在Quest3头显上完成,第三步则依赖Meta的服务器进行处理。场景网格生成:用户首先需要戴上Quest3或Quest3S头显,环顾房间以生成场景网格。这一过程与设置混合现实功能时的操作类似,通常需要10至30秒。精细化扫描:用户接下来需要走遍房间,将头显贴近所有表面,以消除3D网格并捕获细节。这个精细化过程是目前最耗时的环节,可能花费数分钟。 ...
社交平台 Reddit 正在与谷歌进行谈判,希望在 AI 数据交易中获得更好的条款。根据彭博社的消息,Reddit 希望在与谷歌的合作中获得更多资金和支持,以吸引更多用户。这一谈判显示出大规模 AI 企业与内容提供者之间的复杂关系,双方在寻求新的收入来源时,必须避免损害到维持自身生存的流量和用户互动。在与谷歌达成首次数据共享协议一年半后,Reddit 的高管们再次坐到了谈判桌前。这份协议当时的价值约为每年6000万美元。现在,Reddit 希望在谷歌的 AI 生态系统中扮演更重要的角色。Reddit 的目标不仅是获得更多的资金,还希望通过谷歌的帮助,吸引那些在谷歌搜索中获得答案却没有参与 Reddit 论坛的用户,从而增加平台内容的产生。据了解,Reddit 正在考虑一种动态定价的模式,未来的许可协议将根据内容对于 AI 工具答案的实用性或重要性来决定费用。高管们认为,当前的协议条款并没有反映出 Reddit 数据对 AI 公司的真正价值。Reddit 相较于其他平台,拥有更为丰富的数据资源,它的内容由真实用户发布,并经过人性化的投票系统进行排序,而非算法,这使得其数据对 AI 训练模 ...
两大科技巨头的合作正在为AI驱动的购物体验铺平道路。PayPal周三宣布与谷歌建立新的多年合作伙伴关系,支付巨头将利用谷歌的AI技术创造全新的AI购物体验,而PayPal的解决方案将整合到谷歌各个产品中。这次合作的核心是智能体商务的发展。虽然两家公司没有详细说明将共同创造哪些具体类型的智能体购物体验,但明确表示谷歌将贡献其AI技术和专业知识,PayPal将发挥其全球支付基础设施、个性化和身份解决方案的优势。更值得关注的是,双方将与其他公司一起推动谷歌新推出的Agent支付协议的采用。这个在周二发布的开放协议旨在支持由AI智能体发起的购买行为,已经得到超过60家商户和金融机构的支持。具体的产品整合方面,PayPal将成为Google Cloud、Google Ads和Google Play等领域信用卡支付的核心提供商。谷歌还将整合PayPal的品牌化结账、Hyperwallet支付服务和PayPal支付服务等产品。这次合作反映出电商领域正在经历的深刻变革。传统的购物模式正在被AI智能体重新定义,消费者可能很快就能让AI代理完成复杂的购买决策和交易。从技术角度来看,Agent支付协议的推出 ...
芯片行业迎来历史性时刻。英伟达同意以50亿美元收购英特尔股份,作为双方合作开发”多代”数据中心和PC产品更广泛协议的一部分,这笔交易将彻底改变半导体竞争格局。英伟达将以每股23.28美元的价格收购英特尔股票,略低于此前交易价格。据路透社报道,这笔交易将使英伟达成为英特尔最大股东之一,持股约4%。消息传出后,英特尔股价在周四早盘交易中一度飙升30%。两家公司将通过英伟达的NVLink接口整合各自架构,该接口支持CPU和GPU之间的数据和控制代码传输。相比PCI Express等其他标准,NVLink能够实现芯片间更快速的数据传输,这对需要多个GPU协同工作处理巨大工作负载的AI应用至关重要。在数据中心领域,英特尔将制造专门为英伟达AI基础设施平台定制的新x86CPU产品线,面向企业和超大规模客户提供服务。消费PC领域的合作更加令人瞩目。英特尔将构建集成英伟达RTX GPU芯片模块的x86片上系统,这无疑将为英特尔对抗竞争对手AMD的CPU产品提供显著优势。两家公司目前将这些芯片称为”x86RTX SoCs”,声称这些芯片将为”广泛的PC产品”提供动力。这笔交易出现在英特尔艰难时期之后。与 ...
Notion在周四的”Make with Notion”活动上宣布推出首个AI智能体,这个智能体能够利用用户所有Notion页面和数据库作为上下文,自动生成会议笔记、分析报告、竞品评估和反馈页面。这个全新的AI智能体功能强大,不仅能创建页面和数据库,还可以用新数据、属性或视图更新现有内容。用户甚至可以从连接到Notion的外部平台触发智能体操作。比如,你可以要求Notion智能体根据Slack、邮件和Google Drive等多个来源创建漏洞跟踪仪表板。新发布的智能体基于现有的Notion AI功能构建,后者此前主要用于搜索或总结内容。但新智能体能够处理更复杂的多步骤任务,充分发挥了智能体AI的能力。公司表示,当前版本的智能体可以执行长达20分钟的任务,处理数百页内容。个性化设置是这个智能体的亮点功能。用户可以为智能体设置”档案”页面,指导它如何引用来源、输出风格,以及在何处更新任务和最终结果。你还可以要求智能体”记住”用户使用过程中的关键要点,这些记忆将存储在档案页面中,用户可以随时编辑。从演示视频可以看到,智能体能够为落地页提供反馈并更新内容、创建餐厅跟踪器、从会议笔记生成分析报告 ...
近日,阿里云正式宣布通义万相全新动作生成模型 Wan2.2-Animate 的开源,这一模型的推出将为短视频创作、舞蹈模板生成和动漫制作等领域带来极大便利。用户可以通过 GitHub、HuggingFace 和魔搭社区轻松下载模型及相关代码,此外,还可以利用阿里云的百炼平台调用 API,或在通义万相官网直接体验该模型的强大功能。Wan2.2-Animate 模型是在之前的 Animate Anyone 模型基础上进行全面升级的成果。在人物一致性和生成质量等方面都有了显著提升。该模型支持两种主要的应用模式:动作模仿和角色扮演。在动作模仿模式下,用户只需输入一张角色图片和一段参考视频,模型便能够将视频中的角色动作和表情迁移到用户提供的图片角色上,实现角色的动态表现。而在角色扮演模式中,模型则能够在保留原视频的动作、表情和环境的基础上,替换视频中的角色为用户提供的角色。为了提升生成效果,通义万相团队建立了一个大规模的人物视频数据集,涵盖了说话、面部表情和身体动作等多种元素,使用通义万相图生视频模型进行后续训练。Wan2.2-Animate 的设计使得角色信息、环境信息和动作等能够被规范化到统 ...
2025年9月19日,阿里云宣布通义万相全新动作生成模型 Wan2.2-Animate 正式开源。该模型能够驱动人物、动漫形象和动物照片,广泛应用于短视频创作、舞蹈模板生成、动漫制作等领域。用户可以在 GitHub、HuggingFace 和魔搭社区下载模型和代码,也可以通过阿里云百炼平台调用 API 或在通义万相官网直接体验。Wan2.2-Animate 模型是基于此前开源的 Animate Anyone 模型全面升级的成果,在人物一致性、生成质量等指标上大幅提升,同时支持动作模仿和角色扮演两种模式。在角色模仿模式下,输入一张角色图片和一段参考视频,模型可以将视频角色的动作和表情迁移到图片角色中,赋予图片角色动态表现力。而在角色扮演模式下,模型可以在保留原始视频的动作、表情及环境的基础上,将视频中的角色替换为图片中的角色。通义万相团队构建了一个涵盖说话、面部表情和身体动作的大规模人物视频数据集,并基于通义万相图生视频模型进行后训练。Wan2.2-Animate 将角色信息、环境信息和动作等规范到统一的表示格式,实现了单一模型同时兼容两种推理模式。针对身体运动和脸部表情,模型分别使用骨 ...
视频生成AI领域迎来里程碑式升级。Luma AI正式发布Ray3模型,这款被称为全球首个”推理视频模型”的产品,通过内置多模态推理系统彻底改变了AI视频生成的游戏规则。Ray3的核心创新在于其智能推理能力。不同于传统的随机生成模式,这个模型能够像真正的创意伙伴一样理解用户意图、规划复杂场景并自我评估输出质量。它会先在”脑海”中构思故事板,然后进行迭代优化,这种类似动画师工作流程的方式显著提升了生成效果的准确性和艺术性。技术规格方面,Ray3支持从草图到4K分辨率的完整创作链条。新增的草稿模式将生成速度提升了约20倍,让创作者能够快速测试多个创意方案。更重要的是,它是首款原生支持10位、12位和16位HDR视频生成的模型,采用ACES EXR格式输出,可直接导入专业后期制作管道。从演示效果来看,Ray3在图像到视频转换方面表现出色,甚至能够解读图片中的涂鸦指令生成连贯的动态序列。物理模拟的真实感和角色一致性都达到了行业先进水平,生成视频的电影级质感令人印象深刻。商业合作方面,Ray3已与Adobe Firefly深度整合,成为其首家第三方合作伙伴。日本数字营销公司Dentsu Digit ...
Mercor 是一家成立仅两年的初创公司,专注于为像 OpenAI 和 Meta 这样的企业提供所需的领域专家,以帮助训练和优化其基础 AI 模型。根据 TechCrunch 获取的一份市场文件和知情人士的说法,Mercor 目前正在与投资者讨论进行第三轮融资(Series C)。该公司目前的目标是将估值提升至100亿美元或以上,较几个月前讨论的80亿美元估值有所上升。尽管最终交易条款仍可能变化,但 Mercor 向潜在投资者透露,他们已经收到多份出价,其中一些的估值甚至高达100亿美元。此外,Mercor 还通过特殊目的工具(SPVs)引入了至少两位新投资者以为潜在交易筹集资金。图源备注:图片由AI生成,图片授权服务商MidjourneyMercor 在2月份宣布的上一轮融资为一轮1亿美元的 B 轮融资,估值为20亿美元。根据知情人士的消息,Mercor 的年化收入(ARR)接近4.5亿美元。早在2月,Mercor 就曾对外宣布其年收入达到7500万美元,而其首席执行官 Brendan Foody 在3月时通过社交媒体表示 ARR 已达1亿美元。该公司表示,预计将比另一家初创公司 A ...