2025年4月9日,谷歌正式宣布推出 Vertex AI Media Studio 文生视频套件,这一全新平台旨在通过人工智能技术大幅简化视频内容创作流程,为用户提供从文本到完整视频的一站式解决方案。这一消息迅速引起了科技圈和内容创作者的广泛关注。全流程自动化生成视频内容Vertex AI Media Studio 整合了谷歌的多项尖端 AI 模型,包括 Imagen3图像生成、Veo2视频制作、Chirp 语音合成以及 Lyria 背景音乐生成技术。用户只需输入简单的文本指令,平台便能自动完成画面渲染、旁白配音和背景音乐的制作,甚至无需任何编码或剪辑经验。这一套件在 Google Cloud 的 Vertex AI 平台上运行,旨在让视频创作变得更加高效和普惠。据介绍,该平台采用模块化设计,Veo2模型负责将静态图像动态化,并支持用户调整镜头运动和视频时长。此外,Veo2内置的智能修正工具还能自动优化生成内容,剔除不理想的元素,确保输出质量。这一功能的推出被认为是对传统视频制作流程的颠覆性革新。面向广泛用户群体的实用工具谷歌表示,Vertex AI Media Studio 的目标不 ...
近日,字节跳动豆包大模型团队宣布开源Multi-SWE-bench,这是业内首个多语言代码修复基准数据集,为大模型“自动修Bug”能力的评估与提升带来新突破。在大模型技术快速发展的当下,代码生成任务成为检验模型智能的关键领域。以SWE-bench为代表的代码修复基准,虽能衡量模型的编程智能,但存在明显局限。其仅聚焦Python语言,无法评估模型跨语言泛化能力;且任务难度有限,难以覆盖复杂开发场景,制约了大模型代码智能的进一步发展。面向不同模型代码能力评测分数Multi-SWE-bench应运而生,它在SWE-bench基础上实现重大跨越,首次覆盖Java、TypeScript、C、C++、Go、Rust和JavaScript等7种主流编程语言,构建了1632个源于真实开源仓库的修复任务。这些任务经过严格筛选与人工验证,确保质量可靠。同时,Multi-SWE-bench引入难度分级机制,分为简单、中等、困难三类,能更全面评估模型在不同能力层次的表现。基于该数据集的实验显示,当前大语言模型在Python修复上表现尚可,但处理其他语言时平均修复率不足10%,凸显多语言代码修复仍是大模型面临的 ...
近日,复旦大学与国内AI创新企业阶跃星辰宣布即将推出一款名为OmniSVG的端到端多模态SVG生成模型,这一消息迅速引发了科技与设计领域的广泛关注。据AIbase了解,OmniSVG以其强大的生成能力为核心,支持从简单图标到复杂动漫角色的矢量图生成,为数字艺术创作提供了全新的智能解决方案。这一模型的问世,或将重新定义矢量图生成的技术边界。多模态生成:灵活应对多样需求OmniSVG的最大亮点在于其支持三种生成模式:通过文字描述生成SVG图像、将图片转化为矢量图,以及基于角色参考生成个性化SVG内容。无论是快速生成品牌标志,还是将手绘动漫角色转为矢量格式,OmniSVG都能轻松胜任。这种多模态输入的支持,不仅满足了设计师和创作者的多样化需求,也为SVG生成技术开辟了更广阔的应用场景。技术突破:解耦结构与几何据AIbase分析,OmniSVG的技术创新在于其独特的模型架构。该模型基于预训练的Qwen-VL视觉-语言模型,并结合专门设计的SVG分词器,将SVG命令和坐标参数化为离散的标记。这一设计成功将结构逻辑与底层几何图形解耦,从而大幅提升了训练和生成的效率。相较于传统方法,OmniSVG在 ...
近日,IBM 正式发布了其最新款主机 ——IBM z17。这款主机搭载了最新的 IBM Telum II 处理器,经过五年的研究与开发,z17在硬件、软件和系统操作方面都具备了出色的 AI 能力。IBM 表示,z17的设计宗旨是 “重塑大规模 AI 运算”。尽管许多人将主机视为过去计算时代的产物,但它们仍然在大型企业中发挥着至关重要的作用,处理海量数据。全球众多行业,包括银行、保险、零售和电信,依然在使用 IBM 主机,以满足其复杂的数据处理需求。z17主机在设计上明确聚焦于 AI 功能。根据 IBM 的介绍,z17每天能处理比前一代 z16多出50% 的 AI 推理操作。这款主机支持超过250种应用场景,例如管理聊天机器人和降低贷款风险。z17处理器的一些主要 AI 工具包括:- ** 更强的推理能力 **:z17具有更高的运行频率、计算能力以及40% 的缓存增长,这使其每天能够进行超过4500亿次推理操作,且响应时间仅为一毫秒。- ** 加速计算 **:IBM Spyre™加速器将在2025年第四季度推出,进一步提升 Telum II 处理器的计算能力,允许主机运行生成式特性,例如 ...
OpenAI 近期发布了一款新的图像生成器,该工具因能够生成模仿吉卜力工作室风格但被部分用户批评为“没有灵魂”的插图而引发关注。与此同时,OpenAI 首席执行官 Sam Altman 对包括吉卜力工作室联合创始人宫崎骏在内的批评者进行了猛烈抨击。奥特曼回应宫崎骏严厉批评在接受科技创始人兼 YouTuber Arun Mayya 的采访时,Altman 公开驳斥了宫崎骏2016年对其制作的一部人工智能动画的严厉批评。当时,宫崎骏称 AI 动画“令人毛骨悚然”且是“对生命本身的侮辱”。当 Mayya 向 Altman 表示艺术家对人工智能的担忧是合理的时,这位 OpenAI 联合创始人声称“这种权衡是值得的”。Mayya 随后分享了他创建并部署的 AI 化身,声称这让他能够享受“永久假期”。历史性错误言论遭质疑Altman 随后试图通过回顾技术发展来淡化担忧,他声称几十年前制作视频是“不可能的”。“想想30年前你做什么事会是什么样子,”奥特曼说道,“我的意思是,你需要一台摄像机和 VHS 录像带,然后你得用某种复杂的方式剪辑。而且,即使你做到了,你也得分发录像带,因为那时候没有互联网,也 ...
近日,欧盟宣布了一项高达200亿欧元(约合170亿英镑)的计划,旨在欧洲建立多个配备大型超级计算机的 “人工智能工厂”,以推动下一代人工智能模型的开发。这一战略旨在将欧洲打造成为 “人工智能大陆”,欧盟委员会副主席亨娜・维尔库宁(Henna Virkkunen)表示,人工智能技术是提升欧洲竞争力、安全性和技术自主性的关键,全球的人工智能竞争依然激烈。目前,美国和中国在人工智能领域处于领先地位,尤其是在推动自驾汽车、生成文本等技术方面。根据斯坦福大学的一份报告,2024年,美国产生了40个 “重要的人工智能模型”,而中国仅有15个,欧洲则只有3个(均为法国)。这使得欧盟在人工智能的 “活跃度” 上落后于美国和中国,表现出亟需追赶的压力。为了扭转这一局面,欧盟计划建立13个人工智能工厂,但这次的新项目将被称为 “超级工厂”,目标是开发重大创新,包括医疗保健、生物科技、工业、机器人技术和科学发现等领域。与现有的工厂相比,这些超级工厂将配备超过10万个先进的人工智能处理器,而现有的最佳工厂则最多为25,000个。这些超级工厂不仅耗能巨大,还需要大量水资源进行冷却。欧盟官员表示,这些设施应尽可能 ...
OpenAI 与其创始人之一、亿万富翁埃隆・马斯克之间的法律纠纷持续升级。近日,OpenAI 在法庭上提出反诉,要求禁止马斯克 “进一步的违法和不公平行为”,并追究他所造成的损失。在这份反诉中,OpenAI 的律师表示:“OpenAI 是一家韧性十足的公司,但马斯克的行为对我们造成了伤害。如果他的攻击继续下去,OpenAI 的使命及公众利益将面临更大的威胁。” 反诉中还提到,马斯克最近发起的虚假收购提案旨在干扰 OpenAI 的发展,这种行为必须停止。图源备注:图片由AI生成,图片授权服务商Midjourney马斯克对 OpenAI 提起的诉讼指控称,该公司已经放弃了其初衷,未能确保人工智能研究成果能惠及全人类。OpenAI 于2015年成立时是一个非营利组织,但在2019年转变为 “有限利润” 结构,计划将其形式再次变更为公共利益公司。马斯克曾请求法庭发布初步禁令,阻止 OpenAI 的盈利转型。尽管一位联邦法官在3月拒绝了他的禁令请求,但案件仍将在2026年春季进行陪审团审理。在与 OpenAI 的关系逐渐恶化后,马斯克如今成了该公司的主要对手之一。对于 OpenAI 而言,局势至 ...
今日,正值百川智能成立两周年之际,公司创始人兼CEO王小川发布全员信,回顾了过去两年的成就与不足,并明确了公司当前及未来的发展方向。王小川强调,百川智能将坚定面向医疗领域的技术愿景和业务方向,通过“造医生-改路径-促医学”的路径,推动AI技术在医疗行业的深度应用。王小川在信中提到,百川智能自2023年4月成立以来,经历了技术突破与产业落地的双重考验。公司不仅在通用基础模型、医学增强的推理模型等方面取得了显著进展,还成功将AI技术应用于全科、儿科等医疗领域,实现了AI医生在基层医疗中的试点应用。然而,他也坦诚地指出了公司发展中的不足,包括战线过长、不够聚焦以及部分团队工作目标出现摇摆和偏差等问题。针对这些问题,王小川提出了明确的改进方向。他表示,接下来百川智能将围绕百小应、AI儿科、AI全科和精准医疗四个方面发展应用和服务,并专注聚焦、减少多余动作,深度思考、坚定不摇摆。同时,公司将减小组织的复杂度,更扁平、更少层级,让信息和决策更通畅。值得一提的是,百川智能在医疗领域的布局已经取得了实质性进展。去年,公司与北京儿童医院、小儿方健康共同发布了全球首个儿科大模型——“福棠・百川”儿科大模型 ...
近日,量子人工智能初创公司 SandboxAQ 宣布成功完成 E 轮融资,筹集资金达4.5亿美元。本轮融资吸引了众多行业巨头的投资,包括谷歌、英伟达以及法国巴黎银行,使得 SandboxAQ 的总融资额达到了9.5亿美元。公司表示,这笔资金将用于加速其大型量子模型的研发,并推动与各行业的合作。图源备注:图片由AI生成,图片授权服务商MidjourneySandboxAQ 成立于2022年,是从谷歌母公司 Alphabet 独立出来的公司。它利用量子计算技术来开发量子人工智能模型,这些模型可以在物理、化学和数学等领域进行训练,能够进行复杂的计算和分析。SandboxAQ 表示,其量子模型在药物发现和金融建模等多个领域具有潜在的应用价值,尤其是在生物制药、化学、材料科学、网络安全和金融服务等行业。目前,早期采用这些量子模型的客户包括加州大学旧金山分校、赛诺菲、阿美石油公司、迈克尔・J・福克斯基金会以及美国陆军和空军等机构。法国巴黎银行全球市场部门负责人 Olivier Osty 在公告中表示:“人工智能和先进计算正在对金融服务产生深远影响,法国巴黎银行全球市场很高兴能够站在这一趋势的前沿。 ...
WordPress.com 正式推出了一款全新的 AI 驱动网站构建器,现已进入抢先体验阶段。这款工具可以在几分钟内为用户创建出功能齐全、外观美观的 WordPress 网站。用户只需通过聊天机器人输入相关提示,便可生成包括文本、布局和图像等在内的网站内容。为了开始使用这项服务,用户需要注册一个 WordPress.com 账号,虽然在试用期间不需要绑定信用卡,但要将网站投入实际使用,则需要购买 WordPress.com 的托管计划,费用起价为每月18美元(如果选择一年及以上的付款方式,价格更低)。使用这款构建器的过程非常简单。用户可以告诉 AI 自己需要建立个人网站还是商业网站,并描述希望的页面元素,如标题外观、配色方案等。WordPress.com 表示,越具体的初始提示将带来更理想的结果。在生成网站时,聊天机器人会询问一些关键信息,例如公司名称和位置。生成完成后,网站将包含 AI 生成的标题、图片和文本。记者亲自尝试了这个工具,并创建了一个虚拟的复古视频游戏商店网站。生成的网页包含 “发现”、“活动” 和 “联系我们” 等栏目,展示了一系列随机生成的游戏室图片,甚至还包含了一个 ...