据techbuzz报道,总部位于上海的 AgiBot 公司近日攻克了一项工业自动化的关键难题——只需 10分钟 即可教会机器人完成复杂的制造任务。这项突破性的技术有望重新定义全球制造业的生产方式。AgiBot 的方法结合了 人机远程操作与强化学习。在实际应用中,工人通过远程操控引导机器人完成任务,随后人工智能系统接管并优化动作,实现自我改进。这种“真实世界强化学习”让机器人能在极短时间内适应新的工厂流程。目前,AgiBot 的 G2人形机器人 已在龙驰科技的生产线上投入使用,负责处理智能手机与 VR 头显零部件的组装。AgiBot 代表冯宇恒介绍说:“传统工业机器人需要数周的编程周期,而我们的机器人只需十分钟即可学会一项新任务。”AgiBot 的首席科学家 罗建兰 曾在加州大学伯克利分校从事前沿机器人研究,他将强化学习与工业实践相结合,推动了这项人机协作模式的落地。公司还运营着一个机器人学习中心,由操作员远程训练机器人生成高质量数据,为算法优化提供持续支持。国际专家也对这一突破表示关注。卡内基梅隆大学机器人学教授 杰夫·施耐德 指出:“AgiBot 的技术代表了当前强化学习在工业自动化 ...
近日,伦敦高等法院对 Getty Images 与 Stability AI 之间的版权案件作出了重要裁决,判定 Stable Diffusion 并不构成 “侵权复制”。此次案件的核心问题是,利用版权图像训练 AI 模型是否属于版权侵权。Getty Images 指控 Stability AI 在训练 Stable Diffusion 时,通过 “抓取” 数百万张其版权照片,称这一行为对创意产业构成 “生存威胁”。然而,随着案件进展,Getty 最终放弃了主要指控,包括关于模型训练方式和生成图像的指控。根据法院文件,证据显示模型训练并未在英国境内进行,这使案件的焦点转向了次要版权和商标侵权的问题。法院最终做出的裁决指出,像 Stable Diffusion 这样的 AI 模型并不构成 “侵权复制”。Getty Images 认为,由于 Stable Diffusion 的模型权重制作在英国如果发生,将构成版权侵权,但法官乔安娜・史密斯(Joanna Smith)对此表示不同意。法官在判决中指出,Stable Diffusion 并不存储或再现任何版权作品,因此在《英国版权、设计与专利 ...
AI图像生成的“最后一公里”被彻底打通。ComfyUI官方云平台——Comfy Cloud今日正式开启公测,全面开放注册,无需邀请码、无需本地部署、更无需高端显卡,用户只需打开浏览器,即可秒级接入全功能Stable Diffusion创作环境。这场由开源社区驱动的云端革命,正将专业级AI视觉生产力从技术极客手中,交付给每一位普通创作者。即开即用:告别安装地狱,Mac用户也能玩转Flux过去,使用ComfyUI意味着复杂的依赖安装、模型下载与环境配置,对新手极不友好,Mac或轻薄本用户更是被高性能门槛拒之门外。如今,Comfy Cloud将这一切简化为一次点击:注册后几秒内加载完整界面,内置Stable Diffusion、SDXL、Flux、ControlNet、LoRA等主流模型,用户可直接拖拽节点构建工作流,无需手动管理任何文件。无论是尝试最新Flux模型,还是复现社区热门流程,创作从未如此轻松。云端GPU集群加持:高分辨率渲染快过本地平台依托高性能GPU集群,即使处理5120×5120像素图像或多层动画工作流,也能保持流畅体验。实测显示,其渲染速度远超多数消费级本地设备,且输出误 ...
印度支付巨头 Paytm 近日宣布与美国硬件公司 Groq 达成合作,将利用 GroqCloud 服务来提升其人工智能(AI)模型的性能。此举旨在改进交易处理、风险评估、欺诈检测以及消费者互动,进一步增强其平台的智能化水平。GroqCloud 是 Groq 为开发者和企业提供的云端服务,专门用于 AI 推理,即从训练好的模型中获取输出和洞见。该服务依托于 Groq 自主研发的语言处理单元(LPU),这些处理器专门设计用于推理,相较于传统的 GPU 系统,具有更快的性能和更高的能效。Paytm 的首席商务官 Narendra Singh Yadav 表示:“我们一直在不断提升我们的 AI 能力,目的是让支付更加快速、可靠和智能。” 他补充道,与 Groq 的合作将加强 Paytm 的技术基础,实现大规模的实时 AI 推理,进一步推进其建设印度最先进的 AI 驱动支付和金融服务平台的目标。目前,Paytm 已在消费端和内部运营中广泛应用 AI 技术。公司最近推出了印度首款 AI 驱动的音响设备,旨在为中小企业提供服务。这款音响设备内置助手,可以用11种印度语言与商家对话,实时提供有关其支付 ...
语言,正在成为视频时代最后一道可被AI击穿的壁垒。今日,全球AI视频生成平台HeyGen正式发布新一代视频翻译引擎,以三大核心技术突破,将跨语言视频本地化推向“以假乱真”的新高度——外国演讲者不仅“说中文”,连语气、表情、唇动都宛如本地产出,真正实现“一人拍摄,全球共鸣”。上下文感知翻译:告别机械直译,拥抱文化共鸣新引擎彻底摒弃传统“字对字”的翻译逻辑,转而采用多模态语境理解机制。系统同步分析视频画面中的场景、人物表情、肢体语言乃至情绪起伏,动态调整译文风格。例如,一段充满激情的英文产品发布演讲,在转为中文时,AI会自动选用更具感染力的本土化表达,如将“I’m thrilled”译为“我太激动了!”而非生硬的“我很兴奋”,让观众感受原汁原味的情绪传递。唇形同步革命:侧脸、遮挡全搞定,误差降至毫秒级唇形不同步曾是AI视频翻译的最大“破绽”。HeyGen新引擎通过像素级面部动力学建模,即使在人物侧脸、手部遮挡嘴巴或快速转头等复杂场景下,也能生成与目标语言语音完美匹配的唇部动作。实测显示,动态头部运动中的同步误差已压缩至毫秒级别,远超行业平均水平。创作者无需绿幕、无需重拍,手机拍摄的视频也能 ...
在AI成本高企、大模型调用费用动辄百万的当下,Pinterest正悄然走出一条“高性价比智能之路”。公司CEO Bill Ready在最新财报电话会上透露,通过大规模采用微调后的开源大模型,Pinterest在视觉AI任务中实现了与闭源顶级模型相当的性能,而成本却降低了一个数量级。这一策略不仅有效对冲了广告收入增长放缓的压力,更可能为整个电商与内容推荐行业提供新的降本增效范式。作为用户购物旅程的“灵感起点”,Pinterest长期依赖AI驱动个性化推荐、图文混合搜索、广告定向及新品发现。今年推出的Pinterest Assistant更是其向“AI购物伙伴”转型的关键产品——用户可直接对话AI,获取基于个人收藏板、浏览习惯及相似人群偏好的穿搭、家居或礼品类建议。然而,面对投资者对“AI代理购物”(Agentic Commerce)商业前景的追问,Ready显得审慎而务实。他表示,尽管平台已通过与亚马逊合作实现“一键购买”,但是否让AI自动替用户下单,仍需观察用户真实意愿。“我们更关注引导用户完成决策,而非代替他们行动,”他强调。开源模型成降本利器,闭源API被边缘化Ready特别指出, ...
近日,IBM 宣布将裁员数千人,以便更加专注于快速发展的软件和人工智能(AI)服务。这一举措标志着这家已有114年历史的科技巨头正在进行重要的战略重组,反映出科技行业的新趋势。据 IBM 公司确认,此次裁员将影响其全球约270,000名员工中的 “个位数百分比”,这意味着受影响员工的数量可能在2,700至5,000人之间。IBM 发言人表示:“我们会定期审查我们的员工队伍,并根据需要进行调整。” 这次裁员计划预计将主要集中在美国的基础设施部门。那些被通知进行 “资源行动” 的员工将有30天的时间寻找内部新职位,否则将面临解雇及相应的遣散费。此次裁员是 IBM CEO 阿文德・克里希纳(Arvind Krishna)领导下的战略转型的一部分,旨在将公司资源更多地投入到利润率更高的软件和云服务领域,其中包括收购的红帽(Red Hat)部门。尽管 IBM 在最近的财报中报告软件收入增长了10%,但分析师指出,红帽业务的增长放缓可能促使公司进行此次重组。IBM 正在积极投资于更高增长的领域,包括软件开发、销售和其生成式 AI 平台 watsonx。同时,内部消息显示,基础设施部门将受到重创,有 ...
微软于 10 月 17 日宣布,OpenAI开发的新一代视频生成模型Sora2 已在Azure AI Foundry国际版上线,并进入公共预览阶段。这是该模型首次通过云平台向企业和开发者开放API接口,标志着生成式AI视频工具开始从封闭测试走向商业化应用。Sora2 是一款多模态视频生成模型,能够处理文本、图像和视频等多种类型的输入数据,并将这些元素组合生成新的视频内容。这种能力使其适用于广告制作、教育视频、社交媒体内容等多个应用场景。用户可以通过文本描述直接生成视频片段,省去了传统视频制作中的拍摄、剪辑等环节。图源备注:图片由AI生成从接入方式来看,用户需通过Azure AI Foundry的Standard Global API访问Sora2 服务,定价为每秒视频0. 1 美元。这一定价策略采用了按生成时长计费的模式,对于需要批量生成短视频内容的企业用户而言,成本结构相对透明且可预测。微软选择将Sora2 部署在Azure平台上,延续了其与OpenAI在云服务领域的深度合作模式。此前GPT系列模型也是通过Azure率先向企业客户开放。这种合作关系让微软能够将最新的AI能力快速整合到 ...
近日,旅行搜索引擎Kayak宣布推出全新的 “AI 模式”,该功能使用户可以通过内置聊天机器人在其网站上直接研究、规划和预订旅行。此功能现已在桌面和移动网页上提供,用户可以使用该 AI 聊天机器人提出与旅行相关的问题,如比较航班、酒店和租车服务。“AI 模式” 利用Kayak与 ChatGPT 的集成技术,能够提供更具上下文的搜索结果。此项功能的推出紧随Kayak于四月份推出的 Kayak.ai 测试平台,后者旨在为用户提供一个结合凯亚数据与 OpenAI 技术的实验环境,以便进行 AI 技术的尝试和改进。在 “AI 模式” 中,用户可以询问诸如 “我想在预算内去哪儿旅行?” 或者 “我希望在新年派对去哪里?” 等开放性问题,以获取旅行建议。此外,用户还可以询问最佳飞行时间以及相关票价信息。Kayak的博客上还分享了一些 AI 使用提示,以帮助用户更好地与该功能互动。这一新功能将为用户在旅行规划的早期阶段提供便利,帮助他们探索各种旅行选择。然而,Kayak尚未明确用户使用这一功能后的转化率,即这些 AI 用户是否会变成实际支付的客户。目前,“AI 模式” 仅支持英语,并已在美国推出,预 ...
维基百科运营方维基媒体基金会近日表示,由于越来越多用户通过 AI 聊天机器人和搜索引擎直接获取维基百科上的信息,导致其人类访问流量显著下降。这一现象引发了基金会对维基百科未来可持续发展的担忧。维基媒体基金会的高级总监 Marshall Miller 在官方博客中指出,虽然人们以新的方式获取知识是受欢迎的,但 AI 工具和社交平台在使用维基百科内容时,应该鼓励用户访问维基百科本身。他强调,维基百科的流量减少将导致志愿者减少,内容生产与扩充受到影响,甚至可能导致个人捐赠的减少,这将直接威胁到维基百科的正常运营。有趣的是,尽管 AI 和搜索引擎使维基百科的直接流量减少,但维基百科的数据对这些平台而言愈发重要。许多大型语言模型都使用维基百科作为核心数据集,而 Google 等平台长期依赖维基百科的文章来生成摘要和知识面板,这也进一步分流了维基百科的访问量。Miller 提到,维基百科在2025年5月观察到源自巴西的 “人类访问流量” 异常高。经过调查后,基金会调整了自动检测系统,发现最近的人类页面浏览量同比下降约8%。这一趋势反映出 AI 和社交媒体改变了用户获取信息的方式,搜索引擎越来越多地 ...
