AIbase报道 -8月29日,阿里巴巴集团发布2026财年第一季度财报,业绩表现远超市场预期。剔除已出售业务影响,集团整体收入同比稳健增长10%,净利润同比大幅增长76%,充分展现了AI+云与消费两大战略领域投入的显著成效。阿里云本季度表现尤为亮眼,收入同比增长26%,创下三年来最高增速。这一成绩主要得益于AI需求的强劲推动,AI相关产品收入已连续八个季度实现三位数同比增长。阿里巴巴已建立起从AI算力、AI云平台、AI模型到应用开源生态的完整技术栈,有效支撑千行百业的AI需求。本季度,阿里对AI+云的资本支出达386亿元,同比激增220%,显示出对AI基础设施建设的坚定投入。近期,通义AI大模型表现抢眼,接连开源千问3非思考基础模型、推理模型和AI编程模型,分别夺得基础模型、编程模型、推理模型等主流领域全球开源冠军。同时开源的还包括视频生成模型Wan2.2、文生图模型Qwen-Image等多模态产品。据悉,4月底上线的即时零售业务快速见效,8月前三周成功带动淘宝app月度活跃消费者同比增长25%,展现出强大的用户吸引力和市场潜力。通过淘天集团、饿了么与飞猪的战略整合,阿里巴巴中国电商 ...
《人工智能生成合成内容标识办法》于9月1日起强制实施,这不仅仅是一纸技术标准,更是国家对AI内容治理的系统性布局,每一位内容创作者和AI从业者都将直面这场史无前例的合规大考。当前的AI内容生态确实到了必须规范的关键节点。从栩栩如生的AI换脸视频到以假乱真的合成音频,从精美绝伦的AI绘画作品到流畅自然的机器写作,AI生成内容已经渗透到我们数字生活的每个角落。然而,技术进步的另一面却是信息真实性的严重危机。AI声音克隆诈骗案件频发,虚假信息传播速度惊人,普通用户越来越难以区分真实与虚构的边界。新规的核心机制围绕双重标识体系展开。显式标识要求所有AI生成内容都必须以用户可直观感知的方式进行标注。文本内容需要在醒目位置标注”AI生成”或”人工智能生成”字样,图片和视频必须在边角位置添加清晰可见的标识文字,音频内容则要求在开头或结尾播放”由AI生成”的语音提示。这种强制性的明示要求,彻底打破了AI内容的”隐身术”。隐式标识的技术要求更加深入和精密。每一份AI生成内容都必须在文件元数据中嵌入结构化的标识信息,包括AI生成确认标志、内容提供方身份、生成时间戳、唯一识别编号等关键数据。这套”数字指纹” ...
根据风险投资公司 Andreessen Horowitz(a16z)发布的最新《前100名生成式 AI 消费应用报告》,AI 应用市场正在经历新一轮变化。尽管谷歌的 Gemini 依然落后于 ChatGPT,但在网络和移动应用领域,谷歌的产品正在逐步缩小差距,而中国公司在移动领域则占据主导地位。与2025年3月的版本相比,本次报告中仅新增11款网络应用,较上期的17款有所减少,显示出 AI 应用市场正趋于稳定。在移动应用方面,则有14款新应用上榜,这部分原因是应用商店正在加强对 “ChatGPT 克隆” 的监管。报告通过月独立访问量(来自 Similarweb)对前50名 AI 原生网络产品进行排名,同时对月活跃用户数(来自 Sensor Tower)排名前50的 AI 原生移动应用进行统计。在网络应用中,ChatGPT 仍以独特的月访问量位居榜首,谷歌的 Gemini 和 Deepseek 紧随其后。而在移动应用方面,ChatGPT 同样占据首位,Gemini、AI Gallery 和 Doubao 则名列前五。谷歌的 Gemini 家族首次在网络榜单上占据四个席位,现时 Gemin ...
8月31日,上海人工智能实验室(上海AI实验室)宣布开源发布多模态大模型书生·万象InternVL3.5。该模型通过创新的级联式强化学习(Cascade RL)、动态视觉分辨率路由与解耦部署架构,实现了推理能力、部署效率与通用能力的全面升级。InternVL3.5开源了从1B到241B各尺寸参数的全量级版本,刷新了开源模型性能标杆,在多种任务上达到领先水平。InternVL3.5的旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获得开源模型最高分77.7分,多模态通用感知基准MMStar和OCRBench分别取得77.9分和90.7分,超越GPT-5(75.7分/80.7分)。文本推理基准AIME25和MMLU-Pro分别达到75.6和81.3分,全面领先现有开源多模态大模型。依托级联式强化学习框架,全系列模型推理性能相比上一代平均提升16.0分。其中,InternVL3.5-241B-A28B综合推理性能达到66.9分,超越上一代模型的54.6分以及Claude-3.7-Sonnet的53.9分,在数学推理、逻辑推理等复杂任务中表现突出。借助创新 ...
AI技术在快餐行业的应用正遭遇现实的冷水浇灌!塔可钟这家快餐连锁巨头在大规模部署AI语音点餐系统后,开始对这项看似前沿的技术产生了深度质疑。公司首席数字官坦承,他们正在”积极讨论”何时应该使用AI,何时不应该使用AI。塔可钟已经在超过500家门店的得来速窗口部署了AI语音点餐系统,然而实际运行效果却远未达到预期。最典型的例子是有顾客故意订购18000杯水,试图通过这种极端方式”绕过”AI系统,直接与人工服务员对话。这类病毒式传播的尴尬时刻,不仅暴露了AI系统的局限性,也对品牌形象造成了负面影响。首席数字和技术官戴恩·马修斯在接受《华尔街日报》采访时坦率地承认,即使作为公司的技术负责人,他对AI点餐系统的体验也是喜忧参半:”有时候它让我失望,但有时候它真的让我惊喜。”这种直白的表述,反映了AI技术在实际商业应用中面临的复杂挑战。塔可钟目前的策略显示出明显的谨慎态度。公司正在重新评估AI在得来速服务中的广泛部署计划,并给予不同的加盟商更大的自主决策权。马修斯表示,在繁忙时段排队较长的餐厅,让人工服务员处理得来速订单可能比完全依赖AI更为明智。这种灵活的混合模式反映了公司对AI技术局限性的深 ...
本文第一作者为陈宇辉,中科院自动化所直博三年级;通讯作者为李浩然,中科院自动化所副研;研究方向为强化学习、机器人学习、具身智能。视觉-语言-动作模型在真实世界的机器人操作任务中显示出巨大的潜力,但是其性能依赖于大量的高质量人类演示数据。由于人类演示十分稀缺且展现出行为的不一致性,通过监督学习的方式对 VLA 模型在下游任务上进行微调难以实现较高的性能,尤其是面向要求精细控制的任务。为此,中科院自动化所深度强化学习团队提出了一种面向 VLA 模型后训练的强化微调方法 ConRFT(Consistency-based Reinforced Fine-tuning)。其由离线和在线微调两阶段组成,并具有统一的基于一致性策略的训练目标。这项工作凸显了使用强化学习进行后训练以增强视觉-语言-动作模型在真实世界机器人应用中的潜力。目前,该论文已被机器人领域顶级会议 Robotics: Science and Systems XXI(RSS 2025)接收。论文标题:ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consiste ...
你想要的机会,可能在新加坡。今年的 ICLR 大会将于 4 月 24 日在新加坡开幕,想必很多从业者将前往现场参会。如果你也是其中之一,不妨关注一下另一份邀请 ——「云帆・ICLR 2025 AI Talent Meetup」。这是机器之心与上海人工智能实验室、东方菁汇、 黄大年茶思屋科技网站、蚂蚁技术研究院、全球高校人工智能学术联盟共同攒的饭局,旨在为企业和人才搭建沟通桥梁。在晚宴开始前,你可以在我们设置的企业岗位 poster 专区转上几圈,和感兴趣的机构、高校及企业深入交谈。无论你的目标是高校教职,还是大厂算法工程师,这场晚宴都能让你找到合适的机会。活动开始后,你可以听到有价值的技术分享,与演讲嘉宾产生思想碰撞。4 月 24 日,来「云帆・ICLR 2025 AI Talent Meetup」晚宴,一起来见见老朋友,结识新朋友,机会在等你。Meetup 日程活动时间签到 & 企业岗位 poster 交流:新加坡时间 4 月 24 日 16:00-17:30内场晚宴:新加坡时间 4 月 24 日 17:30-20:30活动地点新加坡・市中心活动规模200 人为了与众多青年才 ...
当AGI向着PhysicalAI物理具⾝智能时代演进,⼀场重塑未来认知的⻛暴正在悄然兴起。在2025SENSETIMETECHDAY商汤技术交流⽇上,灵宇宙创始⼈兼⾸席执⾏官顾嘉唯做了分享。他认为在当下AI技术从“⼯具属性”向“伙伴属性”跃迁,⼈机交互范式正在经历从“⼈适应机器”到“机器理解世界”的根本性变⾰。⼈们和世界的交互会随之发⽣巨变。下⼀代年轻⼈会开启全新的个性化教育模式,摆脱填鸭式教学让快乐学习成为⽇常。灵宇宙推出的新款AI终端(灵感源⾃电影《Her》),通过重塑⼈与物理世界的交互逻辑,重新定义学习⽅式让“世界即课堂,万物皆教材”成为现实。在这个背景下,灵宇宙开发出⼀款新产品「Ling!灵宇宙AI学伴(昵称:⼩⽅机)」(以下简称:Ling!),它是⼀个随⾝的AI助理和伙伴,搭载的⼀套物理世界的AI-OS,叫做LingOS,让学习的对象从⼀平⽶书桌来到更⼴域的整个物理空间,给孩⼦构建了⼀个专属的4D空间交互智能的“世界模型”,让他们在学习认知的成⻓的过程中获得更好的体验。灵宇宙是⼀家专注空间交互智能的创新公司,致⼒于构建新⼀代物理世界AI-OS,赋予机器⼈“灵魂”,让万物在AI ...
Llama 4 或许只是冰山一角。「AI 大模型自去年 8 月以来就没有太大进步」。这是一位 AI 创业者在近期的一篇博客中发表的观点。他在创业过程中发现,自去年 8 月以来,AI 大模型(如 Claude 3.7 等)在官方发布的基准测试上声称的巨大进步与实际应用场景中的有限提升之间存在明显脱节。这导致他们无法借助模型能力来提升产品体验。很多 YC 创业者也有类似的体验。作者认为,这其中可能的原因包括基准测试作弊、基准无法衡量实用性或模型实际很聪明但对齐存在瓶颈。如果不解决这些基础问题,AI 系统可能会在表面上显得很聪明,但在组合成社会系统时会出现根本问题。以下是博客原文: 模型得分与消费者体验脱节大约九个月前,我和三个朋友认为人工智能已经足够好,可以自主监控大型代码库的安全问题了。我们围绕这个任务成立了一家公司,试图利用最新的大模型能力来创建一种工具,用以取代至少很大一部分渗透测试人员的价值。我们从 2024 年 6 月开始从事这个项目。在公司成立后的头三个月内,Anthropic 的 Claude 3.5 sonnet 就发布了。只需切换在 GPT-4o 上运行的服务部分,我 ...
这份工作的魅力之一,就是能第一时间体验到最新、最前沿的大模型。当然,发布初期难免有些社死时刻,但这次,例外。就在前天深夜,OpenAI 重磅空降 o 系列模型的最新成员:o3 与 o4-mini,也是迄今为止他们最聪明的模型。人类的进化,始于制造和使用工具。o3 和 o4-mini 也是如此,他们的「聪明」源于学会了使用工具。模型能自主调用联网搜索、记忆系统、代码解释器等 ChatGPT 原生工具,实现任务闭环处理。你只需要布置任务,然后可以放心起身去倒杯咖啡——回来时,高质量结果已在屏幕上静候。而且,它们还有一个关键升级:视觉思维能力上线。不仅能看图识物,更能像刑侦人员一样,从图像中分析、推理、挖掘信息。要说差异,o3 是满血旗舰,性能拉满;o4-mini 是高性价比小钢炮( GPT-o4 的小型化版本),体积更小、价格更优,但性能不打折——尤其在数学和编程任务上,表现出乎意料的强劲。网友直呼:一周之内,它就成了我处理绝大多数任务的首选模型!写作时,我依旧用 GPT-4.5;编程时,还在用 3.7 Sonnet;但除此之外,我一直在用 o3。免费用户,每天至少有一次体验o3机会,记得 ...