自今年6月以来,尽管Meta向数据标注公司Scale AI投资了高达143亿美元,并聘请其首席执行官Alexandr Wang等高管加盟Meta Superintelligence Labs (MSL),但双方的关系似乎正面临挑战。核心问题源于数据质量的争议。尽管进行了巨额投资,但消息人士透露,Meta核心AI部门TBD Labs的研究人员普遍认为Scale AI的数据质量不佳,更倾向于与Scale AI的主要竞争对手Mercor和Surge合作。Meta的TBD Labs在成立前就已与这两家公司有合作,但向一家数据供应商投入如此巨资后,仍然依赖其竞争对手的情况十分罕见。这种现象背后反映出数据标注行业的变化。早期,Scale AI的众包模式依赖低成本劳动力处理简单任务,但随着AI模型复杂化,需要医生、律师等高技能领域专家来提供高质量数据。尽管Scale AI推出了Outlier平台,但像Mercor和Surge这样从一开始就建立在高薪人才模式上的竞争对手正迅速崛起。除了商业合作上的紧张,双方的人事整合也遭遇挫折。Scale AI前高管Ruben Mayer在加入Meta仅两个月后便离职 ...
在人工智能的快速发展中,Meta 与加州大学圣地亚哥分校(UCSD)合作,推出了一项名为 “DeepConf” 的创新技术。这项新技术在高难度推理题的准确性和计算成本方面取得了突破性的进展,成为业界关注的焦点。DeepConf 解决了长期以来困扰人工智能领域的一个核心问题:如何在进行复杂推理时保持高准确率的同时,降低计算资源的消耗。此次技术的推出,尤其是在 AIME2025数学竞赛中的表现,更是让人惊叹。DeepConf 与开源的 GPT-OSS-120B 模型结合,取得了高达99.9% 的准确率,并成功将计算资源的使用减少了84.7%。传统的推理方法往往依赖于生成大量不同解题思路,然后进行投票选出最佳答案。然而,这种方法在准确性和计算开销上面临重大挑战。Meta 与 UCSD 的研究团队指出,过多的解题路径可能导致效益递减,甚至可能由于低质量答案影响最终结果。此外,传统方法还需要消耗大量计算资源,这在经济上并不可行。DeepConf 通过引入 “置信度” 机制,改变了传统的推理模式。AI 在解题过程中会对每一步的信心进行评估,如果发现某一步骤的信心不足,就会及时停止并调整解题策略。这 ...
AI语音交互的天花板被彻底突破了!OpenAI刚刚正式发布的GPT-realtime语音模型,以其前所未有的自然流畅度和情感表达力,瞬间引爆了整个科技圈。这不再是那种机械化的合成语音,而是一个能够精准模拟人类语调、情感波动和语速变化的超级语音大脑。GPT-realtime的核心突破在于它对人类语音细节的极致还原。传统的AI语音系统往往听起来生硬僵化,缺乏人类交流中那种自然的韵律感和情感色彩。而GPT-realtime却能够捕捉到语音交流中最微妙的元素,从轻快的笑声到深沉的思考停顿,从激动的语速飙升到温和的音调转换,每一个细节都被精准地融入到语音生成中。这款多模态语音模型的能力远超单纯的语音合成。它不仅能够处理语音对话,还具备强大的图像理解能力,可以同时结合视觉信息和语音交流进行综合分析和响应。这种多维度的信息处理能力,为构建更加智能化的AI助手奠定了坚实基础。在复杂指令执行方面,GPT-realtime展现出了令人惊叹的精准度。它能够完美处理那些对传统语音系统极具挑战性的任务,比如逐字母拼读复杂单词、按照特定节奏朗读数字序列、在句子中间无缝切换不同语言等。这种精细化的控制能力,让AI语 ...
AIbase报道 -8月29日,阿里巴巴集团发布2026财年第一季度财报,业绩表现远超市场预期。剔除已出售业务影响,集团整体收入同比稳健增长10%,净利润同比大幅增长76%,充分展现了AI+云与消费两大战略领域投入的显著成效。阿里云本季度表现尤为亮眼,收入同比增长26%,创下三年来最高增速。这一成绩主要得益于AI需求的强劲推动,AI相关产品收入已连续八个季度实现三位数同比增长。阿里巴巴已建立起从AI算力、AI云平台、AI模型到应用开源生态的完整技术栈,有效支撑千行百业的AI需求。本季度,阿里对AI+云的资本支出达386亿元,同比激增220%,显示出对AI基础设施建设的坚定投入。近期,通义AI大模型表现抢眼,接连开源千问3非思考基础模型、推理模型和AI编程模型,分别夺得基础模型、编程模型、推理模型等主流领域全球开源冠军。同时开源的还包括视频生成模型Wan2.2、文生图模型Qwen-Image等多模态产品。据悉,4月底上线的即时零售业务快速见效,8月前三周成功带动淘宝app月度活跃消费者同比增长25%,展现出强大的用户吸引力和市场潜力。通过淘天集团、饿了么与飞猪的战略整合,阿里巴巴中国电商 ...
《人工智能生成合成内容标识办法》于9月1日起强制实施,这不仅仅是一纸技术标准,更是国家对AI内容治理的系统性布局,每一位内容创作者和AI从业者都将直面这场史无前例的合规大考。当前的AI内容生态确实到了必须规范的关键节点。从栩栩如生的AI换脸视频到以假乱真的合成音频,从精美绝伦的AI绘画作品到流畅自然的机器写作,AI生成内容已经渗透到我们数字生活的每个角落。然而,技术进步的另一面却是信息真实性的严重危机。AI声音克隆诈骗案件频发,虚假信息传播速度惊人,普通用户越来越难以区分真实与虚构的边界。新规的核心机制围绕双重标识体系展开。显式标识要求所有AI生成内容都必须以用户可直观感知的方式进行标注。文本内容需要在醒目位置标注”AI生成”或”人工智能生成”字样,图片和视频必须在边角位置添加清晰可见的标识文字,音频内容则要求在开头或结尾播放”由AI生成”的语音提示。这种强制性的明示要求,彻底打破了AI内容的”隐身术”。隐式标识的技术要求更加深入和精密。每一份AI生成内容都必须在文件元数据中嵌入结构化的标识信息,包括AI生成确认标志、内容提供方身份、生成时间戳、唯一识别编号等关键数据。这套”数字指纹” ...
根据风险投资公司 Andreessen Horowitz(a16z)发布的最新《前100名生成式 AI 消费应用报告》,AI 应用市场正在经历新一轮变化。尽管谷歌的 Gemini 依然落后于 ChatGPT,但在网络和移动应用领域,谷歌的产品正在逐步缩小差距,而中国公司在移动领域则占据主导地位。与2025年3月的版本相比,本次报告中仅新增11款网络应用,较上期的17款有所减少,显示出 AI 应用市场正趋于稳定。在移动应用方面,则有14款新应用上榜,这部分原因是应用商店正在加强对 “ChatGPT 克隆” 的监管。报告通过月独立访问量(来自 Similarweb)对前50名 AI 原生网络产品进行排名,同时对月活跃用户数(来自 Sensor Tower)排名前50的 AI 原生移动应用进行统计。在网络应用中,ChatGPT 仍以独特的月访问量位居榜首,谷歌的 Gemini 和 Deepseek 紧随其后。而在移动应用方面,ChatGPT 同样占据首位,Gemini、AI Gallery 和 Doubao 则名列前五。谷歌的 Gemini 家族首次在网络榜单上占据四个席位,现时 Gemin ...
8月31日,上海人工智能实验室(上海AI实验室)宣布开源发布多模态大模型书生·万象InternVL3.5。该模型通过创新的级联式强化学习(Cascade RL)、动态视觉分辨率路由与解耦部署架构,实现了推理能力、部署效率与通用能力的全面升级。InternVL3.5开源了从1B到241B各尺寸参数的全量级版本,刷新了开源模型性能标杆,在多种任务上达到领先水平。InternVL3.5的旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获得开源模型最高分77.7分,多模态通用感知基准MMStar和OCRBench分别取得77.9分和90.7分,超越GPT-5(75.7分/80.7分)。文本推理基准AIME25和MMLU-Pro分别达到75.6和81.3分,全面领先现有开源多模态大模型。依托级联式强化学习框架,全系列模型推理性能相比上一代平均提升16.0分。其中,InternVL3.5-241B-A28B综合推理性能达到66.9分,超越上一代模型的54.6分以及Claude-3.7-Sonnet的53.9分,在数学推理、逻辑推理等复杂任务中表现突出。借助创新 ...
AI技术在快餐行业的应用正遭遇现实的冷水浇灌!塔可钟这家快餐连锁巨头在大规模部署AI语音点餐系统后,开始对这项看似前沿的技术产生了深度质疑。公司首席数字官坦承,他们正在”积极讨论”何时应该使用AI,何时不应该使用AI。塔可钟已经在超过500家门店的得来速窗口部署了AI语音点餐系统,然而实际运行效果却远未达到预期。最典型的例子是有顾客故意订购18000杯水,试图通过这种极端方式”绕过”AI系统,直接与人工服务员对话。这类病毒式传播的尴尬时刻,不仅暴露了AI系统的局限性,也对品牌形象造成了负面影响。首席数字和技术官戴恩·马修斯在接受《华尔街日报》采访时坦率地承认,即使作为公司的技术负责人,他对AI点餐系统的体验也是喜忧参半:”有时候它让我失望,但有时候它真的让我惊喜。”这种直白的表述,反映了AI技术在实际商业应用中面临的复杂挑战。塔可钟目前的策略显示出明显的谨慎态度。公司正在重新评估AI在得来速服务中的广泛部署计划,并给予不同的加盟商更大的自主决策权。马修斯表示,在繁忙时段排队较长的餐厅,让人工服务员处理得来速订单可能比完全依赖AI更为明智。这种灵活的混合模式反映了公司对AI技术局限性的深 ...
印度音频系列平台制作商Pocket FM正在大力押注人工智能技术,希望借此成为”音频界的Netflix”。这家获得光速创投支持的初创公司近日推出了AI工具套件,旨在帮助编剧更快速地创作内容,以满足用户对数百集音频系列的巨大需求。Pocket FM的商业模式是根据用户喜好匹配相应的音频系列内容,这要求平台能够快速发布大量内容。为此,该公司开发了一套名为CoPilot的AI写作工具,能够为编剧提供诸如建议更好的剧集结局、让叙述更具吸引力等功能。创始人Rohan Nayak表示,公司正在向所有编剧推广这些AI工具,以缩短他们完成剧集创作的时间。此前,Pocket FM已经在使用一些AI工具,比如利用ElevenLabs为音频系列生成语音,并在内部测试了用于写作和改编辅助的AI工具。CoPilot工具的功能相当全面。它能够将叙述性写作转换为对话式写作,针对特定片段进行优化。该工具还具备”节拍分析”功能,能够根据特定类型音频系列的特点来塑造写作风格,使内容更具吸引力。此外,CoPilot还提供基础的聊天机器人式写作功能,包括”缩短”、”扩展”以及通过提示生成文本的能力。为了开发CoPilot,P ...
根据最新的报告,人工智能(AI)行业正在迅速崛起,吸引了大量财富,创造了前所未有的亿万富翁。根据 CB Insights 的数据,目前全球有近500家 AI 独角兽公司(即私人公司估值超过10亿美元),它们的总价值已达到2.7万亿美元。在过去的两年中,这些公司中诞生了100家新的独角兽,包括知名的 OpenAI、Anthropic 和 Scale AI 等。AI 行业的蓬勃发展使得商业领袖们无需再花费数十年时间去构建下一个大项目,他们只需创立一家 AI 公司,便可跻身亿万富翁行列。值得注意的是,自2023年以来,就有100家新独角兽公司成立。而且,目前市场上还有1300多家估值超过1亿美元的 AI 初创公司。例如,前 OpenAI 首席技术官 Mira Murati 创办的 Thinking Machines Lab 最近完成了20亿美元的种子融资,估值达到了120亿美元。这一现象使得很多业内人士认为,我们正经历一个类似于上世纪90年代末和2000年代初的科技热潮,那时许多今天的科技巨头如 eBay 和谷歌都崭露头角。虽然无法直接将 AI 的独角兽现象与当时的 “网络泡沫” 进行比较, ...