AI 圈永远不缺「新活」。这两天,加州大学伯克利分校、斯坦福大学、英伟达等机构联合制作的《猫和老鼠》AI短片火了。 论文共同一作 Karan Dalal 的帖子收获百万观看。我们先来欣赏下面两段视频,重温儿时的快乐。故事梗概:In an underwater adventure, Jerry locates a treasure map and searches for the treasure while evading Tom in a chase through coral reefs and kelp forests. Jerry triumphantly discovers treasure inside a shipwreck, blissfully celebrating while Tom’s pursuit leads him into trouble with a hungry shark. (在一次水下探险中,Jerry 找到了藏宝图,并在躲避 Tom ...
题图来源:AI生成编辑 | 白菜叶在广阔的化学空间中优化分子设计面临着独特的挑战,尤其是在领域转移的情况下保持预测准确性。在最新的研究中,台湾大学(National Taiwan University)的研究人员整合了不确定性量化 (UQ)、定向信息传递神经网络 (D-MPNN) 和遗传算法 (GA) 来解决这些挑战。他们系统地评估了 UQ 增强型 D-MPNN 是否能够有效优化广泛、开放的化学空间,并确定了最有效的实施策略。测试结果表明,使用 Tartarus 和 GuacaMol 平台的基准,通过概率改进优化 (PIO) 进行 UQ 集成,在大多数情况下可以提高优化成功率,支持更可靠地探索化学多样化区域。在多目标任务中,PIO 被证明具有特别的优势,能够平衡相互竞争的目标,并且优于不确定性不可知论方法。这项研究为将 UQ 集成到计算辅助分子设计 (CAMD) 中提供了实用指南。该研究以「Uncertainty quantification with graph neural networks for efficient molecular design」为题,于 2025 年 4 ...
自回归解码已然成为大语言模型的推理标准。大语言模型每次前向计算需要访问它全部的参数,但只能得到一个 token,导致其生成昂贵且缓慢。近日,EAGLE 团队的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通过一系列优化解锁了投机采样的 Scaling Law 能力,可以将大语言模型的推理速度提高 6.5 倍,同时不改变大语言模型的输出分布,确保无损。同时,随着训练数据的增加,加速比还能进一步提高。论文标题:EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time TestarXiv 地址:https://arxiv.org/abs/2503.01840项目地址:https://github.com/SafeAILab/EAGLESGLang 版本:https://github.com/sgl-project/sglang/pull/4 ...
编辑 | 杨文这阵子,网友就逮着古人祸祸。老祖宗「回答我」式骂人热度还没过,这又来了个古人养生局。(查看详情请移步:一睁眼就被老祖宗追着骂,AI古人「回答我」视频火了)(视频来自博主长安梦华)地球人都知道,当代脆皮年轻人最是惜命。他们熬最狠的夜,喝最补的茶。冰淇凌要吃川贝枇杷味的,咖啡要喝红枣枸杞的,主打一个稀里糊涂散装养生。get 到了年轻人的心理,网友用 AI 出了个新玩法,让林黛玉、李时珍跳起了八段锦、五禽戏。比如这样式的:或者三人组团这样式的:嘎嘣脆的打工人不是喜欢上班办公室坐着,下班家里躺着嘛,现在连病娇林妹妹都开始活动身子骨,你好意思在沙发上「葛优瘫」?果不其然,不少网友跟着古人健起了身,不办卡、不囤课,简直就是「穷鬼」养生的最佳选择,因此这类 AI 视频的流量都贼拉高,点赞、转发量动辄上万。粉丝数更是蹭蹭地涨,仅一个月就收获 6.7 万粉丝。其实,这类古人跳养生操的视频很简单,用即梦 3.0 三下五除二就能搞定。我们就以「心较比干多一窍,病如西子胜三分」的林黛玉为例。第一步:生图 + 扩图我们打开即梦 AI 的「图片生成」,输入提示词:生成林黛玉正面全身照,古典风格;选择 ...
今天凌晨,国际计算机学会(ACM)宣布了今年的 ACM 计算突破奖获奖者。丛京生(Jason Cong)「因其在现场可编程系统和可定制计算的设计和自动化方面做出的奠基性贡献而获奖」。ACM 计算突破奖,全名为 ACM Charles P. “Chuck” Thacker Breakthrough in Computing Award(ACM 查尔斯・帕特里克・萨克尔计算机突破奖),旨在表彰那些对计算理念或技术做出惊人、颠覆性或跨越式贡献的个人或团体。该奖项还附带由微软资助的 10 万美元奖金。微软首席科学官 Eric Horvitz 表示:「丛京生在可定制计算和架构设计工具方面的开创性方法,体现了该奖项旨在表彰的『跨越式进步』。他的工作至今仍至关重要,为高度灵活且节能的 FPGA 架构奠定了基础,而这对于人工智能、云计算和其他快速发展领域的前沿应用而言都非常重要。」丛京生对 FPGA 发展贡献巨大丛京生,1963 年 2 月 20 日出生于北京市。于 1985 年从北京大学计算机科学与技术系毕业,之后赴美国留学;并于 1987 年和 1990 年分别获得美国伊利诺大学香宾校区计算机科学 ...
随着生成式AI快速发展,技术的滥用也带来了无处不在的深度伪造(Deepfake)风险内容,给社会与个人带来严重危害。构建安全可靠的Deepfake风险内容检测与防御技术体系已刻不容缓。 为应对AI伪造技术带来的新型安全挑战,近日,全球人工智能顶会IJCAI 2025“深度伪造检测、定位、可解释性”学术研讨会暨挑战赛”正式启动报名。研讨会将汇聚全球顶尖学者及产业人士,共同攻克多模态伪造、弱监督伪造定位、伪造可解释性、生成式AI对抗与防御等核心技术挑战,同时,挑战赛还提供超180万数据集,针对AI欺诈风险进行攻防实战演练,助力AI安全研究。研讨会与挑战赛由蚂蚁数科主办,新加坡科技研究局人工智能前沿研究中心,南洋理工大学,清华大学,中科院自动化所,合肥工业大学,安徽省数字安全重点实验室,罗切斯特大学,布法罗大学,坎皮纳斯大学等多家机构联合举办。挑战赛分设图片赛道和音视频赛道,通过“以赛促防”的方式,弥补现有检测算法在精准定位伪造区域与多模态音视频协同伪造识别方面的不足,提升AI时代内容安全水位。值得一提的是,面向挑战赛,蚂蚁数科开放了超过180万伪造样本的多模态深度伪造数据集,共涵盖88种伪 ...
刚刚,alphaXiv 推出了新功能「Deep Research for arXiv」,该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读,显著提升文献检索及研究效率。体验链接:https://www.alphaxiv.org/assistant在官方演示视频中,当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时,系统迅速生成了一篇内容完整、结构清晰的文献综述,并提供了 arXiv 链接。随后,用户询问「What are the latest breakthroughs in RL fine-tuning for LLMs?」,系统立即生成了包含当前热门论文的详细回答,将原本可能需要数小时的文献搜索过程缩短至几秒钟。该功能在 X 上引发了热烈讨论,有用户迅速试用并送出大大的点赞。上手实测一下,输入「图文大模型的最新研究进展」,可以看到,系统给出了最新的 arXiv 论文链接。此前,alphaXiv 还推出过自动为 arX ...
据 AIbase 最新消息,谷歌母公司 Alphabet 在近期财报电话会议及公开声明中再次确认,公司将坚持其在2025年高达750亿美元的资本支出计划。此举明确了谷歌持续投入基础设施建设,尤其是在人工智能(AI)领域保持领先地位的决心。巨额投入聚焦 AI 算力作为全球科技巨头,谷歌的资本支出计划一直备受业界关注。AIbase 分析指出,此次重申的750亿美元巨额投入中,相当一部分将用于构建和升级其数据中心基础设施,特别是用于支持日益增长的 AI 模型训练和推理所需的强大算力。这包括采购最新的高性能计算芯片,例如其自研的 TPU(张量处理单元)以及来自英伟达等供应商的先进 GPU。应对 AI 时代的需求增长AIbase 编辑观察到,谷歌此次大手笔投入正值全球 AI 技术蓬勃发展之际。无论是其 Gemini 系列大模型的持续迭代,还是在搜索、广告、云服务等核心产品中集成 AI 功能,都对底层的计算能力提出了前所未有的需求。通过增加资本支出,谷歌旨在确保其能够满足这些需求,并保持在 AI 领域的竞争优势。与竞争对手的战略对比AIbase 认为,谷歌的积极投入也反映了其与微软、亚马逊等竞争 ...
根据最新的市场研究报告,工业机器人市场预计将在2035年前达到2911亿美元,较当前市场价值551亿美元大幅增长。报告指出,推动这一增长的主要因素包括自动化、人工智能的进步以及工业4.0的崛起。汽车和电子行业将占据全球市场的主要份额,东亚地区则被视为这一领域的特别增长点,目前该地区已经占据了市场份额的三分之二。随着全球劳动短缺的加剧和消费者对快速、高效产品交付的需求上升,越来越多的企业开始借助自动化工具,尤其是工业机器人,来优化其运营流程。其中,协作机器人(cobots)受到特别青睐,这类机器人配备了先进的安全功能,能够与人类员工并肩工作。此外,报告还提到,对灵活可定制机器人解决方案的需求也在不断上升,这些解决方案能够根据具体的生产和加工需求进行调整。AI 驱动的机器人被认为具有变革性的潜力,能够实现预测分析、实时决策和自适应学习。通过整合 AI,机器人可以处理和分析大量数据,识别模式并做出自主决策,从而改善工作流程。这些功能在高科技行业(如电子、制药和航空航天)中尤为重要,因为这些行业对精度的要求极高。“工业机器人的快速发展正在改变自动化领域,使企业能够实现更高的效率、精确度和适应性 ...
近日,AI代码生成领域掀起了一波开源热潮,多款重量级模型接连亮相,其中Deep Cogito推出的Cogito v1Preview系列尤为引人注目。据AIbase了解,这一全新开源模型家族涵盖3B、8B、14B、32B和70B等多种规格,不仅在性能上全面超越同级别竞争者,其70B版本更是力压Meta最新发布的Llama4109B MoE模型,成为业界热议的焦点。这一系列模型的发布,不仅为开发者提供了强大的编程利器,也预示着AI技术在编码领域的全新突破。多规格覆盖,性能领跑行业Cogito v1Preview系列提供了从3亿到70亿参数的多种选择,满足不同场景下的开发需求。其中,70亿参数版本在多项基准测试中表现出色,超越了近期发布的Llama4109B MoE模型,尤其在代码生成、复杂推理和多任务处理方面展现了显著优势。AIbase分析认为,这一性能飞跃得益于Cogito团队在模型架构和训练策略上的创新优化,使其在开源模型中脱颖而出。专为编码优化,双模运行加持与传统语言模型不同,Cogito v1Preview系列针对编码任务进行了深度优化,支持函数调用和AI代理(Agents)用例, ...