Fudan University and Jieyue Xingchen, a leading domestic AI innovation company, recently announced the upcoming release of OmniSVG, an end-to-end multi-modal SVG generation model. This news has quickly garnered significant attention in the technology and design fields. According to AIbase, OmniSVG’s core strength lies in its powerful generation capabilities, supporting the creation of vector graphics ranging from simple icons to complex anime characters, providing a novel intelligent solution f ...
Tesla is accelerating its plans for mass production of its Optimus humanoid robot. Recent reports indicate Tesla has significantly increased hiring, adding dozens of Optimus-related positions across manufacturing engineering, production management, and technology development. This signifies Tesla’s commitment to its goal of producing the first batch of Optimus robots by 2025, while deepening collaboration with partners to commercialize humanoid robot technology.Tesla’s current job openings have ...
QCP Capital:市场关注今晚的非农数据,若数据疲软可能强化美联储今年进一步降息的预期QCP Capital分析称,美国总统特朗普宣布对所有进口商品征收10%关税,并针对贸易逆差大的国家实施“对等关税”,引发全球贸易紧张局势。受此影响,比特币价格从88,500美元高点急跌至81,200美元,抹去此前涨幅并导致加密市场出现广泛清算,超过2.21亿美元的多头头寸被平仓,BTC跌幅大于ETH。与此同时,美股期货也遭重挫,标普500期货下跌3.38%,纳斯达克100期货下滑4.28%。 市场焦点现转向今晚的美国非农就业报告,若数据疲软可能强化美联储今年进一步降息的预期。目前市场预计2025年将有四次降息,分别在6月、7月、9月和12月,每次降息幅度为25个基点。短期内期权市场波动率仍高,投资者倾向于购买下行保护,反映出市场情绪的不确定性和谨慎态度。不过,随着风险资产超卖,短期内或存在反弹机会。Arthur Hayes:全球经济失衡或利好比特币和黄金,美联储可能很快降息并重启量化宽松BitMEX联合创始人Arthur Hayes表示,全球经济失衡将通过印钞来缓解,这对比特币和黄金中期表现有 ...
大模型能写出 ICML Spotlight 论文吗?近年来,AI 正从科研辅助工具蜕变为创新引擎:从 DeepMind 破解蛋白质折叠难题的 AlphaFold,到 GPT 系列模型展现文献综述与数学推理能力,人工智能正逐步突破人类认知边界。今年 3 月 12 日,Sakana AI 宣布他们推出的 AI Scientist-v2 通过了 ICLR 会议一个研讨会的同行评审过程。这是 AI 科学家写出的首篇通过同行评审的科研论文!这一里程碑事件标志着 AI 在科研领域的突破,同时人们也在进一步探索 AI 智能体的自主研究能力。4 月 3 日,OpenAI 推出了 PaperBench(论文基准测试),这是一个用于评估 AI 智能体自主复现前沿人工智能研究能力的基准测试系统。如果大模型智能体具备了自动写 AI / 机器学习研究论文的能力,既可能加速机器学习领域的发展,同时也需要审慎评估以确保 AI 能力的安全发展。PaperBench 在多个重要的 AI 安全框架中发挥评估作用:作为 OpenAI 准备框架(OpenAI Preparedness Framework)中评估模型 ...
ATEC2025 科技精英赛是由 ATEC 前沿科技探索社区主办,清华大学、浙江大学、西安交通大学、上海交通大学发起。本届赛事由香港中文大学、北京大学、北京师范大学顶尖学府联合蚂蚁集团共同承办的全球性智能科技竞技盛会。本届赛事聚焦人工智能与机器人技术融合创新,设置软件算法与硬件设计双赛道,通过线上线下联动模式,推动具身智能技术在养老援助、灾害救援等现实场景的突破性应用。赛事速递报名截止:2025 年 4 月 25 日 10:00 A.M.(UTC+8)参赛入口:www.ATECup.com赛事亮点210,000 美元高额奖池ATEC2025 赛事总奖金池达 21 万美元(税前),为顶尖科技团队设立,以真金白银激励前沿技术方案的落地与迭代。体验顶尖机器人硬件入围决赛团队将使用由主办方提供的商业级机器人设备参与决赛,零距离接触行业最前沿硬件生态。组委会也鼓励使用自研机器人参与决赛,可获专项硬件补贴 。产学研创深度联动入围决赛团队将受邀赴香港决赛,与人工智能 / 机器人领域权威学者、产业领袖、行业投资者面对面沟通交流,验证想法。软件赛道介绍硬件赛道介绍 组织亮点知名高校牵头命题:香 ...
2025 年,生成式 AI 的发展速度正在加快。我们见证了 DeepSeek R1,用强大的推理能力再次点燃 AI 智力增长的火箭。在上个星期,OpenAI 给 GPT-4o 的一波图像生成更新又让全网陷入了梗图、甚至玩梗视频制造的火热氛围中。 用 GPT-4o 渲染过的《星际穿越》电影片段。AI 的「想象力」一次又一次震撼着我们,基于先进大模型的应用正在越来越多的领域引发革命,被改变的也包括科技领域本身。比如,生成式 AI 正在改变人们获取信息的方式。很多人认为,大型语言模型(LLM)既然强于生成和推理,那么应该也能从用户的历史行为中洞察出深层次的兴趣,进而为推荐系统找到全新的可能性。既然生成式 AI 能通过已知上下文预测生成新内容,那么已知一些人们感兴趣的内容,AI 应该也可以预测出他们的下一个兴趣点。这个预测的内容可以是一篇文章、一段视频、某个品牌的商品或是 App 上的服务。近日,百度推荐广告团队在广告生成式推荐取得了新成果,其构建的生成式 AI 推荐系统实现了前所未有的效果。论文标题:Sparse Meets Dense: U ...
本文作者来自复旦大学、上海交通大学和上海人工智能实验室。一作江书洋为复旦大学和实验室联培的博二学生,目前是实验室见习研究员,师从上海交通大学人工智能学院王钰教授。本文通讯作者为王钰教授与张娅教授。低秩适配器(LoRA)能够在有监督微调中以约 5% 的可训练参数实现全参数微调 90% 性能。然而,在 LoRA 训练中,可学习参数不仅注入了知识,也学习到了数据集中的幻觉噪声。因为这种特性的存在,大多数的 LoRA 参数都将可学习秩设置为一个较小的值(8 或者 16),通过减小知识学习程度来避免幻觉,而这也限制了 LoRA 的性能上限。 图 1 普通的 LoRA 微调随着秩的增大性能无法同步增加,而参数冗余微调能够以冗余参数提升性能。为了解决这个问题,上海交通大学人工智能学院、复旦大学和上海人工智能实验室的团队提出了参数冗余微调范式以及一种创新性的微调算法:NoRM(Noisy Reduction with Reserved Majority)。参数冗余微调范式下,可以以普通的 LoRA 训练方式进行训练,并使用特定的方法在将 ...
编辑丨&微生物是驱动元素循环的引擎,它们分泌蛋白质以寻求生活环境。现阶段还缺乏有效的计算方法来研究分泌蛋白。表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。在这项研究中,维也纳大学(University of Vienna)与上海海洋大学的研究者识别并描述了海洋细胞外蛋白的适应性,开发了一款名为「Ayu」的机器预测工具,不使用基于同源的预测器,并且比当前最先进的软件实现了更好、更快的性能。该模型实际应用于海洋样本(Tara Oceans 数据集)时,相比于最广泛使用的鉴定分泌蛋白的方法,全新的方法能够回收两倍以上的蛋白质。他们的研究成果以「Ayu: a machine intelligence tool for identification of extracellular proteins in the marine secretome」为题,于 2025 年 3 月 21 日刊登于《Nature Communications》。微生物分泌研究据实验室研究,高达 30% 的细菌基因组编码释放到细胞外环境中的蛋白质,参与到了细菌与环境的相互作 ...
论文一作李靖瑶,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是大语言模型,包括模型预训练、后训练、推理优化。作者陈鹏光、夏彬等均为 DV Lab 成员。大模型写代码早就是基操了,但让它写算法竞赛题或企业级系统代码,就像让只会煮泡面的人去做满汉全席 —— 生成的代码要么是 “铁板一块” 毫无章法,要么是 “一锅乱炖” 难以维护。如何让大模型像工程师一样思考,用模块化思维拆解复杂问题? 近日,贾佳亚团队提出 MoTCoder(Module-of-Thought Coder),通过创新的模块化思维指令微调(MoT Instruction Tuning),显著提升了模型在复杂编程任务中的准确率与可维护性。实验显示,在 APPS 和 CodeContests 等权威编程基准上,MoTCoder 的 pass@1 准确率直接刷新记录,甚至超越 SOTA 6%,让大模型在 “疯狂打码” 时更接近「人类智慧」。论文标题:MoTCoder: Elevating Large Language Models with Modular of Thought for Challenging ...
扩展无语言的视觉表征学习。在视觉问题解答(VQA)等多模态环境中,当前视觉自监督学习(SSL)的表现还比不上语言图像预训练(CLIP)。这种差距通常归因于语言监督引入的语义,尽管视觉 SSL 模型和 CLIP 模型通常在不同的数据上进行训练。在最近的一项研究中,Yann LeCun、谢赛宁等研究者探讨了一个基本问题: 语言监督对于多模态建模的视觉表征预训练是否必要?论文标题:Scaling Language-Free Visual Representation Learning论文链接:https://arxiv.org/pdf/2504.01017项目地址:https://davidfan.io/webssl/「我们的目的不是要取代语言监督方法,而是要了解视觉自监督在多模态应用中的内在能力和局限性。为了进行公平的比较,我们在与最先进的 CLIP 模型相同的数十亿规模的网络数据(特别是 MetaCLIP 数据集)上训练 SSL 模型。在比较视觉 SSL 和 CLIP 时,这种方法可以控制数据的分布差异。」研究者表示。论文共同一作 David Fan 表示,「视觉 SSL 终于可以在 V ...