大模型时代,业界和学术界都涌现出了许多创新成果。回顾年初到现在,短短几个月的时间,国内外已经出现了许多重大研究,比如国内的 DeepSeek R1,国外的 GPT-4.5、Grok-3 等。AI 的发展速度似乎已经快进到了以周甚至以天为单位。面对应接不暇的研究,我们如何才能在最快的时间了解最新科研成果与发展趋势?参加论文分享会就是一个不错的选择。作为机器学习和深度学习领域的顶级会议,ICLR 具有极高的含金量,每年都会吸引大量研究机构和高校参会。今年,ICLR 2025 共接收 11,565 份投稿,录用率为 32.08%。为了给广大 AI 从业者搭建一个自由轻松的学术交流平台,机器之心计划 4 月 20 日在北京举办「ICLR 2025 论文分享会」,广邀大家报名参与。如果有论文作者想要分享或者 poster 自己的 ICLR 2025 论文,也欢迎扫描二维码报名!分享会拟定日程ICLR 论文分享会将设置 Keynote、论文分享、圆桌对话、Poster 展示环节,就业内关注的多模态、Agent 等热门主题邀请顶级专家、论文作者与观众做学术交流。时间:北京时间 4 月 20 日 09 ...
编辑 | ScienceAI在人工智能跨界医疗的浪潮中,如何赋能视觉语言模型(VLM)去 “看懂” 多种类型的医学影像,并在疾病诊断、病灶分析等任务中给出可信解释,已成关键挑战。近期,来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略,称之为 “Med-R1”,通过鼓励模型在 “推理过程” 上不断探索,大大提升了跨模态、跨任务的泛化能力。本文将结合实验结果和推理案例,为大家展示 DeepSeek 在医疗 VLM 中的实战成效。论文地址:https://arxiv.org/html/2503.13939v1一、DeepSeek:让医疗 VLM 从 “记忆答案” 到 “探索推理”在传统的有监督微调(SFT)中,模型往往只需直接匹配训练集中预先标注的 “标准答案”,容易在单一场景上过拟合,缺乏跨模态或跨任务的适应能力。DeepSeek 强化学习通过 Group Relative Policy Optimization(GRPO)机制,让模型在回答同一个问题时生成多条推理路径,对它们进行相对评分、比较,并基于预定义的临床规则来给出奖励。奖 ...
偶然发现了一个很有趣的 AI 基准测试,点开链接,竟然是一个 MineCraft 作品投票页面?如图所示,这些作品都是 AI 完成的,灰色框中的文字对应的是提示词。黑框是可点击的选项 ——A、B 或者持平。网站地址:https://mcbench.ai/来都来了,先投个票吧。投票之前,作品都是「匿名」的。只有在投票后,我们才能看到每个 Minecraft 作品是由哪个模型完成的。在这个基准里,主要看三个维度:指令遵循、代码完成度和创造力。AI 技术飞速演进的时代,传统的人工智能基准测试显然不够用了。总有人能想出一些新颖的测试方法,比如的沙盒建造游戏 Minecraft。这就是我们刚刚看到的 Minecraft Benchmark(MC-Bench)。作为用户,我们能够参与的部分就是:投票。累计票数中的 ELO 分数决定了每个模型的排名。有趣的是,无论采用哪种指标,排行榜的收敛程度都很高:Claude 3.7 & 3.5 和 GPT-4.5 都是断层领先。从技术上讲,MC-Bench 是一个编程基准,因为模型需要编写代码来创建所提示的构建,如「冰霜雪人」(Frosty the S ...
明星机器人产品公司——维他动力(Vita Dynamics)近期完成了种子+轮融资,成立三个月内,累计完成2亿元种子轮融资,本轮融资由知名投资机构今日资本、凯辉基金领投,雅瑞资本参与投资,高瓴创投、元璟资本、初心资本、柏睿资本及BV百度风投等多家首轮投资方持续跟投,高鹄资本担任独家财务顾问。此次融资将进一步加速维他动力为个人和家庭创造生活空间智能伙伴的产品研发与市场拓展。在技术突破和应用场景的双重驱动下,机器人产业化进程已经迎来重大机遇。首先,近20年智能电动车和移动互联网的快速发展,中国已经培育了成熟的电池电驱产业链、高质高效的智能制造能力和世界领先的人工智能人才储备。作为“新质生产力”和“人工智能”的关键载体,全球机器人产业变革必将以“中国创造”为核心。其次,端到端的 VLA 模型在环境感知、复杂任务分解和推理决策的能力突破,不仅推动了智能驾驶领域的整体发展,更会推动机器人在自然交互、自主移动、自主操作等多个关联技术领域的发展。通过AI创新研发,机器人将具备在生活空间提供服务的能力。最为重要的是,用户的服务需求亟需得到满足。维他动力相信具身智能的发展会带来服务平权,让过去价格高昂的 ...
编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。存在多种功能注释方法,而且它们的数量一直在增长,尤其是随着深度学习技术的发展。但是,目前尚不清楚这些工具是否真的具有预测性。由于科学家不知道有任何方法可以识别功能本体中的新术语,但是他们想知道它们是否至少可以识别与已知蛋白质家族不同源或相差甚远的蛋白质的分子功能。在这里,埃默里大学(Emory University)的研究人员探索了现有方法在预测数千种此类蛋白质的分子功能方面的潜力和局限性。该研究以「Functional profiling of the sequence stockpile: a protein pair-based assessment of in silico prediction tools」为题,于 2025 年 1 月 24 日发布在《Bioinformatics》。瓶颈细胞中蛋白质含量丰富,功能多样,但实验注释成本高、速度慢,导致大量蛋白质功能未明确。计算注释通过同源性转移功能,但面临三个主要瓶颈:进化分歧:同源基因可能因进化产生不同功能,导致假阳性或假阴性注 ...
天猫率先给商家配备“AI设计助手”,可一键生成媲美实拍的场景图! 3月20日,在上海AWE2025展上,天猫推出的电商行业首款AI 设计工具“家作”全新升级。商家上传商品图,即可一键生成多种风格的场景图,并且可以选择模特做展示,自定义出图,效果如同专业级棚拍实感。据悉,家作是专注服务家装、家居、家电行业商家的AI设计工具。家作AI棚拍功能,不仅可以根据产品类型,一键生成80多种风格的场景图,还升级支持商家上传参考图或输入文字描述,自主创意设计。新增的AI模特功能,可模拟真人展示实拍效果,支持自定义输入。如AI模特躺在枕头上,甚至会出现头部和枕头承压的褶皱感,效果媲美实拍。“家作能解放设计师一部分基础性工作,聚焦在产品的创意设计上,同时也能简化我们的工作流。”慕思品牌相关负责人介绍,近一年,我们积极探索,通过家作AI采纳的场景图有近2000张,其中带模特的有900多张,相比用传统模式,省了140多万元的设计成本。目前,“家作”上线运营一年,有超13万商家使用,包含源氏木语、慕思、全友、帕莎曼、芝华仕、洁丽雅、雷士、苏泊尔等头部品牌。“我们希望通过AI技术来帮助商家提升经营效率。”天猫家作 ...
蚂蚁集团正加码AI医疗产业布局,3月21日,其对外公布了在医疗机构、医生、用户三端最新AI产品体系升级。其中,面向医疗机构,蚂蚁联合华为医疗卫生军团、阿里云等推出“蚂蚁医疗大模型一体机”全栈式解决方案;面向好大夫在线29万注册医生,发布AI医生助手系列工具;同时,服务用户的健康应用“AI健康管家”也推出智能思考、健康自测等十余项新功能。AI浪潮下,医疗机构对大模型部署需求与日俱增,但在落地与实际应用中,兼顾服务便捷与数据安全、平衡应用性能与投入成本也成为主要挑战。为解决这一问题,蚂蚁集团联合阿里云、华为医疗卫生军团、卫宁健康、纳里智数等近百家产业伙伴,宣布推出全新“蚂蚁医疗大模型一体机”全栈解决方案:医疗机构仅需一键接入蚂蚁医疗大模型一体机设备,即可完成国产算力、医疗大模型、AI训推一体的私有化部署,推进院内业务系统、患者服务AI升级。据悉,杭州市医保局、宁波市鄞州区卫健委、北京中医医院、上海仁济医院、上海市中医医院、浙江省人民医院、迪安诊断共7家机构成为首批接入合作的医疗机构。记者了解到,这套方案在软件集成方面,集合了蚂蚁医疗大模型核心能力,可一键调用DeepSeek R1/ ...
法律研究公司 LexisNexis 最近推出了一款名为 Protégé 的 AI 助手,旨在为、助理和法律专员提供支持。Protégé 的主要功能是帮助用户撰写和校对法律文件,并确保引用的内容在诉状和简中是准确的。LexisNexis 希望打造一款不仅仅是通用的法律 AI 助手,而是能够学习各个法律事务所的工作流程并提供定制化服务的智能助手。在开发 Protégé 的过程中,LexisNexis 利用了 Anthropic 和 Mistral 的先进大型语言模型(LLM),并尝试找出最能满足用户需求的模型。LexisNexis 的首席技术官 Jeff Riehl 表示:“我们会根据具体的使用场景选择最佳模型,以实现最佳效果和最快的响应时间。” 在某些情况下,LexisNexis 会选择小型语言模型(SLM)或对大型模型进行蒸馏,以提高性能并降低成本。蒸馏是指让大型模型 “教” 一个较小的模型,这一方法在很多组织中越来越受欢迎。小型模型通常在聊天机器人或简单代码补全等应用中表现较好,这也正是 LexisNexis 希望在 Protégé 中实现的目标。LexisNexis 在过去已经在 ...
在 3月21日于香港湾仔会议展览中心举行的 “富途投资展” 上富途证券正式宣布接入 DeepSeek-R1,并推出了一系列升级的人工智能(AI)产品功能。这次展会以 “智能” 投资为主题,吸引了众多零售投资者的关注。富途证券创办人兼董事长李华在展会上表示,此次推出的牛牛 AI 将为投资者提供更灵活的服务。与之前单向的 “AI 个股解读” 不同,牛牛 AI 能够处理复杂的查询,成为投资者的智能助手,随时准备为用户的投资决策提供支持。当新手投资者面临海量信息时,可以通过与牛牛 AI 进行对话,快速获取精准的股票分析信息。未来,牛牛 AI 甚至能够根据用户需求,从成千上万只证券中筛选出合适的投资目标。除了牛牛 AI,富途还推出了新的 “机会” 智选投资主题页面、期权策略和程序交易等一系列新功能。针对进阶投资者,富途将提供 AI 程序交易(AI Algo Trading),帮助零售投资者以较低的成本和门槛进行量化交易,用户无需时时盯盘即可实现自动化交易。李华强调,要建立一个有价值的投资 AI 模型,必须进行高质量的后天训练。富途不仅将使用外部公开资料,还会结合自身的丰富数据资源,包括行情数据、 ...
3月13日,由中关村科金与上海市人工智能行业协会联合主办的”DeepSeek企业应用之道——2025大模型技术与应用创新城市论坛”在上海圆满落幕。论坛汇聚金融、央国企、制造、零售等领域的400余位行业领袖,现场,中关村科金总裁喻友平发布基于DeepSeek全新升级的得助大模型平台2.5、得助智能客服4.0 两大产品。上海市人工智能行业协会副秘书长党赞在开场致辞中表示,人工智能产业发展迅速,不断为包括金融在内的各个场景赋能新的突破。上海将持续立足国家战略,加快形成产业生态,在场景应用上不断形成新示范,在生态培育上更好发挥龙头企业引领带动作用。我们要做深垂类大模型应用场景,有效提升大模型技术对各个领域和行业的赋能效应。上海市人工智能行业协会副秘书长党赞中关村科金总裁喻友平在”从求索到落地,大模型迈进应用时代”主题演讲中指出,DeepSeek系列模型降低了大模型的普惠门槛,正加速推动各行各业的大模型应用落地。预计2025年逾90%企业将把大模型深度应用到核心业务中,开启“垂类竞速”模式。垂类大模型:从技术底座到业务价值的垂直穿透在人工智能产业演进图谱中,通用大模型如同具备通识能力的本科生,而 ...