这份工作的魅力之一,就是能第一时间体验到最新、最前沿的大模型。当然,发布初期难免有些社死时刻,但这次,例外。就在前天深夜,OpenAI 重磅空降 o 系列模型的最新成员:o3 与 o4-mini,也是迄今为止他们最聪明的模型。人类的进化,始于制造和使用工具。o3 和 o4-mini 也是如此,他们的「聪明」源于学会了使用工具。模型能自主调用联网搜索、记忆系统、代码解释器等 ChatGPT 原生工具,实现任务闭环处理。你只需要布置任务,然后可以放心起身去倒杯咖啡——回来时,高质量结果已在屏幕上静候。而且,它们还有一个关键升级:视觉思维能力上线。不仅能看图识物,更能像刑侦人员一样,从图像中分析、推理、挖掘信息。要说差异,o3 是满血旗舰,性能拉满;o4-mini 是高性价比小钢炮( GPT-o4 的小型化版本),体积更小、价格更优,但性能不打折——尤其在数学和编程任务上,表现出乎意料的强劲。网友直呼:一周之内,它就成了我处理绝大多数任务的首选模型!写作时,我依旧用 GPT-4.5;编程时,还在用 3.7 Sonnet;但除此之外,我一直在用 o3。免费用户,每天至少有一次体验o3机会,记得 ...
编辑 | 菠菜还记得预测所有生物大分子的 AlphaFold3(AF3)吗?距离它的发布已经过去了接近一年的时间。在这一年里,有百余篇研究论文提及或引用了 AF3。它切切实实促进了生物大分子研究、药物发现、疾病研究等多个领域的发展。最近,澳门理工大学姚小军、浙江大学侯廷军团队推出了 PepPCBench,这是一个专门为评估 AF3 预测蛋白质-肽复合物能力而开发的综合基准框架。该团队使用精心挑选的数据集 PepPCSet,该数据集包含 261 个蛋白质-肽复合物,肽长度从 5 到 30 个残基不等(不包含 AF3 的训练集或验证集中的数据)。基准测试结果表明,AF3 在预测准确度和结构验证方面优于其他 PFNN。然而,其性能对于实际的肽类药物研发而言仍然不足,仍有改进空间。研究人员表示,PepPCBench 有望为增强蛋白质-肽复合物结构预测和肽类药物研发提供重要见解。该研究以「PepPCBench is a Comprehensive Benchmark for Protein-Peptide Complex Structure Prediction with AlphaFold3」 ...
在全球 AI 创新格局加速重塑之际,2025 WAIC 云帆奖已开启全球报名,期待汇聚更多有志于推动 AI 发展的青年力量。从基础理论突破到产业实践创新,从跨学科交叉到开源生态建设,我们寻找能够在通往 AGI 的征途上贡献中国智慧的青年才俊。下面,三位重量级奖项召集人向你发出诚挚邀请:WAIC 云帆奖得主赋能计划赋能计划学术影响力跃升:在 WAIC 揭晓获奖名单并颁发证书,提升获奖者国际知名度与学术影响力。为有意愿者向知名高校、科研机构推荐工作;提供与国际顶尖学术机构、学者交流合作机会,如受邀参加国际会议作汇报。百万级科研加速:联合科研机构提供重点科研项目资助内推,资助金额最高可达数百万;提供算力资源,助力突破算力瓶颈;多渠道推广研究成果,提升影响力与应用价值。产业生态赋能:组织与知名企业、科研机构对接,提供项目实践机会,推动产学研融合。为有创业意愿者提供创业培训、资金及上下游企业对接等全方位支持。2025 WAIC 云帆奖「聚智·共进」评选流程报名及推荐截止:6月16日初审:6月17日 - 6月30日终审:7月1日 - 7月10日颁奖典礼:WAIC 大会期间奖项设置璀璨明星面向 35 ...
在大规模催化剂筛选中,快速评估催化剂表面与吸附质之间的全局最低吸附能(Global Minimum Adsorption Energy, GMAE)是一项关键任务。然而,由于每种表面/吸附质组合往往对应多个吸附位点与复杂构型,传统基于密度泛函理论(DFT)的计算方法面临高昂的时间和资源成本。为应对这一挑战,来自洛桑联邦理工学院(EPFL)的 Philippe Schwaller 教授团队与上海交通大学(SJTU)贺玉莲教授团队联合提出了一种多模态 Transformer 框架 AdsMT,该研究的共同一作为陈俊武(现 EPFL 博士生)和黄旭(现 UC Berkeley 博士生)。在不依赖具体吸附位点信息的前提下,AdsMT 可高效预测 GMAE。该方法以催化剂表面的图结构和吸附质的特征向量为输入,通过引入跨模态注意力机制(cross-attention),有效捕捉吸附质与表面原子之间的复杂交互,从而避免了对所有可能吸附构型的穷举计算。该研究以「A multi-modal transformer for predicting global minimum adsorption ...
在能源AI这个高门槛赛道,中科类脑完成了一场从技术攻坚到商业变现的深度突围。单笔融资破亿,能源 AI 杀出实力派「 AI 的尽头是能源!」马斯克与 Sam Altman 的隔空对话,将能源革命与智能革命的交汇点推向全球视野。当前,这一进程正在中国加速。据统计,2024 年前三季度,能源行业大模型招标项目超 80 个,多数能源企业已建成自有模型,涵盖核电、电网、发电等多个领域。DeepSeek 爆火后,以国家电网、南方电网及五大发电集团为代表的能源央企,正加速推进 AI 融合应用。在智能化转型浪潮中,能源行业 AI 大模型全栈解决方案提供商中科类脑宣布完成亿元级 B 轮融资。此轮融资由中国移动旗下的北京中移数字新经济产业基金独家战略投资,也是该基金在 AI 模型领域的又一重要布局。此前,中科类脑已在 A 轮融资中获得合肥创新投等地方国资支持。此番「国家队」资本强势注入,不仅标志着中科类脑正式跻身「 AI 国家队」行列,更意味着其自主可控的技术体系进一步获得产业界的广泛认可。从顶天到立地,七年锚定能源赛道中科类脑成立于 2017 年,是中国科学技术大学赋权项目之一,也是类脑智能技术及应用国 ...
在日常生活中,SVG(可缩放矢量图形)被广泛应用于网页设计、图标、徽标等领域。SVG 图形因其可缩放性和清晰度,在以下场景中得到了广泛应用:网页设计:用于制作响应式图标、按钮和装饰元素,确保在不同设备上显示清晰。品牌标识:企业徽标、品牌图形等,保持高质量的视觉效果。用户界面设计:应用程序和网站的界面元素,如导航栏、菜单图标等。教育与培训材料:用于制作插图、流程图和示意图,帮助信息传达。然而,创建这些图形通常需要专业的设计技能和工具。对非专业人士而言,存在一定的门槛。因此,开发自动化的 SVG 设计与生成工具显得尤为关键。现有基于优化的方法通过优化可微分的矢量图形光栅化器,迭代地调整 SVG 参数。这些方法在生成 SVG 图标方面有效,但在处理复杂样本时计算开销较大,且生成的输出缺乏结构,存在冗余的锚点。在现有自回归 SVG 生成方法中,存在两个主要局限性:上下文窗口长度限制:由于模型只能处理有限长度的输入序列,这限制了其生成复杂 SVG 内容的能力,现有自回归方法利用 Transformer 模型或预训练的大型语言模型(LLM),直接生成表示 SVG 的 XML 参数或代码,然而复杂 ...
4 月 14 日,谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲,主题为「AI 的重要趋势:我们是如何走到今天的,我们现在能做什么,以及我们如何塑造 AI 的未来?」在这场演讲中,Jeff Dean 首先以谷歌多年来的重要研究成果为脉络,展现了 AI 近十五年来的发展轨迹,之后又分享了 Gemini 系列模型的发展历史,最后展望了 AI 将给我们这个世界带来的积极改变。机器之心将在本文中对 Jeff Dean 的演讲内容进行总结性梳理,其中尤其会关注演讲的第一部分,即谷歌过去这些年对 AI 领域做出的奠基性研究贡献。我们将看到,Transformer、蒸馏、MoE 等许多在现代大型语言模型(LLM)和多模态大模型中至关重要的技术都来自谷歌。正如 𝕏 网友 @bruce_x_offi 说的那样,你将在这里看到 AI 的进化史。下面我们就来具体看看 Jeff Dean 的分享。源地址:https://video.ethz.ch/speakers/d-infk/2025/spring/251-0100-00L.html幻灯片:https://dr ...
微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题,但在安全风险方面,MAI-DS-R1的有害内容降低了50%,展现出良好的安全控制能力。因此,渴望体验 “放飞自我” 版的用户可以尝试这一模型,探索新的可能性。在模型的训练过程中,微软收集了约350,000个被屏蔽的主题示例,并筛选出相关的查询关键词。这些关键词被转化为多个问题并翻译成不同语言,进一步提升了模型的多语言适应性。此外,微软利用 DeepSeek R1及内部模型生成了相关问题的答案和思维链。训练数据还包括来自 Tulu3SFT 数据集的110,000个安全和违规示例,确保了模型在多种情况下的有效性。经过全面评估,MAI-DS-R1在敏感话题的响应能力上表现出色,远超 DeepSeek R1及其衍生版本。在安全性评估中,MAI-DS-R1在 ...
近日,WORLDMEM框架正式在Hugging Face平台开源发布,标志着长期一致性世界模拟技术的重要突破。据AIbase了解,WORLDMEM通过引入记忆机制,解决了传统世界模拟模型在长期一致性与3D空间保持上的难题,为虚拟环境建模与交互预测提供了全新解决方案。项目现已开放源代码,供全球开发者与研究人员免费使用,引发了AI与虚拟现实领域的广泛关注。核心创新:记忆驱动的长期一致性WORLDMEM的核心在于其独特的记忆银行设计,通过存储记忆帧与状态(如姿态、时间戳)增强场景生成能力。AIbase分析,该框架的主要亮点包括: 记忆注意力机制:通过状态信息从记忆帧中提取相关内容,WORLDMEM能够精确重建先前观察的场景,即使在视角或时间跨度较大的情况下也能保持一致性。 动态世界建模:通过时间戳整合,框架不仅能模拟静态环境,还能捕捉世界的动态演变,支持长期交互与感知任务。 3D空间一致性:针对传统模型在长时序3D空间一致性上的不足,WORLDMEM显著提升了空间结构的稳定性。这些特性使WORLDMEM在虚拟环境模拟、机器人导航及游戏开发等场景中展现出巨大潜力。技术架构:模块化与高效性 ...
为了应对开发者在从商业文档中提取可靠数据方面日益增长的压力,ABBYY 于近日推出了 ABB Document AI™,该工具通过自助应用程序接口(API)提供服务。ABBYY Document AI API 的设计旨在提升开发者的使用体验,用户只需通过几行代码即可轻松将非结构化的商业文档转换为结构化的高精度数据,从而简化尝试、集成、学习和购买行业领先的光学字符识别(OCR)及智能文档处理(IDP)解决方案的过程。图源备注:图片由AI生成,图片授权服务商MidjourneyABBYY 的工程研发副总裁 Nick Hyatt 表示:“作为 OCR 领域的先锋,ABBYY 一直以来都拥有一批活跃的开发者社区,他们利用我们先进的文档 AI 创造变革性解决方案。我们正在为他们提供一种新的 API,具有最小的设置要求,提供丰富的社区资源和预训练模型,以帮助他们构建概念验证。ABBYY Document AI API 是开发自动化文档工作流程的重大进展。”根据 IDC 的预测,智能文档处理市场预计将从2023年的24亿美元增长到2028年的105亿美元,年复合增长率达到34.9%。这一增长主要得益 ...