今天凌晨,国际计算机学会(ACM)宣布了今年的 ACM 计算突破奖获奖者。丛京生(Jason Cong)「因其在现场可编程系统和可定制计算的设计和自动化方面做出的奠基性贡献而获奖」。ACM 计算突破奖,全名为 ACM Charles P. “Chuck” Thacker Breakthrough in Computing Award(ACM 查尔斯・帕特里克・萨克尔计算机突破奖),旨在表彰那些对计算理念或技术做出惊人、颠覆性或跨越式贡献的个人或团体。该奖项还附带由微软资助的 10 万美元奖金。微软首席科学官 Eric Horvitz 表示:「丛京生在可定制计算和架构设计工具方面的开创性方法,体现了该奖项旨在表彰的『跨越式进步』。他的工作至今仍至关重要,为高度灵活且节能的 FPGA 架构奠定了基础,而这对于人工智能、云计算和其他快速发展领域的前沿应用而言都非常重要。」丛京生对 FPGA 发展贡献巨大丛京生,1963 年 2 月 20 日出生于北京市。于 1985 年从北京大学计算机科学与技术系毕业,之后赴美国留学;并于 1987 年和 1990 年分别获得美国伊利诺大学香宾校区计算机科学 ...
随着生成式AI快速发展,技术的滥用也带来了无处不在的深度伪造(Deepfake)风险内容,给社会与个人带来严重危害。构建安全可靠的Deepfake风险内容检测与防御技术体系已刻不容缓。 为应对AI伪造技术带来的新型安全挑战,近日,全球人工智能顶会IJCAI 2025“深度伪造检测、定位、可解释性”学术研讨会暨挑战赛”正式启动报名。研讨会将汇聚全球顶尖学者及产业人士,共同攻克多模态伪造、弱监督伪造定位、伪造可解释性、生成式AI对抗与防御等核心技术挑战,同时,挑战赛还提供超180万数据集,针对AI欺诈风险进行攻防实战演练,助力AI安全研究。研讨会与挑战赛由蚂蚁数科主办,新加坡科技研究局人工智能前沿研究中心,南洋理工大学,清华大学,中科院自动化所,合肥工业大学,安徽省数字安全重点实验室,罗切斯特大学,布法罗大学,坎皮纳斯大学等多家机构联合举办。挑战赛分设图片赛道和音视频赛道,通过“以赛促防”的方式,弥补现有检测算法在精准定位伪造区域与多模态音视频协同伪造识别方面的不足,提升AI时代内容安全水位。值得一提的是,面向挑战赛,蚂蚁数科开放了超过180万伪造样本的多模态深度伪造数据集,共涵盖88种伪 ...
刚刚,alphaXiv 推出了新功能「Deep Research for arXiv」,该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读,显著提升文献检索及研究效率。体验链接:https://www.alphaxiv.org/assistant在官方演示视频中,当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时,系统迅速生成了一篇内容完整、结构清晰的文献综述,并提供了 arXiv 链接。随后,用户询问「What are the latest breakthroughs in RL fine-tuning for LLMs?」,系统立即生成了包含当前热门论文的详细回答,将原本可能需要数小时的文献搜索过程缩短至几秒钟。该功能在 X 上引发了热烈讨论,有用户迅速试用并送出大大的点赞。上手实测一下,输入「图文大模型的最新研究进展」,可以看到,系统给出了最新的 arXiv 论文链接。此前,alphaXiv 还推出过自动为 arX ...
据 AIbase 最新消息,谷歌母公司 Alphabet 在近期财报电话会议及公开声明中再次确认,公司将坚持其在2025年高达750亿美元的资本支出计划。此举明确了谷歌持续投入基础设施建设,尤其是在人工智能(AI)领域保持领先地位的决心。巨额投入聚焦 AI 算力作为全球科技巨头,谷歌的资本支出计划一直备受业界关注。AIbase 分析指出,此次重申的750亿美元巨额投入中,相当一部分将用于构建和升级其数据中心基础设施,特别是用于支持日益增长的 AI 模型训练和推理所需的强大算力。这包括采购最新的高性能计算芯片,例如其自研的 TPU(张量处理单元)以及来自英伟达等供应商的先进 GPU。应对 AI 时代的需求增长AIbase 编辑观察到,谷歌此次大手笔投入正值全球 AI 技术蓬勃发展之际。无论是其 Gemini 系列大模型的持续迭代,还是在搜索、广告、云服务等核心产品中集成 AI 功能,都对底层的计算能力提出了前所未有的需求。通过增加资本支出,谷歌旨在确保其能够满足这些需求,并保持在 AI 领域的竞争优势。与竞争对手的战略对比AIbase 认为,谷歌的积极投入也反映了其与微软、亚马逊等竞争 ...
根据最新的市场研究报告,工业机器人市场预计将在2035年前达到2911亿美元,较当前市场价值551亿美元大幅增长。报告指出,推动这一增长的主要因素包括自动化、人工智能的进步以及工业4.0的崛起。汽车和电子行业将占据全球市场的主要份额,东亚地区则被视为这一领域的特别增长点,目前该地区已经占据了市场份额的三分之二。随着全球劳动短缺的加剧和消费者对快速、高效产品交付的需求上升,越来越多的企业开始借助自动化工具,尤其是工业机器人,来优化其运营流程。其中,协作机器人(cobots)受到特别青睐,这类机器人配备了先进的安全功能,能够与人类员工并肩工作。此外,报告还提到,对灵活可定制机器人解决方案的需求也在不断上升,这些解决方案能够根据具体的生产和加工需求进行调整。AI 驱动的机器人被认为具有变革性的潜力,能够实现预测分析、实时决策和自适应学习。通过整合 AI,机器人可以处理和分析大量数据,识别模式并做出自主决策,从而改善工作流程。这些功能在高科技行业(如电子、制药和航空航天)中尤为重要,因为这些行业对精度的要求极高。“工业机器人的快速发展正在改变自动化领域,使企业能够实现更高的效率、精确度和适应性 ...
近日,AI代码生成领域掀起了一波开源热潮,多款重量级模型接连亮相,其中Deep Cogito推出的Cogito v1Preview系列尤为引人注目。据AIbase了解,这一全新开源模型家族涵盖3B、8B、14B、32B和70B等多种规格,不仅在性能上全面超越同级别竞争者,其70B版本更是力压Meta最新发布的Llama4109B MoE模型,成为业界热议的焦点。这一系列模型的发布,不仅为开发者提供了强大的编程利器,也预示着AI技术在编码领域的全新突破。多规格覆盖,性能领跑行业Cogito v1Preview系列提供了从3亿到70亿参数的多种选择,满足不同场景下的开发需求。其中,70亿参数版本在多项基准测试中表现出色,超越了近期发布的Llama4109B MoE模型,尤其在代码生成、复杂推理和多任务处理方面展现了显著优势。AIbase分析认为,这一性能飞跃得益于Cogito团队在模型架构和训练策略上的创新优化,使其在开源模型中脱颖而出。专为编码优化,双模运行加持与传统语言模型不同,Cogito v1Preview系列针对编码任务进行了深度优化,支持函数调用和AI代理(Agents)用例, ...
2025年4月9日,谷歌正式宣布推出 Vertex AI Media Studio 文生视频套件,这一全新平台旨在通过人工智能技术大幅简化视频内容创作流程,为用户提供从文本到完整视频的一站式解决方案。这一消息迅速引起了科技圈和内容创作者的广泛关注。全流程自动化生成视频内容Vertex AI Media Studio 整合了谷歌的多项尖端 AI 模型,包括 Imagen3图像生成、Veo2视频制作、Chirp 语音合成以及 Lyria 背景音乐生成技术。用户只需输入简单的文本指令,平台便能自动完成画面渲染、旁白配音和背景音乐的制作,甚至无需任何编码或剪辑经验。这一套件在 Google Cloud 的 Vertex AI 平台上运行,旨在让视频创作变得更加高效和普惠。据介绍,该平台采用模块化设计,Veo2模型负责将静态图像动态化,并支持用户调整镜头运动和视频时长。此外,Veo2内置的智能修正工具还能自动优化生成内容,剔除不理想的元素,确保输出质量。这一功能的推出被认为是对传统视频制作流程的颠覆性革新。面向广泛用户群体的实用工具谷歌表示,Vertex AI Media Studio 的目标不 ...
近日,字节跳动豆包大模型团队宣布开源Multi-SWE-bench,这是业内首个多语言代码修复基准数据集,为大模型“自动修Bug”能力的评估与提升带来新突破。在大模型技术快速发展的当下,代码生成任务成为检验模型智能的关键领域。以SWE-bench为代表的代码修复基准,虽能衡量模型的编程智能,但存在明显局限。其仅聚焦Python语言,无法评估模型跨语言泛化能力;且任务难度有限,难以覆盖复杂开发场景,制约了大模型代码智能的进一步发展。面向不同模型代码能力评测分数Multi-SWE-bench应运而生,它在SWE-bench基础上实现重大跨越,首次覆盖Java、TypeScript、C、C++、Go、Rust和JavaScript等7种主流编程语言,构建了1632个源于真实开源仓库的修复任务。这些任务经过严格筛选与人工验证,确保质量可靠。同时,Multi-SWE-bench引入难度分级机制,分为简单、中等、困难三类,能更全面评估模型在不同能力层次的表现。基于该数据集的实验显示,当前大语言模型在Python修复上表现尚可,但处理其他语言时平均修复率不足10%,凸显多语言代码修复仍是大模型面临的 ...
近日,复旦大学与国内AI创新企业阶跃星辰宣布即将推出一款名为OmniSVG的端到端多模态SVG生成模型,这一消息迅速引发了科技与设计领域的广泛关注。据AIbase了解,OmniSVG以其强大的生成能力为核心,支持从简单图标到复杂动漫角色的矢量图生成,为数字艺术创作提供了全新的智能解决方案。这一模型的问世,或将重新定义矢量图生成的技术边界。多模态生成:灵活应对多样需求OmniSVG的最大亮点在于其支持三种生成模式:通过文字描述生成SVG图像、将图片转化为矢量图,以及基于角色参考生成个性化SVG内容。无论是快速生成品牌标志,还是将手绘动漫角色转为矢量格式,OmniSVG都能轻松胜任。这种多模态输入的支持,不仅满足了设计师和创作者的多样化需求,也为SVG生成技术开辟了更广阔的应用场景。技术突破:解耦结构与几何据AIbase分析,OmniSVG的技术创新在于其独特的模型架构。该模型基于预训练的Qwen-VL视觉-语言模型,并结合专门设计的SVG分词器,将SVG命令和坐标参数化为离散的标记。这一设计成功将结构逻辑与底层几何图形解耦,从而大幅提升了训练和生成的效率。相较于传统方法,OmniSVG在 ...
近日,IBM 正式发布了其最新款主机 ——IBM z17。这款主机搭载了最新的 IBM Telum II 处理器,经过五年的研究与开发,z17在硬件、软件和系统操作方面都具备了出色的 AI 能力。IBM 表示,z17的设计宗旨是 “重塑大规模 AI 运算”。尽管许多人将主机视为过去计算时代的产物,但它们仍然在大型企业中发挥着至关重要的作用,处理海量数据。全球众多行业,包括银行、保险、零售和电信,依然在使用 IBM 主机,以满足其复杂的数据处理需求。z17主机在设计上明确聚焦于 AI 功能。根据 IBM 的介绍,z17每天能处理比前一代 z16多出50% 的 AI 推理操作。这款主机支持超过250种应用场景,例如管理聊天机器人和降低贷款风险。z17处理器的一些主要 AI 工具包括:- ** 更强的推理能力 **:z17具有更高的运行频率、计算能力以及40% 的缓存增长,这使其每天能够进行超过4500亿次推理操作,且响应时间仅为一毫秒。- ** 加速计算 **:IBM Spyre™加速器将在2025年第四季度推出,进一步提升 Telum II 处理器的计算能力,允许主机运行生成式特性,例如 ...