Nous Research宣布正式推出Psyche,一个基于Solana区块链的去中心化AI训练网络,旨在让全球用户通过闲置计算资源参与尖端AI模型的开发。这一平台利用DisTrO技术大幅降低带宽需求,成功启动了有史以来规模最大的互联网分布式训练,目标是训练一个40亿参数的AI模型,并将所有数据和检查点完全开源。AIbase深入剖析Psyche的核心技术与愿景,揭示其对AI民主化的深远影响。Psyche网络:全民AI开发的突破性平台Psyche网络以去中心化为核心,打破了传统AI训练对集中式数据中心的依赖。平台通过Solana区块链协调全球分布式GPU,允许任何人贡献闲置计算资源参与模型训练。AIbase了解到,Psyche的首个重大任务是预训练一个40亿参数的Consilience模型,采用多头潜在注意力(MLA)架构,基于20万亿token的超大规模数据集(包括FineWeb14T、FineWeb-24T和The Stack v21T)。这是迄今为止互联网上最大规模的分布式AI训练,标志着去中心化AI开发的里程碑。Nous Research强调,Consilience模型在设计上兼 ...
Hugging Face推出的SmolVLM多模态模型迎来重大突破:通过WebGPU技术,SmolVLM现可在浏览器中实现实时网络摄像头图像识别,无需服务器支持,全部计算在用户设备上完成。这一创新不仅提升了隐私保护,还极大降低了AI应用的部署门槛。AIbase综合最新动态,深入解析SmolVLM的本地化实时演示及其对AI生态的影响。技术核心:WebGPU赋能本地化AI推理SmolVLM是一款超轻量多模态模型,参数规模从256M到500M,专为边缘设备优化。其最新演示利用WebGPU,一种现代浏览器GPU加速标准,让模型直接在浏览器中运行图像处理任务。AIbase了解到,用户只需访问Hugging Face提供的在线演示页面,授权摄像头后即可实时捕捉画面,SmolVLM会即时生成图像描述或回答相关问题,例如“画面里有什么?”或“这是什么物体?”。项目地址:https://huggingface.co/spaces/webml-community/smolvlm-realtime-webgpu关键在于,SmolVLM的推理过程100%本地化,无需将数据传输至云端,保障了用户隐私。AIbas ...
OpenAI在今日的线上直播中震撼发布了一款全新的云端AI编程智能体——Codex,标志着AI编程新时代的正式开启。由Greg Brockman带领的OpenAI六人团队向全球展示了这一强大工具,它能够在半小时内完成以往可能需要数天的软件工程任务,极大地提升了开发效率。Codex由新模型codex-1加持,这是OpenAI的o3模型的一个特调版本,专为软件工程量身打造。它不仅能在云端沙盒环境中安全地并行处理多项任务,还能通过与GitHub无缝集成,直接调用代码库。Codex不仅能快速构建功能模块、深入解答代码库问题、精准修复代码漏洞,还能提交PR并自动执行测试验证。这些功能在过去可能耗费开发者数小时乃至数日,如今Codex最多在30分钟内就能高效完成。Codex的运行基于OpenAI的计算基础设施,与强化学习共享同一套系统。每个任务都在独立的虚拟沙盒中运行,配备专属的文件系统、CPU、内存和网络策略,确保了高效安全。Codex不仅在preparedness仓库中表现出色,还无缝处理了CodeX CLI库,展现了其在不同项目中的泛化能力。为了确保Codex的输出高度符合人类的编码偏好与标 ...
Hugging Face再度为全球AI开发者带来惊喜,正式发布Model Context Protocol(MCP)免费在线课程。作为连接大语言模型(LLM)与外部数据和工具的标准化协议,MCP正成为AI Agent开发的核心技术。这门课程从MCP协议基础到实际开发应用,内容简洁实用,旨在让开发者快速上手,构建高效的AI上下文交互系统。AIbase深入解析这一课程亮点,揭示其对AI生态的深远意义。课程概览:从零到一掌握MCPHugging Face的MCP课程以理论与实践结合为核心,专为希望深入理解和应用MCP的开发者设计。课程涵盖以下关键内容:MCP协议构成:详解MCP的客户端-服务器架构、JSON-RPC2.0通信标准,以及提示、资源和工具等核心组件。MCP SDK/框架使用:指导开发者利用Hugging Face提供的MCP客户端(如@huggingface/mcp-client)和现有框架,快速集成MCP工具。自建MCP服务:通过Python或TypeScript示例,教授如何从零开发MCP服务器,暴露文件系统、API或其他外部资源。认证奖励:完成课程的学员 ...
在与ChatGPT或Claude等大语言模型长时间对话时,你是否也遇到过对话内容突然”失忆”的尴尬场景?这并非AI有意为之,而是受限于大语言模型固有的上下文窗口限制。无论是8k、32k还是128k tokens的容量,一旦超过这个阈值,先前的对话内容就会被截断丢失,导致交互体验严重受损。近日,一家名为Supermemory的公司推出了一项颠覆性技术——Infinite Chat API,号称能无限扩展任何大语言模型的上下文长度,让AI拥有”长期记忆”能力,且无需开发者重写任何应用逻辑。核心解密:智能代理 + 记忆系统 = 永不失忆!这项技术的核心在于其创新的智能代理架构,主要包含三个关键环节:首先是透明代理机制。Supermemory充当中间层,只需将原有OpenAI等API的请求URL更改为Supermemory的地址,系统就会自动将请求转发给相应的LLM。这意味着开发者几乎无需更改代码,就能立即获得”无限记忆”功能。其次是智能分段与检索系统。该系统会将长对话内容分成保持语义连贯性的块,并在需要时只提取与当前对话最相关的上下文片段传给大模型,而非全部历史记录,这极大提高了效 ...
MiniMax Audio推出的Speech-02系列语音模型席卷全球,强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权威榜单,力压ElevenLabs、OpenAI等国际顶尖竞争对手。这款模型以超高语音逼真度和多语言支持惊艳业界,成为AI语音技术的全新标杆。AIbase综合最新动态,深入解析Speech-02的技术亮点及其对行业的深远影响。双榜夺冠:客观与主观兼优Speech-02系列包括Speech-02-HD和Speech-02-Turbo两款模型,分别针对高保真和实时应用场景优化。在Artificial Analysis Speech Arena的ELO评分中,Speech-02-HD以卓越的语音质量位列全球第一,Speech-02-Turbo紧随其后排名第三。Hugging Face TTS Arena的盲测结果同样显示,Speech-02在用户主观听感上超越了ElevenLabs和OpenAI的最新模型,赢得社区一致好评。AIbase分析,语音作为兼具客观与主观属性的模态,其评估需结合量化指标和盲测 ...
AI应用时代以智能体(Agent)为应用核心,以多智能体协同(InterAgent,or IA)为技术核心,大规模智能体协同是构建具备商业价值的智能体经济的必经之路。目前市面上一般将这种多智能体集群称之为Swarms,词义指大规模昆虫或人成群移动,而我们更偏向用另外一个术语来表述——“Legion”。2017年漫威推出了一部名为“Legion”的超英剧,描述了一位能将多重人格幻化成超能实体并协同作战的超级英雄,中文翻译剧名时使用了一个有些抽象却也异常贴切的名字——“大群”。“Legion”一词本身带有浓厚的宗教色彩,其词源一说来自《圣经》:《马可福音》五章9节耶稣询问被异鬼附身之人名讳,答曰“我名为群,因为我们众多(Legion is my name, because we are many)”。后古罗马也使用Legion描述自己的军队:人数众多、目标一致、纪律严明、行动力强。如今AI时代智能体已成异军突起之势,如何将大规模Agent编排成军,将成为能否在新时代商业战场上取得成功的关键。Legion基础层:身份、协议与数据的三元支柱1. Agent数字身份:智能体可信交互的基石。智能体 ...
人工智能领域的先锋企业Manus于宣布推出其全新图像生成Agent,进一步扩展其作为全球首个人工智能通用代理的强大功能。这一创新工具不仅能够生成高质量图像,还能理解用户意图、规划解决方案,并结合多种工具完成复杂任务。AIbase通过整合社交媒体最新动态及官方信息,为您深度解析这一技术突破的意义与潜力。技术核心:智能规划与多工具协同与传统图像生成工具不同,Manus图像生成Agent的核心在于其智能任务执行能力。用户只需提供高层次的目标或描述,例如“为新产品设计营销海报”或“创建科幻风格的游戏场景图”,Agent便会自动分析需求,制定执行计划,并调用图像生成模型及其他必要工具(如文本生成或代码编写)以完成任务。官方表示,这一功能依托Manus的多代理架构,通过专项子代理协同工作,确保输出结果精准契合用户意图。社交媒体反馈显示,创作者对这一功能的自主性和多模态整合能力印象深刻。相较于仅基于单一提示生成图像的传统AI工具,Manus的Agent能够“像人类一样思考和执行”,显著提升了创作效率与灵活性。广泛应用:从创意设计到商业赋能Manus图像生成Agent的推出为多个行业带来了全新可能性。 ...
苹果正式推出其新一代车载系统CarPlay Ultra,以深度整合iPhone与汽车所有显示屏为核心,首次将ChatGPT融入驾驶体验。这款系统不仅覆盖中央触摸屏,还全面接管数字仪表盘,提供统一的苹果设计语言和前所未有的驾驶交互。AIbase综合最新信息,深入解析CarPlay Ultra的技术突破及其对智能驾驶的深远影响。全屏整合:仪表盘与中控的苹果化体验CarPlay Ultra的核心在于其全屏覆盖能力,将iPhone生态无缝扩展至汽车的每个屏幕,包括中央触摸屏和数字仪表盘。AIbase了解到,系统支持动态显示速度表、转速表、油量表、温度表等关键仪表信息,采用苹果标志性的精美UI设计,确保视觉一致性。用户可通过仪表盘全屏运行Apple Maps,获得直观的导航指引,减少视线转移,提升驾驶安全性。与传统CarPlay相比,CarPlay Ultra通过深度整合,允许用户在不离开苹果界面的情况下,查看iPhone应用(如Apple Music、播客)和车辆数据(如胎压、高级驾驶辅助系统)。AIbase测试显示,系统在Aston Martin DBX707上的10.25英寸中控屏和仪表盘 ...
Windsurf(原Codeium)正式发布其首款自主研发的AI模型家族——SWE-1系列,包括SWE-1、SWE-1-lite和SWE-1-mini。这一系列模型不仅针对代码生成进行了优化,还首次聚焦整个软件工程生命周期,覆盖从编码、调试到终端操作和多工具协作的全流程。AIbase综合最新信息,深入解析SWE-1系列的技术突破及其对AI开发生态的深远影响。SWE-1系列:软件工程全流程的AI助手与传统AI编码模型不同,SWE-1系列以软件工程全流程优化为核心目标,旨在加速开发效率高达99%。据Windsurf官方介绍,该系列通过独特的流感知(Flow Awareness)设计,解决了现有模型在处理复杂、多界面、长周期任务时的局限性。AIbase了解到,SWE-1系列能够无缝切换于终端、IDE和浏览器等开发环境,理解不完整的工作状态,并支持跨工具协作。SWE-1系列包含三种模型,满足不同用户需求:SWE-1:旗舰模型,具备高级推理和工具使用能力,性能接近Claude3.5Sonnet,专为付费用户提供无限使用。SWE-1-lite:替换原有Cascade Base的轻量高效模型,免费和 ...