在最近的一期《乔・罗根体验》播客中,Meta 首席执行官马克・扎克伯格透露,公司计划在今年推出一种能够充当 “中级工程师” 的人工智能模型。他表示,Meta 和其他许多科技公司正在努力研发这一技术,预计到2025年,这种 AI 将能够编写代码并承担中级工程师的职能。图源备注:图片由AI生成,图片授权服务商Midjourney扎克伯格指出,当前的 AI 技术尚处于发展阶段,初期投入会比较昂贵,但随着技术的进步,AI 的运行效率将不断提高,最终将取代人类工程师在 Meta 及其他应用程序中的编程工作。他强调,这一过程并不意味着人类工程师会被完全取代,而是他们的工作会被 AI 技术所增强,帮助人类工程师解放出来,去做更加创新和富有创造力的工作。当被问及 AI 是否会导致工作岗位的减少时,扎克伯格没有给出直接的回答,而是引入了工业化的比喻,强调随着社会的进步,工作性质会不断变化,人们将不再只是农民。这种 AI 编程模型的推出符合当前科技行业的趋势,许多公司正在探索开发具有一定自主性的 AI 代理,以便它们能够独立完成复杂任务,成为一种 “虚拟员工”。扎克伯格提到,Meta 并不是唯一在推动 A ...
随着人工智能的快速发展,AI 芯片制造商的投资热潮也逐渐升温。其中,Blaize 公司引起了市场的广泛关注。这家由前 Intel 工程师创立的公司宣布,将于2025年1月14日在纳斯达克通过 SPAC(特殊目的收购公司)上市。Blaize 成立于2011年,总部位于加利福尼亚州的埃尔多拉多山,至今已经获得了3.35亿美元的投资,主要来自于三星和梅赛德斯 - 奔驰等知名企业。与主要应用于大型数据中心的 Nvidia 不同,Blaize 专注于为边缘应用制造 AI 芯片。这些芯片主要被集成到智能产品中,例如安全摄像头、无人机和工业机器人,旨在满足低功耗、低延迟和成本效益的需求。Blaize 首席执行官迪纳卡尔・穆纳加拉(Dinakar Munagala)在接受《TechCrunch》采访时表示,AI 驱动的边缘计算将成为未来的趋势,因为它在数据隐私方面也有优势。尽管 Blaize 在庞大的 AI 芯片市场中仍然是个小玩家,2023年公司的收入仅为380万美元,却亏损了8750万美元,但穆纳加拉指出,芯片制造商需要大量的资本投入来建设生产能力,才能在未来实现规模化。目前,Blaize 手中还 ...
在全球科技行业快速发展的背景下,Snowflake(NYSE: SNOW)宣布推出 “百万思想与一个平台” 计划,目标是在2027年前为超过10万人提供免费的 Snowflake AI 数据云培训与认证,并计划到2029年帮助一百万人的数据和 AI 技能提升。该计划将获得 Snowflake2000万美元的投资,旨在为高增长和新兴市场的学生与职场人士提供全面的培训资源与认证课程。根据2024年 Gallup 的一项调查,22% 的职场人士担心技术进步(如生成式 AI)会使他们的工作变得过时。同时,72% 的财富500强公司人力资源主管预计,在未来三年内,AI 将取代他们公司的一部分工作岗位。为了在竞争激烈的就业市场中立于不败之地,员工们必须不断提升自己的技能,尤其是在最新科技方面。Snowflake 的首席执行官 Sridhar Ramaswamy 表示:“在数字化时代,每位员工都必须具备能在数据和 AI 为中心的世界中贡献的技能。” 他强调,AI 的可接触性和用户对其在数据生命周期中如何运作的理解是成功的关键。“百万思想与一个平台” 计划的两个主要组成部分包括: 1.学术支持:Sn ...
AI 图像生成技术正在飞速发展,但模型体积越来越大,对普通用户来说,训练和使用成本都非常高。现在,一种名为 “Sana” 的新型文本到图像框架横空出世,它能够高效生成高达4096×4096分辨率的超高清图像,而且速度惊人,甚至可以在笔记本电脑的 GPU 上运行。Sana 的核心设计包括:深度压缩自编码器:与传统自编码器仅压缩图像8倍不同,Sana 使用的自编码器可以将图像压缩32倍,从而有效地减少了潜在的 tokens 数量。这对于高效训练和生成超高分辨率图像至关重要。线性 DiT:Sana 用线性注意力取代了 DiT 中的所有传统注意力机制,这在不牺牲质量的前提下,提高了高分辨率图像的处理效率。线性注意力将计算复杂度从 O(N²) 降低到 O(N)。此外,Sana 还采用了 Mix-FFN,将3x3深度卷积整合到 MLP 中,以聚合 tokens 的局部信息,并且不再需要位置编码。解码器式文本编码器:Sana 使用了最新的解码器式小型 LLM(如 Gemma)作为文本编码器,替代了以往常用的 CLIP 或 T5。这种方式增强了模型对用户提示的理解和推理能力,并通过复杂的人工指令和上下 ...
MiniMax于2025年1月15日宣布开源其全新系列模型MiniMax-01,该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01系列在架构上进行了大胆创新,首次大规模实现线性注意力机制,打破了传统Transformer架构的局限。其参数量高达4560亿,单次激活459亿,综合性能与海外顶尖模型相当,且能高效处理长达400万token的上下文,这一长度是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。MiniMax认为2025年将是Agent高速发展的关键年份,无论是单Agent系统还是多Agent系统,都需要更长的上下文来支持持续记忆和大量通信。MiniMax-01系列模型的推出,正是为了满足这一需求,迈出建立复杂Agent基础能力的第一步。得益于架构创新、效率优化以及集群训推一体设计,MiniMax能够以业内最低的价格区间提供文本和多模态理解的API服务,标准定价为输入token1元/百万token,输出token8元/百万token。MiniMax开放平台及海外版已上线,供 ...
近期,纽约大学的研究团队发表了一项研究,揭示了大规模语言模型(LLM)在数据训练中的脆弱性。他们发现,即使是极少量的虚假信息,只需占训练数据的0.001%,就能导致整个模型出现重大错误。这一发现对于医疗领域尤其引人关注,因为错误的信息可能直接影响患者的安全。图源备注:图片由AI生成,图片授权服务商Midjourney研究人员在《自然医学》杂志上发表的论文中指出,虽然 LLM 表现出色,但如果其训练数据中被注入了虚假信息,这些模型依然可能在一些开放源代码的评估基准上表现得与未受影响的模型一样好。这意味着,在常规测试下,我们可能无法察觉到这些模型潜在的风险。为了验证这一点,研究团队对一个名为 “The Pile” 的训练数据集进行了实验,他们在其中故意加入了150,000篇 AI 生成的医疗虚假文章。仅用24小时,他们就生成了这些内容,研究表明,给数据集替换0.001% 的内容,即使是一个小小的1百万个训练标记,也能导致有害内容增加4.8%。这个过程的成本极其低廉,仅花费了5美元。这种数据中毒攻击不需要直接接触模型的权重,而是攻击者只需在网络上发布有害信息,就能削弱 LLM 的有效性。研究 ...
随着英国政府重申其成为 AI 超级大国的愿景,美国数据中心运营商 CoreWeave 宣布在英国新建两座 GPU 数据中心。这两座数据中心分别位于克劳利和伦敦码头,均与数字房地产公司 Digital Realty 和 Global Switch 合作开发。此次投资总额达到10亿英镑(约合12亿美元),标志着 CoreWeave 在英国市场的进一步拓展。图源备注:图片由AI生成,图片授权服务商MidjourneyCoreWeave 的首席商务官迈克・马塔科拉表示:“英国是 CoreWeave 的重要市场,我们在这里设立了欧洲总部,并计划在未来进一步扩展业务。我们很高兴能与 Digital Realty 和 Global Switch 合作,为英国提供下一代 AI 基础设施。” 然而,尽管有新设施落成,令人期待的 Nvidia 最新芯片尚未投入使用。这些新数据中心配备的是基于 Nvidia 较旧 Hopper 架构的 H200加速器,而 Nvidia 最新的 Blackwell 芯片预计要到2024年第四季度才能上市。H200是 Nvidia 在 Hopper 代中最先进的 GPU 之一, ...
阿联酋穆罕默德・本・扎耶德人工智能大学(MBZUAI)近日发布了一款名为 LlamaV-o1的先进人工智能模型,能够高效解决复杂的文本和图像推理任务。这一模型通过结合前沿的课程学习和先进的优化技术,如波束搜索(Beam Search),在多模态人工智能系统中树立了新的基准,特别是在逐步推理的透明性和效率方面。LlamaV-o1的研究团队表示,推理是解决复杂多步骤问题的基本能力,尤其是在需要逐步理解的视觉情境中。经过特别调校,该模型在许多领域中表现出色,例如分析财务图表和医学影像。与此同时,研究团队还推出了 VRC-Bench,这是一个专门评估人工智能模型逐步推理能力的基准测试,包括超过1000个样本和4000多个推理步骤,成为多模态人工智能研究的重要工具。在推理方面,LlamaV-o1在 VRC-Bench 基准测试中超越了竞争对手,如 Claude3.5Sonnet 和 Gemini1.5Flash。该模型不仅能够提供逐步的解释,而且在复杂视觉任务中表现卓越。在训练过程中,研究团队使用了一个针对推理任务优化的数据集 LLaVA-CoT-100k,测试结果显示 LlamaV-o1的推理 ...
在人工智能(AI)监管方面,英国政府表示希望采取独立的立场,计划与其主要西方同行(如欧盟和美国)采取不同的做法。英国 AI 与数字政府部长费里亚尔・克拉克(Feryal Clark)在接受 CNBC 采访时强调,英国必须 “做自己的事情”,确保在 AI 模型的安全性方面,早期就进行必要的监管。图源备注:图片由AI生成,图片授权服务商Midjourney克拉克提到,英国政府已经与一些 AI 公司(如 OpenAI 和 Google DeepMind)建立了良好的关系,这些公司自愿向政府开放其模型进行安全性测试。她表示:“在模型开发的初期,就要将安全性融入其中,因此我们将与行业共同努力制定相关的安全措施。”这一观点得到了英国首相基尔・斯塔默(Keir Starmer)的支持,他指出,脱欧后,英国在监管方面拥有更多的自由,可以选择最适合自己的监管模式。斯塔默表示,虽然世界各地存在不同的监管模式,包括欧盟和美国的做法,但英国可以选择最符合自身利益的方法。迄今为止,英国尚未正式推出针对 AI 的法律,而是依靠各个监管机构依据现有规则进行管理。这与欧盟形成鲜明对比,后者已推出了全面的 AI 法案, ...
Adobe宣布推出一款全新的AI工具——Adobe Firefly Bulk Create,旨在简化企业创意人员的图像编辑任务。该工具与Adobe Firefly Services API套件紧密集成,可以通过Web应用程序批量编辑多张照片,极大提升创意团队的工作效率。Bulk Create的亮点之一是无需下载桌面应用程序或获取Photoshop许可,企业只需为Adobe Firefly服务付费,即可通过Web平台访问该工具。当前版本的Bulk Create支持两项基本功能:背景更改和图像大小调整。用户可以通过Firefly模型一次性删除或替换所有上传照片的背景,并生成新的背景上传至平台。同时,Bulk Create还提供了针对Instagram和Facebook等流行社交媒体平台的预设尺寸,帮助用户轻松调整图像大小。此外,Bulk Create还具备品牌定制功能,用户可以根据品牌偏好调整图像外观,使其更加符合公司形象。尽管该平台目前仍处于私人测试阶段,Adobe预计将于今年第一季度全面上线。Adobe Firefly GenAI企业版产品副总裁Hannah Elsakr在接受Vent ...