曾饱受医疗文书工作困扰的英国医生艾哈迈德·克尔万,在转行成为企业家后,创立了名为 Taxo 的初创公司。该公司致力于利用人工智能技术,大幅减轻医疗保健领域长期存在的复杂管理负担。Taxo 近日宣布完成500万美元种子轮融资,由 Y Combinator、General Catalyst 和 Character Capital 联合领投,显示出投资者对这一创新解决方案的浓厚兴趣。克尔万表示,在他作为医生的职业生涯初期,繁琐的文书工作令他震惊,有时他每天仅能花费三个小时照料病人,其余时间都被保险索赔等行政事务占据。如今,市场上涌现出数十乃至数百家初创公司,竞相利用人工智能提高医疗效率,例如专注于医疗笔记的 Abridge 和 AI 助手 Ambience 等。而 Taxo 的独特之处在于其核心——人工智能“推理引擎”。图源备注:图片由AI生成,图片授权服务商Midjourney据克尔万介绍,Taxo 的“推理引擎”能够向用户透明地解释其决策过程,这对于赢得医生等专业人士的信任至关重要。他指出,随着去年底推理模型通过公开阐述逻辑而成为人工智能领域的主流趋势,Taxo 也在其系统中融入了这一技 ...
OpenAI 的当红 AI 聊天机器人 ChatGPT 本周因一项突如其来的用户趋势而成为焦点:无数用户涌入,争相生成酷似日本动画传奇工作室吉卜力作品风格的图像。这场模仿之风迅速蔓延,甚至连 OpenAI 首席执行官 Sam Altman 也在社交媒体上戏称自己变成了“吉卜力风格的 twink”。然而,这场看似无伤大雅的流行趋势很快遭遇急转弯。OpenAI 开始采取行动遏制这一现象,实施了一系列令人费解的调整,如今,用户生成吉卜力风格图像的请求经常遭到拒绝。这场病毒式的传播以及 OpenAI 混乱的应对,再次点燃了围绕版权和生成式人工智能使用的激烈争论。批评者认为,这种行为直接侵蚀了包括吉卜力工作室极具才华的动画师在内的人类艺术家和出版商的劳动成果。据 Showtime 电视台前总法律顾问、人工智能专家 Rob Rosenberg 分析,吉卜力工作室实际上可能具备对 OpenAI 采取法律行动的理由。他表示,虽然这是否构成充分的法律依据是一个“复杂的问题”,但吉卜力“可能有能力声称 OpenAI 违反了《兰哈姆法案》”,该法案为虚假广告、商标侵权和不正当竞争相关的索赔提供了法律依据。R ...
OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红,争议内容限制放宽引关注本周,OpenAI 在 ChatGPT 中推出全新图像生成器,其生成吉卜力风格图像的能力迅速走红。该生成器基于 GPT-4o,显著提升了 ChatGPT 的图片编辑、文本渲染和空间表示功能。然而,更引人注目的是 OpenAI 对内容审核政策的重大调整。新政策允许 ChatGPT 根据用户要求生成描绘公众人物、仇恨符号和种族特征的图像,这与此前严格限制争议性内容的做法大相径庭。OpenAI 模型行为负责人 Joanne Jang 表示,公司正从“全面拒绝”转向“更精准的方法”,旨在防止现实世界的伤害,并强调“在学习的同时适应”。OpenAI 此举被视为其“解除”ChatGPT 审查的更大计划的一部分,旨在让模型处理更多请求,提供多样化视角。根据新规,ChatGPT 现在可以生成和修改特朗普、马斯克等公众人物的图像。OpenAI 认为不应成为决定谁可以被生成的“仲裁者”,并为用户提供了选择退出的机制。此外,在教育或中性环境下,ChatGPT 甚至可以生成纳粹标志等“仇恨符号”,前提是不明确赞扬或支持极端主 ...
在现代社会中,心理健康问题日益受到关注,越来越多的人开始求科技的帮助。达特茅斯学院的研究人员最近开展了一项关于 AI 心理健康聊天机器人 Therabot 的试验,旨在评估其在改善心理健康方面的有效性。此次研究涉及106名被诊断为重度抑郁症、广泛性焦虑症和饮食失调症的参与者,试验为期四周。图源备注:图片由AI生成,图片授权服务商MidjourneyTherabot 与其他聊天机器人如 ChatGPT 不同,它主动与用户互动,提出情绪和情感相关的问题,鼓励用户进行回答和深入对话。研究发现,在试验结束时,参与者的症状缓解情况相当可观。特别是抑郁症患者报告平均症状减轻了51%,情绪和整体幸福感都有显著提升;而广泛性焦虑症患者的症状平均减轻31%,许多人从中度焦虑降至轻度,或甚至降至诊断阈值以下。对于饮食失调症患者,身体形象的改善则平均达到19%。研究表明,Therabot 提供的支持与传统治疗效果相当,尤其是在面对治疗资源短缺的情况下。研究团队的成员表示,尽管面对面治疗无法替代,但 AI 聊天机器人可以作为一种重要的补充,尤其是在很多人无法及时获得专业心理帮助的情况下。目前,在美国,约有16 ...
2025年3月20日,人工智能领军企业实在智能在第八次新品发布会上正式推出行业通用智能体——实在 Agent,标志着AI技术从实验室迈向产业落地的关键突破。在这场以“自主感知环境、规划路径、操作万物”为主题的科技盛典中,实在Agent通过真实场景演绎,首次验证了数字员工全流程接管复杂办公任务的可行性——从多模态指令解析、跨系统数据调用到端到端任务闭环,全程无需人工干预。重构人机协作 通用智能体的破局之战自2025年3月初Manus引发市场关注后,通用Agent正式进入技术转型深水区。支持者将其视为”智能体经济”的基石,认为将重塑生产协作范式;质疑派则认为工程化实践尚未成熟,现阶段仍属”有限场景解决方案”。当前学界将通用Agent重新界定为”具备跨模态环境感知、动态目标拆解与多工具协同执行能力的智能系统”。相较于专用Agent,通用Agent不依赖预设规则,而是通过自主感知、决策和执行,动态适应环境变化并解决多样化问题。从当前技术实现层面分析,市面智能体产品主要采用两种架构模式:端到端的集成方案或大模型外挂API接口的混合架构。这类解决方案在处理复杂任务时存在明显的效率瓶颈——多模态模型 ...
近期,IEEE国际计算机视觉与模式识别会议( Conference on Computer Vision and Pattern Recognition)CVPR 2025公布论文录用结果,社交平台Soul App技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》(《基于自回归动作生成的实时流式音频驱动人像动画系统》)被接收。Soul App团队在论文中提出了一个新的面向实时音频驱动人像动画(即Talking Head)的自回归框架,解决了视频画面生成耗时长的行业挑战外,还实现了说话时头部生成以及人体各部位运动的自然性和逼真性。此次论文的入选,也证明了Soul App在推动多模态能力构建特别是视觉层面能力突破上取得了阶段性成果。CVPR是人工智能领域最具学术影响力的顶级会议之一,是中国计算机学会(CCF)推荐的A类国际学术会议。在谷歌学术指标2024年列出的全球最有影响力的科学期刊/会议中,CVPR位列总榜第2,仅次于Na ...
通讯作者包括腾讯 AI Lab研究员宋林峰与涂兆鹏,以及厦门大学苏劲松教授。论文第一作者为厦门大学博士生王安特。本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题,并提出高效树搜索框架——Fetch。本研究由腾讯 AI Lab 与厦门大学、苏州大学研究团队合作完成。论文题目:Don’t Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls论文地址:https://arxiv.org/abs/2502.11183背景与动机近月来,OpenAI-o1 展现的卓越推理性能激发了通过推理时计算扩展(Test-Time Computation)增强大语言模型(LLMs)推理能力的研究热潮。该研究领域内,基于验证器引导的树搜索算法已成为相对成熟的技术路径。这类算法通过系统探索庞大的解空间,在复杂问题的最优解搜索方面展现出显著优势,其有效性已获得多项研究实证支持。尽管诸如集束搜索(Beam Search)、最佳优先搜索(Best-First ...
从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。想知道 AlexNet 2012 年的原始代码长什么样吗?现在,机会来了!刚刚,谷歌首席科学家 Jeff Dean 宣布,他们与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代码。开放后的代码库如下:GitHub 链接:https://github.com/computerhistory/AlexNet-Source-CodeAlexNet 是一个人工神经网络,用于识别照片内容。它由当时的多伦多大学研究生 Alex Krizhevsky 和 Ilya Sutskever 以及他们的导师 Geoffrey Hinton 于 2012 年开发。在计算机历史上,AlexNet 的出现有着划时代的意义。在它出现之前,很少有机器学习研究人员使用神经网络。但在 AlexNet 出现之后,几乎所有研究人员都会使用神经网络。从 2012 年到 2022 年,神经网络不断取得进步,包括合成可信的人类声音、击败围棋冠军选手、模拟人类语言并生成艺术作品…… 最终,OpenAI 于 ...
Roblox,这个备受青少年喜爱的在线游戏平台,正通过引入 AI 技术,进一步革新游戏的创作体验。据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox 允许用户设计自己的游戏、物品及衣服,以及游玩自己和其他开发者创建的各种不同类型的游戏。而现在,用户可以借助 AI 来完成这些创作了。近日,Roblox 发布了一个用于 3D 智能的基础模型 Cude。据介绍,Roblox 的目标是构建一个可以生成 Roblox 游戏各方面体验的 3D 智能基础模型,从生成 3D 物体和场景到人物角色,再到描述事物行为的编程脚本。 Roblox 创始人兼 CEO David Baszucki 的推文Roblox 还在 Hugging Face 上线了一个 Web 应用,也已经有不少网友分享了他们各自的生成结果。这里我们也来尝试一番。首先,让 Cude 生成一个三头六臂的男孩(a boy with 3 heads and 6 arms):这和我们常见的哪吒形态可真是相去甚远。下面再来个更加日常一 ...
近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目前任职千寻智能具身智能部负责人,全面负责具身大模型的研发工作。解浚源,本科毕业于中国科学技术大学,博士毕业于美国华盛顿大学。曾在 nips,eccv 等多个领域顶级会议发表论文,论文被引用超过一万次。他曾是知名开源项目 mxnet 的早期创立者之一和后期主要架构师,先后任职亚马逊资深科学家和字节跳动 AI 高级专家,在系统架构、机器学习算法和应用落地方面都有丰富的经验。原字节跳动 AI 大将加盟具身智能头部公司千寻智能是国内领先的具备 AI + 机器人全栈生产力级技术能力的具身智能公司,技术团队在具身大模型、机器人以及场景落地方面兼具领先性。创始人兼 CEO 韩峰涛在机器人行业拥有十余年经验。曾任珞石机器人联合创始人兼 CTO,组建了世界级水平的运控和算法研发团队。联合创始人高阳在美国加州大学伯克利分校获得博士学位,在强化学习、视觉语言模型(VLM)和机器人任务规划方面取得了多项突破性成果,其提出的 ViLa 和 CoPa 模型 ...