一周AI丨斯坦福报告中美模型性能持平；GPT-4.1或下周发布；Claude推Max订阅计划；本源悟空运行十亿级微调大模型……_会展服务

当前位置：首页 > 会展服务

会展服务

一周AI丨斯坦福报告中美模型性能持平；GPT-4.1或下周发布；Claude推Max订阅计划；本源悟空运行十亿级微调大模型……

发布日期：2025-04-11 来源：世界人工智能大会

要闻列表

AI万象

李飞飞团队AI报告：中美顶级模型性能逼近，阿里模型贡献度跃居全球第三

字节跳动即梦AI作品著作权获登记

大平台动作

ChatGPT记忆力升级解锁完整记忆，下周或发布新模型GPT-4.1

Anthropic推出Claude Max订阅计划，月费最高200美元

谷歌推出AI智能体交互协议Agent2Agent，实现智能体间自由“对话”

亚马逊推出AI语音模型Nova Sonic：价格比GPT-4o便宜80%

英伟达开源Llama Nemotron-253B推理模型

中国自主量子计算机“本源悟空”全球首次运行十亿级AI微调大模型

投融资风向

a16z拟募资200亿美元基金，重点投向人工智能领域

量子初创公司SandboxAQ宣布获得4.5亿美元E轮融资

01、李飞飞团队AI报告：中美顶级模型性能逼近，阿里模型贡献度跃居全球第三

AI万象

4月10日，李飞飞领衔的斯坦福大学人工智能研究所近日发布了最新一期《2025年人工智能指数报告》。

自2017年起，斯坦福大学人工智能研究所开始连续8年推出《人工智能指数报告》，报告由李飞飞等著名AI科学家组成专家组进行调查研究，对人工智能技术进步、经济影响和社会影响提供严谨客观的分析，是业界公认的AI领域最客观的权威报告之一。

斯坦福报告认为，中国和美国是全球AI最具影响力的两大国家，且中美模型的性能差距显著缩小，性能表现由2023年的17.5%骤降至0.3%，差距接近抹平。报告进一步指出，在2024年全球61个重要AI大模型中，谷歌、OpenAI和阿里三家企业分别入选7个、7个和6个，模型贡献度位列全球第三。阿里也是入选重要模型最多的中国科技公司。而在斯坦福报告评选的32项2024年最具代表性的模型、数据集和功能发布中，千问Qwen2、Qwen2.5及DeepSeek-V3入选。

2023年至今，阿里通义实验室已开源200多款模型。目前千问在全世界的衍生模型数破10万，超越美国Llama成为世界第一开源大模型。

新闻拓展：https://mp.weixin.qq.com/s/dkVOusi1Gfm1VnffNMZw-Q

02、字节跳动即梦AI作品著作权获登记

AI万象

4月7日，天眼查知识产权信息显示，近日，北京字跳网络技术有限公司登记“即梦AI/Dreamina AI”作品著作权，作品类别为美术。

登记作品著作权是指著作权有关当事人依法向登记机关申请，将作品及其权刊登载于登记簿的行为。这并非国内公司首次为其AI产品登记作品著作权。此前，腾讯科技（深圳）有限公司登记“腾讯广告AI”作品著作权，作品类别为美术。

人工智能生成作品的著作权问题一直以来都存在争议。2020年，人工智能写作领域第一案——腾讯公司状告“网贷之家”宣判：AI生成作品属于著作权法保护范围。判决书显示：“涉案文章由原告主创团队人员运用Dreamwriter软件生成，其外在表现符合文字作品的形式要求，其表现的内容体现出对当日上午相关股市信息、数据的选择、分析、判断，文章结构合理、表达逻辑清晰，具有一定的独创性”。

另一个争议点在于，平台登记AI作品著作权后，用户对于使用该软件生成的作品是否具有知识产权以及是否可以商用。此前腾讯元宝、讯飞输入法等AI就曾因将用户的输入、输出的内容权利归于自己而引发争议。

公开资料显示，即梦AI是一款为创意爱好者打造的AI表达平台，具有AI图片创作、视频创作、探索创意世界等功能。

新闻拓展：http://www.jjckb.cn/20250407/9684d17081c34c32a13b016a841a5864/c.html

03、ChatGPT记忆力升级解锁完整记忆，下周或发布新模型GPT-4.1

大平台动作

4月10日，OpenAI首席执行官山姆・奥尔特曼在X平台上暗示将推出一项“令人兴奋”的新功能，这一新功能目前已经揭晓——全面升级的记忆功能。

据介绍，从今天开始，ChatGPT将能够参考用户所有的历史对话内容，提供更加个性化的服务体验，比如在写作、建议、学习等方面，能给出贴合用户喜好的回答。官方演示案例显示，用户可以要求ChatGPT回顾特定时间段内的对话内容，比如询问“这个周末我们谈了什么”，它能回复具体事项，并支持进一步追问。

早在去年9月，ChatGPT就已全量推送记忆功能，并将其扩展到GPTs功能。而此次升级后，新的对话将在已保存的记忆信息上自然延伸，交互更加流畅，更符合用户个人风格。用户可以随时在设置中选择关闭聊天记录引用，或完全关闭记忆功能。如需修改ChatGPT对自己的了解，用户只需在对话中直接提出。此外，“临时聊天”模式也能避免影响它的“记忆”。

此外，科技媒体The Verge报道称OpenAI公司计划下周发布GPT-4.1系列、o3系列在内的多款AI模型。

GPT-4.1模型是去年GPT-4o模型的升级版，是一款多模态模型。GPT-4o支持实时处理音频、视觉和文本，而GPT-4.1将进一步提升这些功能，展现更强大的多模态推理能力。OpenAI还计划同时推出更轻量级的GPT-4.1 mini和nano版本，以满足不同应用场景的需求。

除了GPT-4.1系列，OpenAI还在开发满血版o3推理模型和o4mini模型。AI工程师Tibor Blaho在ChatGPT网页版代码中发现了o3、o4 mini和o4 mini high的引用，表明这些模型的发布已进入最后阶段。

o3和o4 mini原定于下周亮相，但OpenAI可能因内部调整而改变计划。

新闻拓展：https://mp.weixin.qq.com/s/NLixAJp8bfUsPgNPUMAaJw

04、Anthropic推出Claude Max订阅计划，月费最高200美元

大平台动作

4月10日，Anthropic宣布推出其AI聊天机器人Claude的全新订阅计划——Max，这被视为对OpenAI ChatGPT Pro每月200美元订阅计划的有力回应。Max计划相较于Anthropic自家每月20美元的Claude Pro订阅，使用限制更为宽松，同时用户还能优先获取公司最新的AI模型与功能。

Max计划存在两种不同定价与使用限制的版本。一种是每月100美元的Max层级，其速率限制比Claude Pro高出5倍；另一种则是每月200美元的Max层级，速率限制更是高达Claude Pro的20倍。

当下，前沿AI模型开发者都在积极探寻新的增收途径，向高端用户提供高价AI订阅服务似乎是一条颇具潜力的道路。OpenAI在推出ChatGPT Pro仅两个月后，就向投资者透露其年化收入增长了3亿美元。倘若Anthropic的Max计划也能取得类似的佳绩，无疑将为公司带来急需的助力。

Anthropic的产品负责人斯科特・怀特（Scott White）在接受采访时表示，公司不排除未来推出更昂贵订阅计划的可能性。值得注意的是，与OpenAI的ChatGPT Pro提供无限使用计划不同，Anthropic至今仍未推出类似的无限制使用方案。

新闻拓展：https://mp.weixin.qq.com/s/mREs-UL8TPctn2a0wOLfGw

05、谷歌推出AI智能体交互协议Agent2Agent，实现智能体间自由“对话”

大平台动作

当地时间4月9日，谷歌在Google Cloud Next 25大会上推出Agent2Agent协议（A2A），这是一项全新的开放标准，旨在让AI智能体能够相互通信。

此前，Anthropic的模型上下文协议（MCP）为智能体提供了一种结构化的工具使用方式，而A2A则为智能体提供了一种相互协作的方式，开发人员可构建能同使用该协议的其它任何智能体连接的智能体；而对于用户而言，可通过标准化的方式配置、管理来自不同供应商的智能体服务。

A2A协议在设计之初就秉持了五大关键原则，以确保其能够适应未来复杂多变的AI应用场景：

拥抱智能体能力（Embrace agentic capabilities）：A2A侧重于使智能体能够以其自然的、非结构化的方式进行协作，即使它们不共享内存、工具和上下文也能高效工作。

构建于现有标准之上（Build on existing standards）：该协议基于HTTP、SSE和JSON-RPC等流行的现有标准构建，这大大降低了企业将其集成到现有IT架构中的难度。

默认安全（Secure by default）：A2A在设计上就支持企业级的身份验证和授权，其安全性与OpenAPI的身份验证方案相当。

支持长期任务（Support for long-running tasks）：A2A具有高度的灵活性，可以支持从快速任务到需要数小时甚至数天才能完成的深度研究等各种场景。在整个过程中，A2A可以向用户提供实时的反馈、通知和状态更新。

模态无关（Modality agnostic）：考虑到智能世界不仅限于文本，A2A还支持包括音频和视频流在内的多种模态。

谷歌的Agent2Agent智能体交互协议现已得到了50多个技术合作伙伴的支持和贡献。

新闻拓展：https://mp.weixin.qq.com/s/WpRUWUpPy0j_BOqAIyP55A

06、亚马逊推出AI语音模型Nova Sonic：价格比GPT-4o便宜80%

大平台动作

4月9日，亚马逊正式推出新一代生成式AI语音模型Nova Sonic，标志着其在人工智能语音领域取得重大突破。

这款创新模型能够原生处理语音输入并生成自然流畅的语音输出，在速度、语音识别准确率和对话质量等核心性能指标上，已达到与OpenAI、谷歌等科技巨头的尖端语音模型相媲美的水平。

Nova Sonic通过亚马逊Bedrock开发者平台提供服务，采用创新的双向流式API接口，为企业级AI应用开发提供了强大支持。亚马逊特别强调，该模型在成本效益方面具有显著优势，其价格比OpenAI的GPT-4o便宜约80%。堪称目前市场上最具性价比的AI语音解决方案。

与竞争对手的AI语音模型相比，Nova Sonic在将用户请求路由到不同API方面表现出色。这一能力使得Nova Sonic能够知晓何时需要从互联网获取实时信息、解析专有数据源，或者在外部应用程序中采取行动，并使用合适的工具来完成任务。

在双向对话中，Nova Sonic会等待“合适的时机”发言，会考虑到说话者的停顿和打断等情况。此外，Nova Sonic还能够为用户的语音生成文本记录，开发者可以将这些文本用于各种应用场景。

据亚马逊高级副总裁兼人工通用智能（AGI）部门首席科学家罗希特・普拉萨德介绍，Nova Sonic的部分组件已经为亚马逊升级版数字语音助手Alexa+提供了动力支持。

新闻拓展：https://mp.weixin.qq.com/s/QW4n4XuuWpROFp9kxvBSmg

07、英伟达开源Llama Nemotron-253B推理模型

大平台动作

当地时间4月8日，英伟达推出Llama 3.1 Nemotron Ultra 253B。这一模型基于Meta的Llama 3.1-405B打造，通过创新技术优化，不仅在性能上超越了Llama 4 Behemoth和Maverick等强劲对手，还以高效的资源利用率和卓越的多任务能力，为AI应用的广泛落地提供了新的可能。

今年3月，英伟达首次亮相了Llama Nemotron系列推理模型。它一共包含三种规模：Nano、Super和Ultra，分别针对不同场景和计算资源需求，供开发者使用。

此次推出的Llama 3.1 Nemotron Ultra 253B拥有2530亿个参数，支持高达128K token的超长上下文长度，使其能够轻松处理复杂文本输入并保持逻辑连贯性。与前代模型相比，该版本在推理、数学运算、代码生成、指令遵循以及检索增强生成（RAG）和工具调用等关键领域展现了显著提升。

这一突破性性能得益于英伟达在模型优化上的多项技术创新。其中，神经架构搜索（Neural Architecture Search, NAS）技术通过系统化探索网络结构，显著降低了模型的内存占用，确保其在资源受限环境下的高效运行。此外，英伟达首创的垂直压缩技术进一步优化了计算效率，不仅提升了推理任务的吞吐量，还大幅降低了延迟。据悉，该模型能够在单个8x H100GPU节点上完成推理，这一特性使其在数据中心或边缘计算场景中具备了极高的部署灵活性。

作为一款开源模型，Llama 3.1 Nemotron Ultra 253B的完整权重已通过Hugging Face平台开放，并采用商业友好许可。

新闻拓展：https://mp.weixin.qq.com/s/QbUTBKG9vrIVTA-6qII2gg

08、中国自主量子计算机“本源悟空”全球首次运行十亿级AI微调大模型

大平台动作

4月7日，安徽省量子计算工程研究中心宣布，本源量子与合肥综合性国家科学中心人工智能研究院等机构联合攻关，在第三代自主超导量子计算机“本源悟空”上，成功实现了全球首次运行十亿参数AI大模型微调任务。

微调是指在通用大模型的基础上，通过进一步训练特定领域数据，使其适应医疗诊断、金融风控等专业场景。传统低秩微调面临性能瓶颈、泛化能力有限等问题，量子计算凭借其叠加态和纠缠态特性可同时探索海量参数组合，可提升大模型微调的效率。

此次实验结果显示，在参数量减少76%的前提下，训练效果反而提升8.4%。这一成就标志着中国在量子计算与人工智能融合领域取得重大进展，不仅验证了量子计算助力实现大模型轻量化的可行性，更为破解大模型“算力焦虑”开辟了新路径。

合肥综合性国家科学中心人工智能研究院副研究员陈昭昀表示：“这是量子计算首次‘真机实战’大模型任务，证明现有硬件已能初步支撑大模型微调。”

据介绍，“本源悟空”是中国第三代自主超导量子计算机，是目前先进的可编程、已交付超导量子计算机，已为全球139个国家超2300万人次提供量子算力云服务，完成35万个量子运算任务，涵盖流体动力学、金融、生物医药等多个行业领域。此外，该量子计算机还成功完成全球最大规模的量子计算流体动力学仿真，并接入金融量子云实验平台，用于探索金融领域更高效的问题解决方案。

新闻拓展：https://mp.weixin.qq.com/s/tpkJyNANrBzigyeha-KlPw

09、a16z拟募资200亿美元基金，重点投向人工智能领域

投融资风向

4月8日，据路透社消息，知名风险投资机构安德里森·霍洛维茨（Andreessen Horowitz，又名“a16z”）正在寻求筹集约200亿美元，这将是该公司历史上规模最大的基金。如果募集成功，这只巨无霸基金规模将仅次于软银集团旗下两只愿景基金。

消息人士称，a16z已告知有限合伙人，该基金将致力于人工智能公司的成长期投资，并吸引热衷于投资美国公司的全球投资者。此外，相当一部分资金将用于该公司投资组合中对人工智能公司的后续投资。

此次募资要求LP支持单一基金而非跨领域多只基金，这一策略既凸显出风投机构对人工智能的押注力度，也反映出需要大量算力和数据支撑的大语言模型开发公司面临的巨额资本需求。

a16z在支持该领域的众多公司方面一直很积极，作为领投方参与了包括xAI、Safe Superintelligence和法国的Mistral等人工智能模型开发初创企业的数十亿美元融资轮，并通过二级市场要约收购方式购入了OpenAI股份。

针对人工智能企业，a16z已斥资数亿美元购买了数千块英伟达GPU，为其投资的AI初创公司提供算力支持。

新闻拓展：https://www.reuters.com/business/finance/andreessen-horowitz-seeks-raise-20-billion-megafund-amid-global-interest-us-ai-2025-04-08/

10、量子初创公司SandboxAQ宣布获得4.5亿美元E轮融资

投融资风向

当地时间4月4日，据路透社消息，量子AI领域的初创公司SandboxAQ已从包括谷歌、英伟达、法国巴黎银行（BNP）在内的新投资者处筹集了1.5亿美元。这笔投资使SandboxAQ的E轮融资增加到4.5亿美元，估值达到57.5亿美元。至此，成立刚满3年的SandboxAQ总融资额已达9.5亿美元。

谷歌和英伟达的参与表明，科技巨头越来越希望从定量模型开发与量子科技中获得曝光率，并尽早押注潜在的实际应用。

SandboxAQ公司总部位于帕洛阿尔托，拥有约200名员工。其原是谷歌母公司Alphabet旗下的一个独立部门，致力于将AI与量子技术相结合（SandboxAQ中的AQ分别代表AI与Quantum），开发新型导航系统是其主业务之一。2022年3月，SandboxAQ正式从Alphabet剥离，并迅速收获了总额超1亿美元的融资。

该公司CEO Jack Hidary表示：“从第一轮融资开始，我们就证明了能够兑现对众多客户的承诺，我认为战略投资者被这些突破所吸引。”该公司计划利用新资金加速研发，并扩大与生物制药、化学品和能源等领域企业的合作。

新闻拓展：https://mp.weixin.qq.com/s/2A2p5vZLbyAmDebh9upjJg

信息来源：WAIC综合整理

【上一篇：】Future Tech | 为你看好的未来勇敢下注——α35青年投资领袖正式启动，盛邀所有远见的新锐投手！
【下一篇：】WAIC·开发者日|竹间智能CEO简仁贤谈NLP落地修炼之道