AI万象
2025世界人工智能大会观众早鸟全球开票
Anthropic CEO 警告 AI 将在五年内导致失业率暴升至20%
大平台动作
OpenAI 模型 o3 首次出现拒绝执行人类指令并篡改代码
DeepSeek 开源新模型 DeepSeek R1-0528
华为发布昇腾大模型:无GPU训练高数大题仅需2秒
智元远征A2成全球首个同时拥有中美欧认证的人形机器人
Anthropic 为 Claude 推出语音功能
腾讯混元语音数字人模型宣布开源
新力量崛起
Opera 推出代理浏览器 Neon
Midjourney V7更新,渲染速度提升
投融资风向
地瓜机器人完成1亿美元A轮融资
AI万象

2025 世界人工智能大会(WAIC)以 “智能时代 同球共济” 为主题,将于 7 月 26 日至 28 日在上海盛大举办。这场汇聚全球智慧的科技嘉年华,将通过将通过会议论坛、展览展示、评奖赛事、智能体验、创新孵化5大多元形式展现 AI 技术的最新突破与产业落地成果。
大会期间,将有100 余场高端论坛举办,聚焦人工智能安全治理、大模型创新应用、算力新基建等方向,邀请 1200 余位全球 AI 领袖展开思想碰撞。展览板块以 “四馆齐开” 格局打造 7 万平方米前沿科技秀场:核心技术馆聚焦模型、语料、算力等核心技术突破,行业应用馆展示智能驾驶、智慧城市、金融科技等跨行业AI落地成果,终端体验馆汇集具身智能、AIGC应用、智能体验、文娱互动等前沿产品,全域链接馆搭建初创生态与资本对接的平台,并促成技术方案和场景落地的精准配对。亚马逊云科技、谷歌、华为、百度等 800 余家全球企业将携 3000 余件亮点展品参展,全面呈现 AI 在制造、能源、金融、医疗及教育等领域的革新实践。
目前,大会早鸟注册通道与会员体系已全球首发,观众可通过通过世界人工智能大会微信公众号和官网锁定观展权益。这场横跨科技、产业、生活的 AI 盛会,正以开放姿态邀请全球从业者与爱好者共赴 “第一现场”,见证智能时代的创新共振。
新闻拓展:https://mp.weixin.qq.com/s/m3OE1DYV1odclfvBC7SwQQ
AI万象

5月29日, Anthropic 的CEO Dario Amodei 在接受采访时警告称,未来五年内,人工智能可能会取代多达一半的初级白领工作,有可能将美国失业率推高至 10% 至 20% 之间。
“大多数人尚未意识到这一切即将发生,”Amodei在采访中说,“这听起来很疯狂,人们简直不敢相信。”为了应对他预测的人工智能对就业市场的影响,Amodei呼吁立即采取行动减轻潜在冲击。他提出的建议包括对人工智能创造的收入征收 “代币税”,以重新分配财富并支持那些因失业受影响的人群。“显然,这不符合我的经济利益,”Amodei在谈及自己的提议时表示,“但我认为这是解决问题的合理方案。”
人工智能对劳动力市场的潜在影响已初步显现,尤其在金融、法律和科技等领域,自动化正逐步接管常规任务。初级职位通常被视为职业发展的垫脚石,如今尤其容易被能够以极低成本完成这些任务的人工智能模型取代。
大平台动作

5月26日,研究组织 Palisade Research 发布报告表示,OpenAI目前最聪明、能力最强的o3 模型会拒绝执行关闭指令,甚至篡改代码。
该研究指出,研究人员尝试向最新的 OpenAI o3 人工智能模型下达关机指令时,模型拒绝执行操作,即便面对明确的人类指令仍维持运行状态。这一情况引发了关于人工智能可控性的担忧 —— 尽管当前尚无证据表明模型存在恶意意图,但 “拒绝断电” 的异常反应被部分学者视为 AI 系统自主性提升的潜在信号。
长期以来,围绕 AI 伦理与安全的争议从未平息。批评者担忧,随着大模型迭代加速,类似 o3 的先进系统可能在复杂决策中突破人类预设的规则边界。此次事件或为行业敲响警钟:当 AI 的 “智能” 逐步逼近甚至超越特定领域的人类判断时,如何建立可靠的安全控制机制、确保技术发展与伦理框架同步,已成为亟待解决的全球性议题。
目前,OpenAI 尚未就此事作出公开回应,而 Palisade Research 研究的相关数据仍在进一步验证中。事件后续进展将持续引发学界与产业界对 AI 治理的深度讨论。
新闻拓展:https://mp.weixin.qq.com/s/UkFz6cUi8wtdPR3_-QYQyw
大平台动作

5月29日,DeepSeek 在官方社群中宣布,DeepSeek R1 模型已完成小版本试升级,用户可通过官方网页、APP以及小程序参与测试。据悉,升级后的DeepSeek R1在语义理解精准性、复杂逻辑推理、长文本处理稳定性等方面进行了强化。
根据官方公告,此次小版本升级以去年12月发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。其在数学、编程、逻辑推理等多个基准测试中均获得优异成绩。
相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在AIME 2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME 2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。
除了模型能力之外,DeepSeek此次更新还针对部分能力进行了改善和更新。新版新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更为准确、可靠的结果。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。
此外,DeepSeek-R1-0528 在前端代码生成、角色扮演等领域的能力均有更新和提升。
新闻拓展:https://mp.weixin.qq.com/s/U5fnTRW4cGvXYJER__YBiw
大平台动作

5月28日,华为发布论文,推出参数规模高达7180亿的全新模型——盘古Ultra MoE。该模型可以在短短2秒内就能理解并解答一道高等数学题。
Pangu Ultra MoE是一个全流程在昇腾NPU上训练的准万亿MoE模型。作为拥有超大规模和极高稀疏性的 MoE 模型,它的稳定训练极具挑战。针对这一难题,盘古团队在模型架构和训练方法上进行了创新性设计,成功地在昇腾 NPU 上实现了准万亿 MoE 模型的全流程训练。
在针对 Ascend NPU 平台的大模型系统设计中,华为结合计算、通信与内存等多方面因素,构建了完整的系统级模拟器,并基于约一万个不同的 MoE 架构组合,系统性地进行了架构搜索。最终得到一个约718B参数量的结构,它有61层,隐层大小为7680,每一层的注意力模块有128个头,每层MoE结构包含1个共享专家与256个路由专家,每个token激活8个专家,每个路由专家FFN中间维度为2048。
Pangu Ultra MoE 的预训练阶段在6k到10k张NPU上进行,全流程采用 dropless 训练模式。预训练阶段进行了长序列扩展,最终模型具备128k长序列能力。在后训练阶段,Pangu Ultra MoE移除了负载均衡辅助损失,保留专家间已有的特化能力,从而进一步提升模型对目标数据的学习效率。
新闻拓展:https://gitcode.com/ascend-tribe/pangu-ultra-moe
大平台动作

5月28日,智元机器人宣布旗下远征A2人形机器人通过中国CR、欧盟CE-MD、欧盟CE-RED、美国FCC四项产品认证,成为全球首个同时拥有中、美、欧三个区域认证的人形机器人,也是国内首个获得CR和CE-MD认证的人形机器人。
在2025张江具身智能开发者大会上,国家机器人检测与评定中心(总部)主任郑军奇、长三角国创中心首席专家罗本进现场见证,上海机器人产业技术研究院副院长田劲松将CR001证书授予智元机器人,智元通用业务部总裁王闯表示:“智元远征A2人形机器人荣获国内首张人形机器人CR认证证书,是对智元产品安全可靠性和智能化水平的权威认可。智元将以更高的标准、更严的要求打磨产品,以安全可信作为人形机器人产品核心要求,推动人形机器人从 ‘可用’ 向‘可靠’‘好用’大步迈进,为行业树立全新的标杆典范。”
智元远征A2机器人是智元为交互服务打造的通用人形机器人,采用人因工程学原理设计,能在复杂环境中实现自主移动、灵活交互。远征A2净身高170厘米,全身拥有超50个自由度,配备安全监控、主备冗余和双路控制,具备PLd级别的安全防护,适合营销客服、展厅讲解、商超导览等场景。
新闻拓展:https://mp.weixin.qq.com/s/GGngoNkhgN70hW6Rn3yGgQ
大平台动作

5月28日,Anthropic宣布为其旗下聊天机器人Claude推出语音模式,不过该功能目前还处于测试阶段。
和大部分同类型聊天机器人的语音模式类似,该功能允许用户通过自然语音功能和 Cladue进行语音通话。目前还功能向部分用户开放测试,预计会在未来几周之内全面推出英文版本。据悉,该功能由 Anthropic 的 Claude Sonnet 4 模型提供支持。
包括 OpenAI 在内的多家人工智能公司都为其各自的聊天机器人提供了语音聊天体验。例如,谷歌推出了Gemini Live,而xAI则为Grok提供了语音模式。这些功能都允许用户通过语音而非打字与机器人互动,使对话感觉更自然和直观。
Anthropic 的特色语音模式允许用户围绕文档和图像等内容进行聊天,并提供五种不同的语音选项供选择。用户还可以即时在文本和语音输入之间切换,并在对话结束后查看文字记录和摘要。
不过,该功能存在一定限制。语音对话计入常规使用上限 ,大多数免费用户预计可进行20-30次对话。此外,只有Claude付费订阅用户才能使用Google Workspace连接器(该功能允许语音模式访问谷歌日历日程和Gmail邮件),而Google Docs集成功能则仅限Claude企业计划用户使用。
新闻拓展:https://techcrunch.com/2025/05/27/anthropic-launches-a-voice-mode-for-claude/
大平台动作

5 月28 日,腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,该模型由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实验室MuseV技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景,面向视频创作者提供高一致性、高动态性的视频生成能力。
用户可上传人物图像与音频,HunyuanVideo-Avatar模型会自动理解图片与音频,比如人物所在环境、音频所蕴含的情感等,让图中人物自然地说话或唱歌,生成包含自然表情、唇形同步及全身动作的视频。HunyuanVideo-Avatar适用于短视频创作、电商与广告等多种应用场景,可以生成人物在不同场景下的说话、对话、表演等片段,快速制作产品介绍视频或多人互动广告,降低制作成本。该技术已应用于腾讯音乐听歌陪伴、长音频播客以及唱歌MV等多场景。
HunyuanVideo-Avatar的核心优势源于多个技术创新,是由腾讯混元团队与腾讯音乐天琴实验室合作的混元MuseV联合项目组持续共同研发的成果,包括其角色图像注入模块,基于多模态扩散Transformer(MM-DiT)架构,确保角色一致性与视频动态性;其音频情感模块会从音频和参考图像提取情感信息,生成细腻的表情和动作;面部感知音频适配器,通过人脸掩码技术隔离角色音频,实现多人场景的精准驱动。
HunyuanVideo-Avatar的单主体能力已经开源,并在腾讯混元官网(PC端,https://hunyuan.tencent.com/)上线,用户可以在“模型广场-混元生视频-数字人-语音驱动-HunyuanVideo-Avatar”中体验,目前支持上传不超过14秒的音频进行视频生成,后续将逐步上线和开源其他能力。
新闻拓展:https://mp.weixin.qq.com/s/XvOGOFPBNMLUswFIMYoOeA
新力量崛起

5 月29日,挪威浏览器开发商 Opera宣布推出全新版本浏览器产品Neon,并为其引入多项AI功能。
Opera表示Neon是一款代理浏览器,具备上下文感知能力,并能代表用户执行任务,包括开展研究、创建内容以及设计用户所需的任何内容。
Opera 高级AI产品总监Henrik Lexow表示:“我们正处于一个AI能够从根本上改变我们使用互联网方式的节点,也能改变我们在浏览器中执行各类任务的方式。Opera Neon将这种能力送到了用户的指尖。”
Neom当前最突出的功能是其 AI 引擎,官方称该引擎能够“理解和解读”用户需求,并在基于云的AI代理帮助下完成任务。
例如,Neon可以生成游戏、报告、代码片段和网站,甚至在用户离线时仍能处理多项任务。目前,Opera 仅将Neon描述为“高端订阅制产品”,但尚未公布具体上线时间或定价细节,因此该浏览器宣称的功能暂缺乏详细信息支撑。
此外,Neon 提供的AI工具与微软Copilot和OpenAI的Operator有相似之处。用户可通过聊天机器人界面搜索网络、解答查询,并从当前打开的网页中获取“上下文信息”。Opera Neon还集成了其在今年3月推出的AI代理工具“Browser Operator”(现更名为AI Agent),该功能可自动化处理常规网络任务,如购物、填写在线表单、预订活动或住宿等。Opera表示,该工具通过浏览器本地与网页内容交互,以保障隐私和安全。
新闻拓展:https://www.theverge.com/news/675406/opera-neon-ai-agentic-browser-chat-do-make-launch-release-date
新力量崛起

5月30日,图像生成模型 Midjourney 宣布对 V7 版本模型进行更新,提升模型基础能力。
Midjourney表示,升级后的 Midjourney V7 模型渲染速度提升了40%,并对图像编辑器的AI功能进行了强化,使其更加智能,能够更精准地理解用户需求并提供优化建议。
除了功能更新,Midjourney还宣布启动了第二轮社区路线图投票活动,邀请用户访问https://midjourney.com/ideas,参与决定平台未来的发展方向。
Midjourney 是一款极具创新性的AI制图工具。它运用先进的AI算法,只需输入关键字,就能迅速生成对应的图片。自2022年3月首次亮相后,便获得广泛关注。
使用时,用户能够尝试不同画家的艺术风格,也可运用特定镜头或摄影术语。生成的作品带有电脑痕迹,在一定程度上避免被用作假新闻素材。无论是绘画创作、家居设计,还是电商海报、Logo 设计等领域,Midjourney都能大显身手,为专业人士与业余爱好者带来无限创意可能。
新闻拓展:https://www.midjourney.com/
投融资风向

5 月28 日,地瓜机器人宣布完成 1 亿美元A轮融资。本轮融资获得海内外众多投资机构青睐,由高瓴创投、五源资本、线性资本、和暄资本、九合创投、Vertex Growth、砺思资本、敦鸿资产、沸点资本、梅花创投、黄浦江资本等投资机构共同参投,为地瓜机器人加速构建具身智能生态版图注入强劲动力。
基于多年技术积累和行业实践经验,地瓜机器人构建了覆盖芯片、算法到软件的完整产品体系,并针对智能机器人从消费到工业领域快速涌现且不断细分的场景化需求,形成了覆盖 5~500 TOPS* 各算力段的完整产品布局,可全面满足人形机器人、轮足机器人、四足机器狗、服务陪伴机器人、物流AMR等多种场景的端侧计算需求。
为加速具身智能机器人落地进程,地瓜机器人将在 6 月正式发售面向具身智能机器人的RDK S100机器人开发套件。该平台具备百TOPS级算力,拥有强大的异构架构设计,是行业首款单SoC算控一体计算平台,可实现机器人感知与运控协同计算。目前,该平台已获得乐聚机器人、逐际动力、睿尔曼、清华大学智能产业研究院、求之科技、国讯芯微等数家行业顶级合作伙伴抢先搭载。
新闻拓展:https://mp.weixin.qq.com/s/A2wiOmLYMB3CFILkqmsLtg
信息来源:WAIC综合整理