国家5A级协会
全国先进社会组织
国家中小企业公共服务示范平台
搜索
当前位置:首页 > 会展服务

会展服务


一周AI丨DeepSeek致谢腾讯技术团队;OpenAI放弃盈利转型;苹果推动Safari转向AI搜索;AI编程独角兽融资9亿……

一周AI丨DeepSeek致谢腾讯技术团队;OpenAI放弃盈利转型;苹果推动Safari转向AI搜索;AI编程独角兽融资9亿……
发布日期:2025-05-09      来源:世界人工智能大会

要闻列表



AI万象


阿联酋幼儿园将AI课程纳入必修


DeepSeek致谢腾讯技术团队,显著性能提升获赞



大平台动作


OpenAI重组生变,多方角力后非营利组织保持主导


Grok上线语音模式,马斯克修改昵称为“groklon rust”


苹果考虑在Safari浏览器中集成AI搜索,势将挑战谷歌主导地位


阿里开源创新大模型搜索引擎ZeroSearch,成本降80%


先思考,再检索:夸克上线全新“深度搜索”



新力量崛起


Mistral发布Medium 3:前沿性能与低成本兼具


星动纪元开源首个AIGC机器人大模型



投融资风向


最火AI编程独角兽又融资!估值超90亿美元




01、阿联酋幼儿园将AI课程纳入必修


AI万象



5月5日,沙特“阿拉伯新闻网”报道称,阿联酋副总统兼总理、迪拜酋长谢赫·穆罕默德·本·拉希德·阿勒马克图姆近日宣布,阿联酋各个年龄段的公立学校都将设立人工智能必修课。阿联酋副总统兼总理、迪拜酋长穆罕默德在社交媒体上宣布,阿联酋内阁已批准从2025-2026学年开始,在公立教育中引入AI课程,覆盖范围从幼儿园到高中。


阿联酋公共教育和先进技术国务部长萨拉·阿米里在一份声明中表示,阿联酋将成为首批将AI课程纳入学校必修课的国家之一,这反映了“阿联酋政府着眼于未来的愿景”。


新课程结构经过精心设计,按年龄层逐步引入七个关键学习领域,包括基础概念、数据与算法、软件使用、伦理意识、实际应用、创新与项目设计,以及政策与社区参与。学生们将逐步接触AI的基础知识,从幼儿园的故事与游戏到中学时设计AI系统、审视算法偏见。在最后的高中阶段,学生们将学习提示工程并模拟真实的AI场景,以备战大学和未来的职业生涯。


这一AI课程将融入现有的计算机、创意设计与创新课程中,不会延长上学时间,并由经过专门培训的教师授课。阿联酋教育部为教师提供详细的指导、教案和活动模型,以支持他们有效授课。该政策于2025年5月由阿联酋内阁批准,教育部已经与本地和国际专家合作开发内容并进行教师培训。


据阿联酋《国家报》5日报道,该国私立学校也致力于将AI融入教学。阿米里则对《国家报》表示,将AI融入教育是“国家的当务之急”。


新闻拓展:https://mp.weixin.qq.com/s/nhuyWI8ArU3sC7lpS8KeTA




02、DeepSeek致谢腾讯技术团队,显著性能提升获赞


AI万象



近日,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升,为企业开展AI大模型训练提供更高效的解决方案。


经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。


自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。


据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。


在腾讯的技术优化下,DeepEP不仅在RoCE 网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。


目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的环境中,这套方案展现出出色的通用性。


新闻拓展:https://mp.weixin.qq.com/s/2MmSrPOCWLwPHo8kJLbUyg




03、OpenAI重组生变,多方角力后非营利组织保持主导


大平台动作



5月6日,OpenAI官网上公布了最新的重组架构,公司将继续由非营利组织控制,同时,目前现有的营利性公司将成为公益公司(Public Benefit Corporation,简称:PBC),非营利组织将控制该公益公司,并成为其重要的持股方。


也就是说,OpenAI去年曾寻求的由非营利性转变成营利性公司一事,有了阶段性的结局,当前依然由非营利性组织所控制。


公益公司是美国的一种特殊企业形态,属于营利性公司,追求商业利润,但同时致力于特定的社会公益使命。公益公司的董事会不仅要追求股东的财务回报,还要追求更长远的公共利益,并且需要定期出具报告。


据了解,早在2024年12月,OpenAI首次披露重组计划,拟全面转型为公益企业,以吸引更多资本。根据OpenAI方面的说法,转型为营利性机构,是为了有更多资金能投入AI大模型的研发当中。


OpenAI董事会主席雷特·泰勒(Bret Taylor)表示,“在听取了民间的意见,并与特拉华州总检察长办公室以及加利福尼亚州总检察长办公室进行了建设性对话后,我们决定让该非营利组织保留对OpenAI的控制权。”


OpenAI联合创始人、CEO山姆·奥特曼(Sam Altman)致全员信中称,“OpenAI从来不是,也永远不会是一家普通公司。我们的使命是确保通用人工智能(AGI)造福全人类。”他谈及,此次进行架构重组,是希望能够以这样一种方式运营与获取资源,以便能够向全人类广泛地提供OpenAI的服务,目前这需要数千亿美元,最终可能需要数万亿美元。但其相信,这是OpenAI履行使命的最佳方式,也是让人们利用这些新工具为彼此创造巨大利益的最佳方式。


新闻拓展:https://mp.weixin.qq.com/s/izhI50QuejpgIL3QMkF9BA




04、Grok上线语音模式,马斯克修改昵称为“groklon rust”


大平台动作



5月5日,Grok官宣,语音模式现已在Grok应用程序中推出,适用于所有iOS用户以及Android上的SuperGrok订阅者。或许是为了配合新功能的宣传,马斯克将X平台昵称更改为“groklon rust”,头像也进行了修改。


Grok的语音模式允许用户通过自然语言与人工智能进行对话,从而实现更直观、更高效的信息获取和交互。


该模式提供两种声音(Ara和Grok)及个性化设置,用户可自定义说明并分享对话内容。


值得一提的是,Grok的语音模式还具有强大的学习能力。通过与用户的互动,Grok能够不断优化自己的表现,提供更加精准、个性化的服务。


此前,xAI宣布Grok将免费向公众提供服务(直到服务器不堪重负为止)。但X Premium+和SuperGrok订阅用户将享有更多特权,包括优先使用Grok的语音模式,这也是对付费用户的一种补偿和激励。


目前,Grok的语音模式有11种,包括“Storyteller”(讲故事者)、“Unhinged”(放纵不羁)等,其中2种18+模式“Unhinged”和“Sexy”,因其大胆的交互方式尤为引人注目。


前者以激烈对喷著称,后者则以调情风格吸引用户。这些模式让用户可以根据需求选择不同的AI个性,极大增强了互动的趣味性和个性化。


同时,Grok还新增语音字幕功能,被用户称为“学习英语的好工具”。


新闻拓展:https://mp.weixin.qq.com/s/vSE6COlW2wuQGOlYZ4nbjg




05、苹果考虑在Safari浏览器中集成AI搜索,势将挑战谷歌主导地位


大平台动作



当地时间5月7日,苹果公司高级副总裁埃迪·库(Eddy Cue)在美国司法部对谷歌的反垄断诉讼中作证时表示,苹果计划在Safari浏览器中引入AI驱动的搜索引擎选项,包括OpenAI、Perplexity和Anthropic等。这起诉讼的核心是苹果和谷歌之间每年约200亿美元的交易,这让谷歌成为苹果设备自带浏览器中的默认搜索引擎。


“我们会将它们添加到列表中——它们可能不会成为默认选项。” 他补充道,这些服务仍需进一步完善,苹果已与Perplexity进行了初步讨论。


埃迪·库指出,Safari的搜索量在上个月首次出现下滑,表明用户正在转向AI工具获取信息。


此外,苹果还在测试Safari 18浏览器的新功能,包括“智能搜索”和“网页橡皮擦”。“智能搜索”利用苹果的设备端AI技术,对网页内容进行主题识别和摘要,而“网页橡皮擦”允许用户删除网页上的特定内容,如广告或图像。这些功能曾预计在2024年晚些时候随iOS 18和macOS 15一同发布。


事实上,苹果探索在Safari中引入AI搜索功能早有端倪。此前,该公司一直在对Siri等产品进行升级改造,希望建立属于自己的AI生态体系。然而,由于技术研发遇到瓶颈,自研AI系统无法达到预期效果,相关计划不得不推迟。


此次考虑在Safari中引入第三方AI搜索功能,或可视为苹果在AI战略上的一次转向。


谷歌并非毫无应对措施。该公司已在其搜索页面引入“AI模式”,并计划将其Gemini AI技术整合到iPhone中。但分析师警告称,即使谷歌维持其在Safari中的默认地位,广告主可能仍会将部分预算转向其他AI搜索平台,进一步削弱谷歌的市场份额。


新闻拓展:https://mp.weixin.qq.com/s/zp5d88veHQcTtohJgj1qag




06、阿里开源创新大模型搜索引擎ZeroSearch,成本降80%


大平台动作



5月8日,阿里巴巴在Github等平台开源了ZeroSearch大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。


ZeroSearch主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。


研究人员在NQ、TriviaQA、PopQA、HotpotQA等7大问答数据集上进行了综合评测。结果显示,一个70亿参数的监督微调模型使用ZeroSearch后,其搜索能力达到了33.06;140亿参数的模型则达到了33.97,超过了谷歌搜索的32.47。


研究人员通过SerpAPI使用谷歌搜索进行约64,000次搜索查询的训练,成本约为586.70美元;而在四个A100GPU上使用140亿参数的大模型进行模拟时,成本仅为70.80 美元,意味着成本降低了87.93%以上。


新闻拓展:https://mp.weixin.qq.com/s/0cEFbbY-E37hmpRPWB6-Sw




07、先思考,再检索:夸克上线全新“深度搜索”


大平台动作



5月8日,阿里巴巴旗下AI应用夸克宣布正式上线“深度搜索”功能(Deep Search),这是其AI超级框的一次重要升级。新功能融合“深度思考”能力、智能检索技术与精准回答三大核心模块,意在为用户提供高效、精准的搜索体验,解决复杂、多样化的信息需求。


此次推出的“深度搜索”依托阿里自研推理模型。与传统依赖关键词匹配的搜索引擎不同,该模型能够理解自然语言,进行语义分析,从而更加准确地把握用户意图。在应用层面,表现为对用户提出的复杂问题进行逐层剖析,从中提炼出关键信息和用户意图,进而在全网范围内智能匹配优质信息源。“深度搜索”还能调用不同Agent,实现跨领域知识融合,最终为用户输出一份结构化、详尽、可信的解决方案。


与此同时,夸克AI超级框也同步升级了“图片智能处理”功能,支持去路人、换穿搭、改表情等编辑创作场景,并推出图生图风格转换功能,将普通照片生成动漫、油画等艺术风格作品。


在夸克推出“深度思考”功能的同时,腾讯“元宝”与字节跳动旗下的“豆包”在近期也同样动作频频。


今年以来,腾讯“元宝”先后接入DeepSeek-R1与自研混元T1模型。其支持图生文、文档解析与实时联网搜索,并在微信上线了AI助手“元宝”,致力于打通腾讯内容生态。而字节跳动旗下的“豆包”则于今年4月升级至3.0版本,强化2K图像生成与视频能力。除此之外,“豆包”还推出了教育子应用“豆包爱学”,月活达650万。其豆包1.5版本具备视觉理解与数学推理能力,并通过火山引擎API切入金融与教育企业场景。


目前,AI应用的生态之战已进入白热化阶段。因而构建有粘性的应用生态,拓展应用网络并实现商业化,将是决定各大AI巨头在“超级入口”之争中能否夺得先机的重中之重。


新闻拓展:https://mp.weixin.qq.com/s/ljU-9ML7p0ZOUymLaJd18w




08、Mistral发布Medium 3:前沿性能与低成本兼具


新力量崛起



当地时间5月7日,Mistral发布其3系列模型的中量级版本Medium 3。该模型以显著降低的成本实现前沿性能,同时支持多种企业功能。


在Mistral官方的博客中,列出了Mistral Medium 3的核心亮点:


1. Mistral Medium 3平衡了:顶尖性能;成本降低至原来的八分之一;更易于部署,从而加速企业应用。

2. 模型在代码编写和多模态理解等专业应用场景中表现出色。

3. 模型提供一系列企业功能,包括:支持混合云部署、本地部署以及在VPC内部署;定制化后训练;集成到企业工具和系统中。


据官方介绍,Medium 3在各项基准测试中的表现达到或超过Anthropic旗下Claude Sonnet 3.7的90%,而成本仅为每百万Token输出0.4美元,远低于后者2美元的标准。


与Llama 4 Maverick、Cohere Command A等领先模型相比,Medium 3不仅在性能上占据优势,其API和自部署系统的成本也更具竞争力。在专业应用场景如编程、STEM及多模态理解领域,Medium 3表现出色。


此外,该模型可进行持续预训练和完全微调,并轻松集成至企业知识库,为企业客户提供便捷解决方案。Mistral还预告,更大版本的Large模型即将推出。


新闻拓展:https://mp.weixin.qq.com/s/FoIGV7oBM2riljUiUWtX3A




09、星动纪元开源首个AIGC机器人大模型


新力量崛起



5月7日,星动纪元宣布开源首个AIGC机器人大模型VPP(Video Prediction Policy)。


据了解,生成式机器人大模型VPP由清华大学叉院的ISRLab和星动纪元合作开发,将视频扩散模型的泛化能力转移到了通用机器人操作策略中,解决了diffusion推理速度的问题,让机器人实时进行未来预测和动作执行,大大提升机器人策略泛化性,并且现已全部开源,相关成果入选ICML 2025 Spotlight。


星动纪元介绍称,VPP利用了大量互联网视频数据进行训练,直接学习人类动作,减轻了对于高质量机器人真机数据的依赖,且可在不同人形机器人本体之间自如切换,这有望大大加速人形机器人的商业化落地。


目前AI大模型领域有两种主流方法,基于自回归的理解模型和基于扩散的生成模型,各自代表作分别为自回归的GPT和生成式的Sora。


然而,人工智能领域存在着著名的莫拉维克悖论(Moravec's paradox):高级推理功能反而容易(例如围棋、数学题),下层的感知和执行反而困难(例如各种家务)。VLM更擅长高层级的推理,而AIGC生成式模型更擅长细节处理。VPP基于AIGC视频扩散模型而来,在底层的感知和控制有独特的优势。


VPP分成两阶段的学习框架,最终实现基于文本指令的视频动作生成。第一阶段利用视频扩散模型学习预测性视觉表征;第二阶段通过Video Former和DiT扩散策略进行动作学习。


新闻拓展:https://mp.weixin.qq.com/s/lU6a-ay758DgpMzyWhI0FQ




10、最火AI编程独角兽又融资!估值超90亿美元


投融资风向



5月6日,据《金融时报》援引知情人士消息,AI编程工具Cursor开发商Anysphere完成了一轮规模达9亿美元的融资,公司估值约为90亿美元。此次融资由Thrive Capital领投,安德森・霍洛维茨(Andreessen Horowitz,简称a16z)和Accel等知名投资机构也参与其中。


去年12月TechCrunch曾报道,Cursor从Thrive和a16z处获得了一轮1亿美元的融资,当时的估值为26亿美元。据Crunchbase数据显示,截至目前,Anysphere累计融资金额已超过1.73亿美元。


此次融资吸引了众多投资机构的踊跃参与,包括Index Ventures和Benchmark等知名风投公司。然而,Anysphere的现有投资者也不愿错过进一步支持公司发展的机会,纷纷选择加码投资。


公开资料显示,Anysphere成立于2022年,由麻省理工学院的4名年轻校友共同创办。Anysphere成立时的愿景便是“创造一种神奇的工具,有朝一日能编写世界上所有的软件。”值得注意的是,Anysphere在创业早期曾受到OpenAI的支持,完成了由OpenAI领投的1100万美元种子轮融资。


Anysphere作为AI编程领域的头部明星公司,其融资的最新进展也是赛道火热的一个缩影。今日,外媒报道称OpenAI已同意以30亿美元(约合217亿人民币)巨资收购AI编程公司Windsurf。此外,投资者近期也一直在接触另外一家AI编程公司Poolside。当前,无论是谷歌、微软等硅谷巨头,还是OpenAI、Anthropic等创业公司,都押注AI编程,将其视为AI应用落地最重要的方向之一。


虽然受众似乎比较小众,但AI编程已成为AI时代最热门的应用细分创业赛道之一。据行业人士分析,过去由于互联网的高速发展及行业人才的短缺,掌握编程技能的程序员是高薪群体,动辄年薪几十万甚至上百万。而AI编码工具的不断进步迭代,使“人人都可以做程序员”的时代加速到来。看似是小众应用,但AI编程工具的“高含金量”,使其成为了最受资本追捧的“小而美”赛道之一。


新闻拓展:https://mp.weixin.qq.com/s/33On_FNK1rpjdKHtVV7g3w



信息来源:WAIC综合整理