本周AI大事件:DeepSeek拼命想“省钱”,但Byte是想“劫持你的手机”吗?

一周AI大事:DeepSeek拼命“省钱”,而字节意在“接管手机”?(图像由人工智能生成)程程制作 |网易科技 苹果在短短 7 天内就失去了四位高管,顶级工程师正系统性地转向 OpenAI 和 Meta。这家年近50岁的科技巨头从未如此疲惫过。看看其他玩家,他们的举动比上次更加极端。 OpenAI 仍然担心在用户增长方面被谷歌超越。中方实现了出色的“双面突破”。那是随着 DeepSeek V3.2 的到来,它使用硬数据来“便宜”最好的模型。字节跳动采取了一种不同寻常的做法,让人工智能完全“接管”其手机系统。至于经验丰富的黄仁勋,他并没有参与模型层的战斗,而是悄悄发布了CUDA 13.1,利用软件生态为NVIDIA筑起更深的技术墙。 (AI生成图片)1.周末新闻:苹果面临“后乔布斯”时代最大危机,英伟达宣布双20年来最大的更新。本周末最令人震惊的行业新闻是彭博社爆料,即将庆祝成立50周年的苹果公司正处于前所未有的个人动荡之中。这不仅仅是工作变动,而是“后乔布斯时代”对苹果未来的信心危机。 ——高层震惊,主力元老齐齐告辞。就在上周,苹果失去了人工智能主管、交互设计主管、总法律顾问和政府关系主管。四名直接向首席执行官蒂姆·库克汇报的高管相继辞职,打破了苹果管理层持续十多年的长期稳定。更令人担忧的是,据透露,一手创造了苹果本土芯片神话的苹果硬件工程高级副总裁约翰尼·斯鲁兹(Johnny Srouzi)也宣布有意将这一职位交给库克。斯鲁吉是苹果硬件护城河的架构师。如果他辞职的话,我对苹果技术基础设施的影响将是不可估量的。 ArrulloKoo利用自己的高薪和“二号人物”的权威,千方百计地留住他,但由于继任纠纷和管理团队老化,这位优秀工人的命运仍然悬而未决。 ——AI已经停滞,年轻的血液正在流向OpenAI和Meta。如果说高管辞职是一种“自然新陈代谢”,那么人工智能领域的人才流失就是一种“失血性休克”。苹果人工智能首席执行官约翰·贾南德里亚 (John Gianandrea) 本周辞职,理由是该项目进展缓慢,但这只是冰山一角。据透露,苹果内部AI团队在谷歌和OpenAI的重重围攻和打压下已经“崩溃”。工程师们,竞品Siri和ChatGPT负责人入职几周内辞职,AI建模负责人庞若明带领团队投奔Meta,桌面机器人团队数十名顶尖工程师,代号J595、Vision Pro团队被OpenAI“挖角”。在硅谷激烈的“AI人才争夺战”中,苹果似乎正在从“人才黑洞”沦为“人才中转站”。当苹果深陷人力资源泥潭时,英国却夺取了人工智能霸主地位。但伟达在技术护城河上又增添了一大筹码。本周末,Nvidia发布了CUDA 13.1,推出了CUDA Tile编程模型,这是自2006年CUDA平台诞生以来“规模最大、最全面的更新”。简单来说,CUDA Tile是NVIDIA面向AI时代的“降维”工具。 (AI生成图像)·告别麻烦:传统CUDA编程(SIMT模型)需要开发人员对每个线程进行微观管理,这很灵活,但难度极大。 CUDA Tile 允许开发人员在数据块(图块)中编写程序,编译器会自动处理底层细节。 · 释放Tensor Cores的潜力:AI计算的核心是张量。 NVIDIA GPU 包括电源erful Tensor Core 和 TMA(Tensor Memory Accelerate)rator),但调用它们相当复杂。 CUDA 块抽象了这些硬件复杂性,并允许开发人员充分利用硬件性能。 · 未来兼容性:基于CUDA Tile IR(中间渲染)编写的代码自动适应下一代NVIDIA GPU架构,显着降低代码维护成本。 medNVIDIA的ida不仅更新了软件,还定义了AI编程的新标准。通过 CUDA Tile,NVIDIA 进一步降低了高性能 AI 开发的门槛,让 Python 和高级库开发人员能够轻松获得底层计算能力,就像他们使用 NumPy 一样。当竞争对手还在努力追赶NVIDIA的硬件性能时,黄仁勋已经开始对其软件生态系统进行全面升级。这种新的编程范式进一步强化了开发者生态系统,并进一步增强了 NVIDIA 的领先地位AI时代的ip。 2、强大工具:DeepSeek V3.2震撼登场,超高性价比。本周,DeepSeek 发布了 DeepSeek V3.2 和 DeepSeek V3.2-Speciale。它是一个开源的两个 MoE(混合专家)权重模型,拥有 6850 亿个参数,在推理和代理任务中表现出良好的性能,并且特别具有成本效益。其中,DeepSeek V3.2-Speciale主攻深度推理,在国际数学奥林匹克(IMO)金牌级别、AIME准确率96%、“人类终极考试”准确率30%等推理基准上取得了SOTA成绩。它甚至在某些基准测试中击败了 Gemini 3.0 Pro 和 GPT-5-High。标准DeepSeek V3.2推理模型在改善智能体推理和指令跟随方面具有出色的性能,软件E-Bench Verified在tau-bench(智能体)中达到了73.1%。任务参考点)达到80.3%。 DeepSeek V3.2发布后,社交媒体上的反应如下:“它非常好用”著名互联网科技博主@gm8xx8在周末发表了一篇广泛的评论,表示DeepSeek V3.2模型系列的推出不仅代表着性能榜单上数值上的提升,更是DeepSeek在模型架构和训练理念上的重大进步。他将DeepSeek V3.2的“绕弯子”能力总结为三点:1.核心架构:稀疏注意力机制和长稀疏文本2.训练更新:深度强化学习(RL)的融合。3.特殊变体:将验证机制转变为训练驱动程序。@gm8xx8总结说,DeepSeek V3.2系列的核心重要性是完成架构的系统集成,它将长而稀疏的上下文、大规模RL、合成代理和形式验证(Math-V2)集成到统一的RL框架中。从外部评估到可扩展的培训系统以及由验证者指导的自我审核。 《连线》发表解释文章称,DeepSeek的“硬核”模式与另一巨头字节跳动的策略形成鲜明对比,也体现了中国AI行业的分化趋势。 ——DeepSeek:Go High,模型效率是关键。由于芯片供应有限,DeepSeek从一开始就专注于模型效率和成本控制,致力于创建占用更少培训资源、降低开发者运营成本的开源模型。这标志着中国人工智能企业在“计算机军备竞赛”中采取的革命性新战略。我们努力实现技术优势和最大盈利能力。 ——字节跳动:走宽,内置应用为王。字节跳动则采取了完全不同的策略,成功与每月活跃用户超过1.4亿的豆宝一起进入操作系统层面的ivo(SO)。启动后继“豆宝输入法”之后,字节更进了一步,推出了豆宝AI代理,可以集成到手机操作系统中,控制其他应用程序。目标是取代苹果的 Siri 并实现“应用内执行”。这表明字节跳动有意避免模型军备竞赛,而是利用其庞大的用户基础将AI工具深度融入人们的日常生活。 (AI生成的图像)​​《连线》认为,这两家用户规模相似(AI应用月活跃用户超过1.4亿)的中国大公司各自代表了中国AI发展的两个方向。一组专注于推进和优化下一代大规模基础模型的效率(DeepSeek),另一组则深度参与AI能力与现有应用生态以及用户输入和场景实现的深度融合(字节跳动)。 3. 行业新闻:谷歌和亚马逊 Bloom、OpenAI 发布“红色警报” 1. 谷歌 Gemini 3 Deep Think 推出深度思考模式 本周,谷歌迅速向 Ultra 订阅者推出了深度思考模式。并行推理和长链思维显着提高了处理多步分析任务的准确性和业界领先的能力,尤其是在代码生成和复杂逻辑推理方面。 X 用户@theaimestari 直言,就 AI 技术的准确性而言,这有望改变游戏规则。 2. 亚马逊的《re:Invent Blast: Nova Family 2》将正式亮相。 AWS 本周推出了 Nova 2 型号系列,包括 Lite、Pro、Sonic 和 Omni。 · Nova 2 Pro:专为智能代理设计,其代码理解能力与 Claude 3.5 Sonnet 相当。 · Nova 2 Omni:提供图像、文本、音频和视频处理集成支持的完整模型,支持 100 万个 Token 上下文。尽管业界对亚马逊AWS的大动作持积极态度,但不少用户却表达了不同的看法。德勤全球云战略负责人David Linthicum在Lincicum上发帖称,该平台提供的强大模型、原生集成和全面的“边缘代理”服务在短期内将非常高效。但他警告称,企业应警惕未来五到十年被“锁定”AWS的风险。 Linthicum 的建议: · 战术性地使用 Nova 2:在价值明确的场景中利用其便利性。 · 避免长期联盟:从长远来看,不应允许任何供应商控制代理架构。 · 投资通用抽象层技术:企业应投资与模型无关的接口、开放和可移植的模式以及跨云可观察性,以确保未来的人工智能能力由业务战略驱动,而不是受单个云服务提供商的路线图限制。 3、谷歌近期的一​​系列大动作直接引发了OpenAI的强烈反应。 OpenAI 首席执行官 Altman 表示,谷歌 Gemini 的为了应对竞争压力,特别是其市场份额的侵蚀(Gemini 用户增长 30%,ChatGPT 增长放缓至 5%),发布了内部“红色警报”(Code Red)备忘录。他呼吁公司完善核心AI模型,回归基础,减少对非核心功能的投入。据业内报道,为了应对竞争,OpenAI 可能会在下周推出 GPT-5.2,据传该模型在整体智能方面更加智能。超越 Gemini 3 Pro。 (AI生成图片)ChatGPT团队负责人Nick Turley公开表明了自己的立场,强调需要不断改进ChatGPT的功能,使其更加直观和个性化。 4.视频和多模态:科灵AI和Runway Gen-4.5引领AI视频生成领域的趋势。两家公司本周还发布了旗舰更新。 1. Runway公布Gen-4.5视频模型:
这款新旗舰SOTA在人工分析文本转视频领域拔得头筹nkings,超越了 Google Veo 3 等竞争对手。其主要功能包括改进的运动动力学、更高的物理真实感(物体运动的重量、动量、力、流体动力流体流动等)以及详细的电影风格控制。 2、科灵AI发布多项更新。 · KeLing Video 2.6首次支持原生音频生成,可实现高达1080p分辨率的同步音频和音效,加入Veo 3独家全视听AI生成模型的行列。 ·科灵AI还推出了O1多模态创作引擎,提供统一的界面,简化AI视频创作流程,帮助实现一致性。创建人物、物体和长视频内容。 · 更具表现力的面部动画、精确的口型同步以及与现实世界的相似度我们发布了 Avatar 2.0,它增加了相似度并支持生成长达 5 分钟的较长视频。 5、行业概况:微软、苹果发布多项新品型号 – 型号: · Mistral:推出Mistral 3型号系列,包括675B参数MoE Mistral Large 3型号和三款支持本地部署的多模式Mistral 3型号。后者在推理中效果更好。 · Arcee – 美国公司推出了 Trinity 系列开源加权 MoE 模型,包括用于代理工作流程的 Trinity-Mini。 · OpenAGI – 推出了 LUX AI 代理,声称在 IT 运营方面具有 SOTA,并且可以控制 Slack 和 Excel 等桌面应用程序。 · 微软:发布了VibeVoice-Realtime-0.5B,一个专门针对实时应用程序优化的轻量级开源语音合成模型。 · NVIDIA:在 NeurIPS 会议上,我们宣布了用于语音处理、AI 安全评估和自主工作流程的希望源 AI 工具和模型的更新,其中包括 DRIVE Alpamayo-R1,这是第一个用于 AV 研究的开放推理 VLA 模型。 · 苹果:STARFlow-V已推出。它是第一个用于高质量的端到端标准化流媒体模型质量视频生成,比基于扩散的方法有更清晰的帧一致性和更快的采样速度。 ——软硬件:亚马逊:正式推出下一代Trainium 3 AI芯片并宣布上市。将AI Factory与NVIDIA GPU或Trainium芯片相结合,为企业AI集群提供本地化系统。 · 雅虎:推出了人工智能系统,可以近乎实时地生成足球比赛评论并提供叙述性摘要。 –market:· Anthropic:收购JavaScript Bun执行团队,支持扩展和mClaude代码改进;据称,克劳德码的年使用量超过10亿美元。 · OpenAI:收购 Thrive Holdings 股份,扩大其在会计、IT 支持和工作流程自动化等业务领域的影响力。 · NVIDIA 和 Synopsys:宣布建立合作伙伴关系,通过加速计算和人工智能工具彻底改变芯片设计和工程工作流程。 · 法律诉讼:新《约克时报》对 Perplexity 提起版权侵权诉讼,指控该公司的人工智能系统未经许可捕获并传输受版权保护的新闻内容。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注