过去大半年,我们一直在做端侧AI算力的评测。从英伟达DGX Spark,到各家厂商的桌面AI超算,跑模型推理、测ComfyUI工作流、试各种AIGC场景。这些产品各有亮点,但测得越多,越能看清一个事实:端侧硬件很强,但并非所有人、所有阶段都适合直接「买一台」来解决问题。
比如你是一个入门级AI开发者,今天的需求只是跑一个7B参数的小模型,但几个月后你也许会想试试70B甚至更大的模型。根源是,算力需求逐级爬升,一步到位买顶配,前期利用率很低,因为你还没入门;先买个够用的,过不了多久又面临升级,因为你已经入门——这个节奏很难踩准。
再比如一个逐渐普遍的现实:你的角色可能不止一种。
这两年有个概念,叫做OPC(One Person Company),是指一个人借助AI工具,可以干传统一整个小团队的活,成为超级个体。似乎听起来很美,但它对算力的要求同样也是“一个人顶一个团队”。上午你是AI开发者,在调模型写代码;下午变成内容创作者,做AI漫剧;晚上可能还想玩一把《黑神话:悟空》放松。每个角色吃的算力完全不同,一台固定配置的机器,很难同时喂饱所有场景。
Gartner曾做过一个预测:在未来5到10年内,DaaS(桌面即服务)将成为主流,云电脑或将成为企业与组织首选的办公计算机。它背后的逻辑,其实是算力供给模式的变革——当摩尔定律的边际效应递减,而AI模型的参数量却在以摩尔定律几倍的速度膨胀时,算力必然向云端迁移。
这就是我们开始关注云端桌面AI的原因,为此我们还在朋友圈玩起了梗,话题叫做 #办公室的新玩具#。
最近,我们又拿到了一台——阿里云无影个人云超算。准确说,是在线上“开通”了一台云端的电脑,我们体验了一周,写了这篇上手记。
可以塞进衣服口袋的个人超算
阿里云无影,简单来说,这是一款可以随时随地接入的云上电脑。
它最大的特点是实现了「算力与终端的彻底解耦」,这种解耦带来了极大便利性。在我们的实际体验中,无论手头上用的是MacBook,还是Windows笔电,甚至是一台 iPad,只要装了无影客户端App,就能瞬间接入同一个云端桌面。
2020年,阿里云展示了第一代无影云电脑,它的终端是一个名片夹大小的C-Key,连接显示屏就能进入云端桌面。当时这个品类还需要反复解释,很多人把它和远程桌面画等号。四年后的2024年,无影个人版亮相,个人玩家能直接跑《黑神话:悟空》,1080P下帧率稳定在60帧。
到了CES 2026,桌面AI超算成了几乎所有PC厂商的标配,惠普把AI PC塞进了键盘里,联想让笔记本屏幕自动旋转跟踪人脸,一大批厂商基于DGX Spark推出了巴掌大的本地AI超算。在这个舞台上,连续第二年参展的阿里云作为云厂商,就拿出了无影个人云超算。
单看起来,它是一个终端硬件,叫「无影魔方ultra」,巴掌大小,比一本精装书还轻,有点像一个接口丰富的“瘦客户机”,塞进口袋也毫不费力。
但别被尺寸骗了,它背后连着的云端配置是这样的:两块RTX 5880(单卡48GB显存,Ada Lovelace架构专业级显卡)、64核vCPU,总共96GB GPU显存。
96GB 显存是什么概念?市面上顶级的消费级显卡RTX 5090也才32G显存,96GB是它的三倍,意味着你可以轻松加载100B以上参数大模型做推理,或者跑视频生成任务也不成问题,不用担心爆显存。在本地,要搭建这样一套硬件环境,成本至少要三万元以上。而在无影上,这种巨大的前期投入被消解了,它变成列表里的一个图标,躺在屏幕里任我支配,让曾经遥不可及的超级算力变得触手可及。
魔方本身不做任何计算,所有算力都在云端,可以理解为一个「无限算力的水龙头」:插上电源、连上屏幕、就能打开云端那台超级电脑、源源不断流出更高的性能。
这是因为我们开通的是双卡配置,顶配还可以选择:4块RTX 5880(合计192GB GPU显存)、96核服务器级CPU、384GB内存,这个性能参数放到大部分场景下应该都够用。
传统个人电脑是一锤子买卖,而无影的算力是弹性的,今天跑轻量任务用小规格,明天做模型训练一键切到顶配,数据通过无影存储中心无缝同步,切换过程不丢进度。
打开后台,我们可以通过「镜像管理」,分别为「云电脑」、「AI学习机」、「工作站」一键镜像多个系统,此次我们主要镜像了Windows、Linux Ubuntu、Kylin三种不同的系统进行测试。
此外,左侧列表中的「无影内容广场」,就像是一个“AI超市”,这里有大量的第三方共享镜像。想做图?选“ComfyUI-含主流模型和节点”镜像。想炼丹?选“AI-Toolkit LoRA训练”镜像。想跑模型推理或搞开发? PyTorch、TensorFlow基础框架一应俱全。甚至还有ModelScope(魔搭社区)、DiffSynth-Studio等阿里达摩院的独家生态镜像。