Reddit上的LocalLLaMA社区最近上演了一出黑色幽默。
一位用户花500美元淘到了一张冷门的W6800 32GB显卡,测试后发现效果出奇地好,于是兴冲冲地写了篇详细评测分享给社区。结果第二天醒来,他盯上的所有W6800全部售罄,最便宜的价格直接翻倍突破1000美元。
他亲手把自己想买的第二张卡买贵了。
评论区有人搬出了加州淘金热的典故:当年发现金矿的人没有四处声张,而是先悄悄买光了周边所有的铲子、淘金盘和采矿设备,然后才告诉大家这里有金子。最终靠卖工具成为加州第一个百万富翁的,是商人Samuel Brannan,而不是挖金子的人。
这个故事放在今天的本地大模型圈子里,讽刺意味更浓。当显存成为跑大模型的硬通货,每一篇“这卡真香”的帖子都可能成为价格上涨的导火索。有人调侃:别推理了,改行倒卖显卡吧。
社区里关于性价比显卡的讨论也很有意思。MI50凭借32GB显存和1TB/s带宽,曾经160美元就能入手,堪称穷人福音。但软件生态是硬伤,基本只有llama.cpp和ComfyUI能用,想做微调或者跑专业推理引擎就抓瞎了。P40现在200美元以下,3090依然是主流推荐,而Strix Halo的128GB内存让一些人蠢蠢欲动——当然,前提是别再发帖推荐了。
还有人挖出了一个冷知识:AMD V620其实和W6800是同一张卡的服务器版本,eBay上只要450美元,只是没有显示输出。但对于纯跑推理的人来说,这根本不是问题。
这场闹剧背后折射出本地大模型社区的真实生态:大多数人的显存还不到16GB,真正拥有24GB以上推理设备的可能只有几百人,但每个人都在焦虑地寻找下一个性价比之王。价格一旦涨上去就很难降下来,而社区的每一次“安利”都在加速这个过程。
所以下次发现什么好东西,记得先买够再说。