编者按 南京大学哲学学院教授蓝江在《传媒观察》2026年第4期发文认为,海德格尔将世界图像化与人的主体化视为同一进程的一体两面,但智能大模型的时代迫使我们在装置逻辑中走得更远——真正主宰图像生成的不是主体,甚至不是集置,而是装置内部自行运转的数字思维。从新唯物主义的角度来看,智能影像不是独立的实体,而是人类提示词与算法代码在“内在交互行动”中共同生成的“现象”。每一次生成都是一次“能动性切分”,在特征向量与数据流的涡流中析出主体与对象的暂时边界。制作与观看的主体由此与影像结成“物体间性纠缠态”。在智能影像的激流中,人类不再是站在物之外的凝视者,也不是被技术彻底规训的囚徒,而是与影像相互构成、相互制约的共生者。学会在纠缠中辨认那道转瞬即逝的能动性切分,或许正是面对智能未来时被赋予的独特使命。
自OpenAI的Sora问世以来,智能大模型在视频赛道上的狂奔已成不可逆转之势。但Seedance2.0的特殊之处在于,将视频制作的门槛从技艺的壁垒转变为语言的边界——人类只需敲击提示词,便能完成从文本到影像、从概念到具象的跨越。如果我们仅仅停留在“技术是否会取代人类”这一老生常谈的命题上,便可能错失真正的主要问题:当影像以算法生成的方式出现,其存在方式已发生根本改变。它们不再是摄像机对物理实在的机械记录,不再是导演个人意志的投射,是算法对无数既有影像的消化与反刍,是某种我们无法完全掌控的“物”的自主显现。
新唯物主义为我们提供了切入视角:物在人类认知与经验之外拥有自身的逻辑与行动能力,并非总是充当主体意志的被动载体。面对Seedance2.0生成的影像,我们看到的是算法的递归运算、智能系统的内在逻辑,是某种正在形成中的、属于影像自身的“图形生成逻辑”。这套逻辑借用人类语言输入,却输出超出人类预期的结果;试图复现物理世界的因果链条,却往往创造出从未存在过的时空碎片。智能影像正在成为一种新的“物”,能够介入人类生活、重塑人类感知。新唯物主义虽无法解答“影像无需人类创作时艺术是否还是艺术”等终极命题,但它提供了一条核心路径:不将智能影像视为工具或威胁,而是视为一种新的存在方式,一种与人类共生的异质性主体。我们真正需要追问的,是当影像开始思考自己的存在时,人类应当如何与之共存?
一、沃康松的鸭子与弗卢塞尔的奶牛
新唯物主义的滥觞可追溯至21世纪初的哲学转向,甘丹·梅亚苏突破“相关主义循环”,格拉汉姆·哈曼以物导向本体论赋予万物独立尊严,凯伦·巴拉德与简·本内特则进一步深化了这一思考。但追问外在于人类之物的存在逻辑,并非21世纪思想的独创——18世纪法国机械工程师沃康松的机械鸭,便为机械时代的“物之思考”留下了深刻印记。
18世纪的欧洲,自动机械装置盛行,沃康松无疑是其中的佼佼者。1738年,他的仿生长笛器械惊艳巴黎;1742年,他在伦敦展示的机械鸭更引发轰动:这只鸭子不仅能拍打翅膀、啄食饮水,还能通过腹腔内的装置“消化”食物并排出腥臭颗粒,其逼真度让观众惊叹不已。但这只鸭子的核心悖论在于:为了制造“真实”的幻觉,沃康松必须巧妙地“作弊”——鸭子排出的并非真正的消化产物,而是预先埋设的颗粒;但正是这种作弊,恰恰成就了感官层面的真实。更关键的是,鸭子的机械运动与化学模拟是两个截然不同的运行逻辑:前者遵循力学定律,后者遵循物质化学反应原理,它们没有能量交换与信息反馈,其“统一性”仅存在于人类观众的认知之中——人类的知觉习惯渴求因果连贯,于是将碎片串联为整体,赋予这只金属外壳以“生命感”。
这便是新唯物主义所批判的“相关主义”的核心内涵:沃康松的鸭子无法独立于观看者的目光而存在,“物性”并不存在于它自身,而存在于它与观看者的相关性之中。正如格拉汉姆·哈曼所言,当事物被还原到我们的感知或使用时,它才成了物——我们所谓的“物”,不过是在人类意识的聚光灯下被暂时定型的影子。
与沃康松的鸭子形成鲜明对比的,是巴西媒介思想家威廉·弗卢塞尔笔下的“奶牛装置”。他将奶牛描述为“系统复杂却功能简单”的装置:其内部拥有精密的控制学构造,却只需吃草、反刍、产奶,以简约的外形与环境融为一体。但这只“奶牛装置”与沃康松的机械鸭子有着本质区别:它不再是人类目光下被动的统一体,而是一个拥有自身节律的行动者。弗卢塞尔预言,工业革命后的机器正在从“人类手臂的延伸”转变为“奶牛式机器”——它们拥有自主运行逻辑的系统,将自身节律强加于人类,迫使人类重新适应,进而引发新的异化。
这种转变的核心意义在于,物的统一性不再寄生于人类的感知与意识。沃康松的鸭子只有在人类目光中才是“鸭子”,而弗卢塞尔的奶牛,其整体性来自自身的系统自主性,无需观看者便已是自主运作单元,更能反过来规训人类。当我们将目光转向Seedance2.0便会发现,它看似是沃康松的鸭子——生成的影像呈现出令人惊叹的“统一性”,实则是弗卢塞尔的奶牛:它拥有自主的影像算法、运作节律和生成逻辑,人类不再能随意驱使,反而需将自己的创作思维嵌入模型的运行节奏之中,去适应那套早已预设好的运算规则。要理解这种“奶牛化”的本质,需进一步切入技术图像时代的核心逻辑。
二、作为技术装置的图像
Seedance2.0等大模型生成的影像,所涉及的首先是一个图像问题——图像如何在技术逻辑中重新获得“生命”。自文艺复兴以来,图像便始终在抵抗着象征符号的霸权,丢勒、阿比·瓦尔堡、潘诺夫斯基等学者,都在寻找被主体知识和象征符号遮蔽的图像逻辑,他们隐约感到:图像并非再现世界,而是生成世界。
法国游戏《光与影:33号远征队》便隐喻了这种图像逻辑:玩家所处的“卢明世界”是一幅拥有自主生命力的画,能生成生命、抹煞生命,画框成为生命流转的通道。这恰是我们今天面对智能影像的处境:没有外在的“画家”赋予图像以灵魂,图像在自行生成、自动涌现。就像B站网友用AI创作《霍去病》短片,试图打破传统影视图像的垄断,却也面临着深层困境——当我们用AI冲击旧霸权时,或许正在适应另一种更隐蔽的图像逻辑,正如游戏主角在画中反抗,却不知每一次反抗都已写入脚本。
要理解技术图像的本质,需回到海德格尔的思考。他在《世界图像的时代》中指出,世界图像并非“关于世界的图像”,而是“世界被把握为图像”——世界不会主动显现,需被某种力量“摆置”到人类面前,成为可观看、可操控的对象。这种“摆置”正是海德格尔所说的“集置”——现代技术的本质,即将万物促逼为可计算、可利用的“持存资源”。图像便是集置的直接表象:世界被扁平化为图像,存在者丧失本己的神秘内核,人类看似成为主体,实则沦为图像桎梏下的囚徒——我们看到的,只是被技术预先摆置好的影子。
海德格尔的批判虽深刻,却未能把握智能影像的全新特质。Seedance2.0生成的“面包”视频,既无实体触感,也无香气,只是算法组织的光点矩阵,唯有被图像集置塑造的“主体”,才能将其“视为”面包——这正是沃康松鸭子陷阱的现代重演。但更根本的翻转,在于弗卢塞尔所说的“奶牛化”逻辑。
弗卢塞尔在《迈向摄影哲学》中揭示了一个关键颠倒:传统秩序中,文本是图像的“元代码”,图像需借助语言解释;而在技术图像时代,图像反而成为文本的元代码。更重要的是,装置模拟的并非人类思维,而是“数字思维”——以二进制代码为单位,以算法运算为驱动,不遵循人类的因果律与语言逻辑。这种数字思维主导着图像生成,使得图像成为装置内部符号游戏的外显,人类看似在操控装置,实则正在将思维“让渡”给装置——提示词需符合模型格式,创意需适应算法路径,审美需接受既定输出,这正是弗卢塞尔40年前的预言:装置是模拟数字思维的黑箱,其效率远胜人类,最终将迫使人类让渡思维。
从海德格尔到弗卢塞尔,我们抵达了智能影像的核心:真正主宰图像生成的,既非人类主体,也不再是海德格尔的“集置”,而是装置内部那套自行运转的数字逻辑。这种逻辑拥有自己的节律与语法,正如弗卢塞尔的奶牛,将异质的运行规则强加于每一个接近它的人——这便是技术图像时代的本质。
三、能动实在论与物体间性纠缠
要理解Seedance2.0所生成的影像的实在性,需从技术底层的转变切入。OpenAI的Sora试图打造“世界模拟器”,通过学习海量视频数据重构物理世界的三维逻辑,但声音始终是后加的附属品;而Seedance2.0让视频特征向量与音频样本在同一潜在空间中共同生成、演化,其基本单位是可转换的“模态矢量”——这一变革,触及了核心哲学问题:当影像与声音共同生长,其本质究竟是什么?
TheDorBrothers工作室用Seedance2.0制作的短片《Apex》,画面与声音质感堪比特效摄制,但这3分钟成品只是表象,其背后是涌动的特征向量、像素与样本之流,这些基本单元在人类目光之外翻涌、汇聚、离散,最终析出可供观看的影像——这正是理解智能影像存在方式的关键,而凯伦·巴拉德的能动实在论,为我们提供了核心理论工具。
与追问“物本身是否自在”的思辨实在论不同,巴拉德的核心命题是:构成世界的基本单元并非独立的物,而是“现象”。实在由现象中的物构成,世界是动态过程,通过确定的边界、属性与标记模式,实现内在活动与物质化的动态演进。更关键的是“内在交互行为”——与“互动”不同,它不预设独立的互动双方,而是认为主体与对象的区分,是在彼此作用的动态过程中逐渐浮现的,这种区分便是“能动性切分”,它让现象固有的不确定性获得暂时的确定性。
将这一思想应用于智能影像,我们可得出两条结论:
第一,智能视频不是一个实体,而是一种处于内在互动关系中的现象。即便输入完全相同的提示词,Seedance2.0每一次生成的视频都会有差异——细节、结构或氛围的不同,这是因为每一次生成都是算法与数据的新一次“能动性切分”,影像只是这一瞬的偶然产物,其“实在性”便在于这种不稳定性,无法以传统“实体”的视角去把握。
第二,智能视频与发出指令的主体和观看的主体之间,存在着不可剥离的关联。没有主体的指令与目光,视频便不存在——这并非说视频是主体的投射,而是说,任何视频都是在特定指令与数据中生成的,其可理解性依赖于观看主体的注目。若无人观看,生成的视频便会消逝在数据运算中,沦为等待被唤醒的幽灵。
由此,制作和观察的主体与特定视频之间,形成了“物体间性纠缠态”——二者并非两个先在的独立实体随后发生互动,而是在内在交互行动中共同生成的。当我们观看《Apex》时,“观看的我”与“被看的影像”,是被同一道“能动性切分”同时划出的两个侧面。人类不再是站在物之外的凝视者,因为每一次凝视都是现象内部的切割;也不是被装置彻底规训的囚徒,因为我们既是现象的一部分,也是现象显现的条件。面对智能未来,我们的使命并非凝视、抵抗或臣服,而是学会在纠缠中辨认那道转瞬即逝的、属于我们自己的能动性切分。
(载《传媒观察》2026年第4期,原标题为《从沃康松的鸭子到物体间性纠缠——Seedance2.0下的影像唯物主义》,此为节选,注释从略,学术引用请参考原文。“传媒观察杂志”公号链接:https://mp.weixin.qq.com/s/7R_jEAYvHa-JxqELezSKww。)
【作者简介】蓝江,南京大学哲学学院教授