《传媒观察》｜面对智能影像，人类是共生者

2026-05-14 16:12:32

编者按 南京大学哲学学院教授蓝江在《传媒观察》2026年第4期发文认为，海德格尔将世界图像化与人的主体化视为同一进程的一体两面，但智能大模型的时代迫使我们在装置逻辑中走得更远——真正主宰图像生成的不是主体，甚至不是集置，而是装置内部自行运转的数字思维。从新唯物主义的角度来看，智能影像不是独立的实体，而是人类提示词与算法代码在“内在交互行动”中共同生成的“现象”。每一次生成都是一次“能动性切分”，在特征向量与数据流的涡流中析出主体与对象的暂时边界。制作与观看的主体由此与影像结成“物体间性纠缠态”。在智能影像的激流中，人类不再是站在物之外的凝视者，也不是被技术彻底规训的囚徒，而是与影像相互构成、相互制约的共生者。学会在纠缠中辨认那道转瞬即逝的能动性切分，或许正是面对智能未来时被赋予的独特使命。

自OpenAI的Sora问世以来，智能大模型在视频赛道上的狂奔已成不可逆转之势。但Seedance2.0的特殊之处在于，将视频制作的门槛从技艺的壁垒转变为语言的边界——人类只需敲击提示词，便能完成从文本到影像、从概念到具象的跨越。如果我们仅仅停留在“技术是否会取代人类”这一老生常谈的命题上，便可能错失真正的主要问题：当影像以算法生成的方式出现，其存在方式已发生根本改变。它们不再是摄像机对物理实在的机械记录，不再是导演个人意志的投射，是算法对无数既有影像的消化与反刍，是某种我们无法完全掌控的“物”的自主显现。

新唯物主义为我们提供了切入视角：物在人类认知与经验之外拥有自身的逻辑与行动能力，并非总是充当主体意志的被动载体。面对Seedance2.0生成的影像，我们看到的是算法的递归运算、智能系统的内在逻辑，是某种正在形成中的、属于影像自身的“图形生成逻辑”。这套逻辑借用人类语言输入，却输出超出人类预期的结果；试图复现物理世界的因果链条，却往往创造出从未存在过的时空碎片。智能影像正在成为一种新的“物”，能够介入人类生活、重塑人类感知。新唯物主义虽无法解答“影像无需人类创作时艺术是否还是艺术”等终极命题，但它提供了一条核心路径：不将智能影像视为工具或威胁，而是视为一种新的存在方式，一种与人类共生的异质性主体。我们真正需要追问的，是当影像开始思考自己的存在时，人类应当如何与之共存？

一、沃康松的鸭子与弗卢塞尔的奶牛

新唯物主义的滥觞可追溯至21世纪初的哲学转向，甘丹·梅亚苏突破“相关主义循环”，格拉汉姆·哈曼以物导向本体论赋予万物独立尊严，凯伦·巴拉德与简·本内特则进一步深化了这一思考。但追问外在于人类之物的存在逻辑，并非21世纪思想的独创——18世纪法国机械工程师沃康松的机械鸭，便为机械时代的“物之思考”留下了深刻印记。

18世纪的欧洲，自动机械装置盛行，沃康松无疑是其中的佼佼者。1738年，他的仿生长笛器械惊艳巴黎；1742年，他在伦敦展示的机械鸭更引发轰动：这只鸭子不仅能拍打翅膀、啄食饮水，还能通过腹腔内的装置“消化”食物并排出腥臭颗粒，其逼真度让观众惊叹不已。但这只鸭子的核心悖论在于：为了制造“真实”的幻觉，沃康松必须巧妙地“作弊”——鸭子排出的并非真正的消化产物，而是预先埋设的颗粒；但正是这种作弊，恰恰成就了感官层面的真实。更关键的是，鸭子的机械运动与化学模拟是两个截然不同的运行逻辑：前者遵循力学定律，后者遵循物质化学反应原理，它们没有能量交换与信息反馈，其“统一性”仅存在于人类观众的认知之中——人类的知觉习惯渴求因果连贯，于是将碎片串联为整体，赋予这只金属外壳以“生命感”。

这便是新唯物主义所批判的“相关主义”的核心内涵：沃康松的鸭子无法独立于观看者的目光而存在，“物性”并不存在于它自身，而存在于它与观看者的相关性之中。正如格拉汉姆·哈曼所言，当事物被还原到我们的感知或使用时，它才成了物——我们所谓的“物”，不过是在人类意识的聚光灯下被暂时定型的影子。

与沃康松的鸭子形成鲜明对比的，是巴西媒介思想家威廉·弗卢塞尔笔下的“奶牛装置”。他将奶牛描述为“系统复杂却功能简单”的装置：其内部拥有精密的控制学构造，却只需吃草、反刍、产奶，以简约的外形与环境融为一体。但这只“奶牛装置”与沃康松的机械鸭子有着本质区别：它不再是人类目光下被动的统一体，而是一个拥有自身节律的行动者。弗卢塞尔预言，工业革命后的机器正在从“人类手臂的延伸”转变为“奶牛式机器”——它们拥有自主运行逻辑的系统，将自身节律强加于人类，迫使人类重新适应，进而引发新的异化。

这种转变的核心意义在于，物的统一性不再寄生于人类的感知与意识。沃康松的鸭子只有在人类目光中才是“鸭子”，而弗卢塞尔的奶牛，其整体性来自自身的系统自主性，无需观看者便已是自主运作单元，更能反过来规训人类。当我们将目光转向Seedance2.0便会发现，它看似是沃康松的鸭子——生成的影像呈现出令人惊叹的“统一性”，实则是弗卢塞尔的奶牛：它拥有自主的影像算法、运作节律和生成逻辑，人类不再能随意驱使，反而需将自己的创作思维嵌入模型的运行节奏之中，去适应那套早已预设好的运算规则。要理解这种“奶牛化”的本质，需进一步切入技术图像时代的核心逻辑。

二、作为技术装置的图像

Seedance2.0等大模型生成的影像，所涉及的首先是一个图像问题——图像如何在技术逻辑中重新获得“生命”。自文艺复兴以来，图像便始终在抵抗着象征符号的霸权，丢勒、阿比·瓦尔堡、潘诺夫斯基等学者，都在寻找被主体知识和象征符号遮蔽的图像逻辑，他们隐约感到：图像并非再现世界，而是生成世界。

法国游戏《光与影：33号远征队》便隐喻了这种图像逻辑：玩家所处的“卢明世界”是一幅拥有自主生命力的画，能生成生命、抹煞生命，画框成为生命流转的通道。这恰是我们今天面对智能影像的处境：没有外在的“画家”赋予图像以灵魂，图像在自行生成、自动涌现。就像B站网友用AI创作《霍去病》短片，试图打破传统影视图像的垄断，却也面临着深层困境——当我们用AI冲击旧霸权时，或许正在适应另一种更隐蔽的图像逻辑，正如游戏主角在画中反抗，却不知每一次反抗都已写入脚本。

要理解技术图像的本质，需回到海德格尔的思考。他在《世界图像的时代》中指出，世界图像并非“关于世界的图像”，而是“世界被把握为图像”——世界不会主动显现，需被某种力量“摆置”到人类面前，成为可观看、可操控的对象。这种“摆置”正是海德格尔所说的“集置”——现代技术的本质，即将万物促逼为可计算、可利用的“持存资源”。图像便是集置的直接表象：世界被扁平化为图像，存在者丧失本己的神秘内核，人类看似成为主体，实则沦为图像桎梏下的囚徒——我们看到的，只是被技术预先摆置好的影子。

海德格尔的批判虽深刻，却未能把握智能影像的全新特质。Seedance2.0生成的“面包”视频，既无实体触感，也无香气，只是算法组织的光点矩阵，唯有被图像集置塑造的“主体”，才能将其“视为”面包——这正是沃康松鸭子陷阱的现代重演。但更根本的翻转，在于弗卢塞尔所说的“奶牛化”逻辑。

弗卢塞尔在《迈向摄影哲学》中揭示了一个关键颠倒：传统秩序中，文本是图像的“元代码”，图像需借助语言解释；而在技术图像时代，图像反而成为文本的元代码。更重要的是，装置模拟的并非人类思维，而是“数字思维”——以二进制代码为单位，以算法运算为驱动，不遵循人类的因果律与语言逻辑。这种数字思维主导着图像生成，使得图像成为装置内部符号游戏的外显，人类看似在操控装置，实则正在将思维“让渡”给装置——提示词需符合模型格式，创意需适应算法路径，审美需接受既定输出，这正是弗卢塞尔40年前的预言：装置是模拟数字思维的黑箱，其效率远胜人类，最终将迫使人类让渡思维。

从海德格尔到弗卢塞尔，我们抵达了智能影像的核心：真正主宰图像生成的，既非人类主体，也不再是海德格尔的“集置”，而是装置内部那套自行运转的数字逻辑。这种逻辑拥有自己的节律与语法，正如弗卢塞尔的奶牛，将异质的运行规则强加于每一个接近它的人——这便是技术图像时代的本质。

三、能动实在论与物体间性纠缠

要理解Seedance2.0所生成的影像的实在性，需从技术底层的转变切入。OpenAI的Sora试图打造“世界模拟器”，通过学习海量视频数据重构物理世界的三维逻辑，但声音始终是后加的附属品；而Seedance2.0让视频特征向量与音频样本在同一潜在空间中共同生成、演化，其基本单位是可转换的“模态矢量”——这一变革，触及了核心哲学问题：当影像与声音共同生长，其本质究竟是什么？

TheDorBrothers工作室用Seedance2.0制作的短片《Apex》，画面与声音质感堪比特效摄制，但这3分钟成品只是表象，其背后是涌动的特征向量、像素与样本之流，这些基本单元在人类目光之外翻涌、汇聚、离散，最终析出可供观看的影像——这正是理解智能影像存在方式的关键，而凯伦·巴拉德的能动实在论，为我们提供了核心理论工具。

与追问“物本身是否自在”的思辨实在论不同，巴拉德的核心命题是：构成世界的基本单元并非独立的物，而是“现象”。实在由现象中的物构成，世界是动态过程，通过确定的边界、属性与标记模式，实现内在活动与物质化的动态演进。更关键的是“内在交互行为”——与“互动”不同，它不预设独立的互动双方，而是认为主体与对象的区分，是在彼此作用的动态过程中逐渐浮现的，这种区分便是“能动性切分”，它让现象固有的不确定性获得暂时的确定性。

将这一思想应用于智能影像，我们可得出两条结论：

第一，智能视频不是一个实体，而是一种处于内在互动关系中的现象。即便输入完全相同的提示词，Seedance2.0每一次生成的视频都会有差异——细节、结构或氛围的不同，这是因为每一次生成都是算法与数据的新一次“能动性切分”，影像只是这一瞬的偶然产物，其“实在性”便在于这种不稳定性，无法以传统“实体”的视角去把握。

第二，智能视频与发出指令的主体和观看的主体之间，存在着不可剥离的关联。没有主体的指令与目光，视频便不存在——这并非说视频是主体的投射，而是说，任何视频都是在特定指令与数据中生成的，其可理解性依赖于观看主体的注目。若无人观看，生成的视频便会消逝在数据运算中，沦为等待被唤醒的幽灵。

由此，制作和观察的主体与特定视频之间，形成了“物体间性纠缠态”——二者并非两个先在的独立实体随后发生互动，而是在内在交互行动中共同生成的。当我们观看《Apex》时，“观看的我”与“被看的影像”，是被同一道“能动性切分”同时划出的两个侧面。人类不再是站在物之外的凝视者，因为每一次凝视都是现象内部的切割；也不是被装置彻底规训的囚徒，因为我们既是现象的一部分，也是现象显现的条件。面对智能未来，我们的使命并非凝视、抵抗或臣服，而是学会在纠缠中辨认那道转瞬即逝的、属于我们自己的能动性切分。

（载《传媒观察》2026年第4期，原标题为《从沃康松的鸭子到物体间性纠缠——Seedance2.0下的影像唯物主义》，此为节选，注释从略，学术引用请参考原文。“传媒观察杂志”公号链接：https://mp.weixin.qq.com/s/7R_jEAYvHa-JxqELezSKww。）

【作者简介】蓝江，南京大学哲学学院教授

特别声明：本文为扬子晚报新媒体平台“紫牛号”作者上传并发布，仅代表该作者个人或机构观点，与紫牛号立场或观点无关。紫牛号仅提供信息发布平台。如因文章内容、版权等问题，请联系扬子晚报法务部。