采访|李响
过去一两年,AI生成图像技术迅速成熟,并渗透到社会生活的方方面面。像传统摄影一样,它也有专业技术门槛吗?它会不会取代传统摄影本身,甚至模糊真实和虚构的界限?这是很多业内人士和普通人关心的问题。
作为一名在媒体工作20余年的图片编辑,我经历了从胶片到数码的技术转换,如今又遇到AI生成影像的新浪潮。这项技术的确成倍提高了操作和使用的便捷性,但是在大量生成AI配图的过程中,我也产生了某种抵触情绪。随着海量重复画面的诞生,影像已经变得毫无生趣。
带着复杂的感受,我采访了王略。他是高校从事摄影教学的一位教师,近两年他对AI影像生成进行了积极的探索。在他的最新作品《虚构的摄影史》中,他试图探讨AI生图与传统摄影的边界与可能。以下是我们的对谈。
正午:在过去多年的创作中,你有哪些和技术相关的作品吗?
王略:我工作的学校是理工科背景,我个人一直关注技术的新动向。2010年,我拍过一组叫《星图》的作品,就是讨论科技与艺术的关系。我拍的是电脑主板,拆了几十台主机,里面的主板颜色、排线各有不同,工程师在设计之初都是以功能为前提设计的,但却自然的形成了美感。问过专业人士我才知道,不同染料的电阻系数不同。主板是现代工业的一个缩影,在严密的理性设计后,它却有着艺术品一样的动人呈现和秩序美感。
正午:你为什么想将AI技术融入到个人创作呢?
王略:我较早就接触到AI 的使用。最初尝试用 AI 生成图像时,内心的真实感受是,摄影要完蛋了,一切与摄影相关的内容都要瓦解了。原因就是, AI 生成图像的真实感直逼摄影。对于没有经验的眼睛, AI 可以生成以假乱真的图像。摄影的一切美学基础来源于从现实世界锁取光影形成的真实感,而 AI技术正是撼动了这种真实感。摄影术从发明到现在不足两百年,很多作品的文献价值比艺术价值大得多,可以说是人类的记忆。AI 技术可以轻松模拟这种记忆,甚至篡改记忆,让人们不再相信摄影的真实性,进而彻底消解掉摄影对于人类的价值。摄影的使命也就完结了。在这种感受下,我开始着手制作《虚构的摄影史》,想把这个迫在眉睫的问题提出来讨论。
正午:你使用什么工具?
王略:我主要使用 midjourney(MJ),通过一个聊天空间,和机器人对话,生成的图片大家能时时看到,也可以下载。我先找到能够代表摄影发展进程中有共识性的照片,以喂图+语言指令+参数的形式尝试生成,大概两三个月的时间,仿制了将近 30 张著名的历史照片。
正午:在创作的过程中,有让你印象深刻的细节么?
王略:印象比较深刻的是兰格的《移居的母亲》,原作拍摄于1930 年代经济大萧条时期的美国⻄部。当时生成的人物的情绪、动势、画面的气氛都很接近原作,但却多出来一个孩子,原作是母亲在中央,两边各一个孩子趴在肩膀上,而生成的图像里有三个孩子,我百思不得其解。后来我无意间发现,原作母亲的怀里的确还抱着一个婴儿,裹在襁褓里,露出了极少的侧脸,不仔细看很难发现。而AI生成的第三个孩子就是这个,这是 AI 给我的又一次震撼,它的读图能力超出了一个⻢⻁的人类。对于以图生图的形式, 必须是先了解图中的内容才能复制,AI识别到了人眼睛遗漏的部份。

正午:你觉得AI擅长的是什么?在哪方面比较笨拙?
王略:应该是得益于大数据的积累,AI对于做出一张生动有感染力的肖像照片很在行,但是对于人物的肢体,尤其手的描绘,出错是常事。不是关节处安置⻆度有问题,就是手或手指的数量出问题,根源应该也在于数据量与算力的不足。手是人体当中最复杂、也是人最熟悉的部位,画过手的人更能体会——五个手指的活动轨迹、透视⻆度可以有无数种组合,但只要出一点错看着就别扭。在远景、大场面的人物生成上,AI 似乎放弃了人物的细节,脸部五官位置挪移、不清晰是很正常的事情。在仿制⻩功吾《越战中的女孩》时,远方士兵看着比前面人物高大很多,显然违反了基本的透视关系,所以,后来我很容易从一些细节处发现画面是否是AI生成的。

正午:在进行AI生成图像的过程中,你觉得有跟传统摄影接近的某些感受么?
王略:在制作过程中,一般要等待几十秒到几分钟的时间,图像才能完全显现出来,这跟网速与生成内容的多少有关,但都会经历三个阶段:一开始画面只是一团模糊的噪点; 然后是大概轮廓显现、画面慢慢成型;最后逐步清晰、成图生成完成。在这个过程中,我觉得,自己的心理状态很象在暗房里,把已经曝好光的相纸侵入到显影液,在微弱的红光下期盼理想效果的显现。对于期盼度高的作品,内心有强烈的焦灼感与赌心。如果只是一般的作品,就会利用这个时间上个厕所或冲杯咖啡,放松一下。

正午:这个比喻很妙,都是等待“显影”的过程。你遇到过AI无法生成图的情况么?
王略:我发现,在输入文字的过程中,当提示词中有“no clothes”、“ nude“这类的词语时,系统通常会给予提示警告,也根本不会继续生成。但在以图生图⻙斯顿的女人体时,反而没有出现这样的提示。

正午:你觉得AI有它自己的偏好么?
王略:我发现 AI 时常会有意识的回避原图的画面结构,比如原图主体面朝左侧,而生图正好相反;原图是中景,仿制图可能就变成近景。以AI的复制能力,生成一张一样画面结构的新图更加容易,但却刻意的改变,似乎有意在规避版权问题。比如在仿制美国当代摄影师埃里克·索斯《I Know How Furiously Your Heart Is Beating》作品集中的一张女性肖像作品时,虽然生成的画面色调与气氛与原作非常吻合,但四张小图有两张人物在画面中的方向与原作完全相反,另外两张方向一致的画面,人物躺的⻆度也不一致,人物在画面中的取景范围也被缩小了,变成了更近的景别。

正午:在我的经验中,可能是由于数据采集的局限性,MJ在理解一些中国的情景时很困难,你觉得呢?
王略:这个未必。在制作《虚构的摄影史》之前,我做过一个有趣的实验,把中国的古诗词作为指令提示词输入来生成图像。比如王维《山居秋明》中的两句,“竹喧归浣女,莲动下渔舟”,需要先在 Google 翻译里译成英文“Bamboos rustle with the return of washerwomen, lotus leaves sway as fishing boats descend”,然后直接输入生图,结果效果十分惊人。没有想到 AI 对中国诗词里表达的意境把握的非常到位,与想象的画面贴合度很高。无论画面的构图、色调,以及人物的服饰、动势、神情,都带有浓郁的中式审美⻛格,画面中透露出的悠然、飘逸之感更是独属中国的味道。我并没有对人物的着装、动势做任何具体的语言指令调整,AI 却能够以文字意境自动揣摩出贴合度很高的场景与具体细节。

正午:在创作完成之后,你觉得跟人类摄影师比,AI整体有哪些方面的不足?
王略:在操作逐步熟练的过程中,我发现AI 在想象力层面有随机性,完全同样的提示指令,今天生成的与明天生成的都不一样。比较来看,人类个体的想象力相对稳定,你从事哪方面工作,对哪方面感兴趣,更关注哪方面,自然脑海中搜集的信息就越多,这方面可创造出的东⻄就越多。我因此也重新发现摄影的意义,推翻了最初的判断。从现实中抓取的细节和质感,始终还是摄影最打动人的地方,哪怕构图再差,摄影还是能透露出光与空间的气质。
正午:你认为 AI 技术的使用,可能会对哪些行业冲击最大?
王略:最初我的感觉是 AI 影像的出现,对婚纱、影楼、写真摄影的冲击可能是毁灭性的,因为单纯从经济和便捷性来讲,拍摄一套写真耗费的时间、金钱成本显然比用 AI 技术换头换身体大得多。但现在看,这个判断忽略了另一个重要的层面,就是拍摄行为本身的意义并不等同于一张结果性的照片,被摄对象需要的是对“我”的确立,这是要通过“出镜”来实现的。不论后期怎么美化,拍的还是“我”。而且写真摄影作为一个行业,是一个服务与享受服务的过程,从定妆、化妆到现场调动、拍摄,对被摄者是一个整体的体验与享受的过程,这些都不是一组换脸照片可以取代的。 所以,十几年前数码相机的出现,也并没影响到大画幅摄影创作者的数量,更没有妨碍他们不辞辛苦背着几十斤重的设备与胶片翻山越岭去创作,因为“玩”的内容不一样。AI 影像技术与摄影终究还是两回事, 在商业上 AI 可以快速解决产品类的“造像”需求,但与人体验相关的,尤其在艺术创作层面,AI 与摄影还是只能各干各的事儿。
正午:你怎么看待人工智能跟人类的关系?
王略:AI技术的确高效,在商业上可以取代大量的人工,但对于技术的终端使用者,却是被动的,甚至是悲哀的。大部分人类群体都象牛⻢一样被驱使着前行,技术对于掌权者带来的是生产力,但对于大部分底层人们带来的更多是恐慌。工作被剥夺只是一个层面,当大部分人类感觉到自己处处不如 AI 时,会怀疑自身存在的意义。
OpenAI 开始扩张时,曾经对外传达过 AI 创造出的财富可以反哺给人类的观念。但这恰恰忽略了人创造价值、实现自我的精神需要。没有了这点,就没有了方向与活着的动力,更没有了延续生命的欲望。
以下是王略的作品《虚构的摄影史》中部分作品和原作的对照:
























——完——
本文作者李响,界面新闻图片总监。
本文图片由受访者提供。