一批内容创作者已经拿起AI生成图像工具,产出漫画作品了。
不久前,日本出版了首部由AI生成技术完成的漫画作品《Cyberpunk: Peach John》(赛博朋克:桃太郎John)。
(资料图)
其创作者Rootport(笔名)构思了故事框架和人物对话,画面部分则完全交由AI在线图像生成器Midjourney生成。
这位37岁的创作者自称“从未手绘过漫画”。但他只用了六周就完成了漫画创作。而这部100多页、全彩的漫画出版物,对于漫画创作熟手来讲也要花上至少一年时间。这无疑对成熟的日本漫画工业体系产生着冲击。
借由AI图像生成器,创作者仅需撰写文本就能生成精美的图片。“理想很丰满,现实很骨感”,“AI输出漫画”充满了大量测试和反复试错。
比如在创建角色时,作者最初输入了“cyberpunk momo-taro midnight Japan”(赛博朋克、桃太郎、午夜日本)。AI“会错意”把momo-taro当成了女性名字,因而生成了一个女孩形象的图片。然而这并不符合他想要的人设。于是他调整了关键词“粉色头发、亚洲男孩、赛博朋克、棒球外套、日本漫画”,通过反复修改单词和单词顺序,提炼文本描述,逐渐让AI输出的画面更贴近自己的构思。
很快他就意识到“对Midjourney的要求太高了”。目前这种文生图模式很难达到“一次性完美输出”:在同一图片上做到背景、角色和细节同时达到预期。因此Rootport只能分别生成画面要素,然后后期手动“拼装”起来。
事实上,AI图片生成器足够“精湛”但难担“漫画画手”。
比如Midjourney每次生成的图片就像“开盲盒”,带有随机性,所以漫画主角时常“变脸”,特别是角度和场景变化时,“换脸感”更加突出。这对于讲述一个连续性故事的漫画中是最大的BUG。
为了克服这一点,Rootport通过设定更鲜明的人物特征来引导读者更容易识别角色。比如漫画里的助手角色长着狗耳朵。在转场的时候,读者会更先识别耳朵,从而“忽略”了脸部的变化。在其作品中,每个角色都被赋予一种强特征,比如粉色头发、红色和服。
再比如手部特写(诸如多指或少指)和透视关系极其容易扭曲。Rootport不得不为此妥协,减少人物手部出镜镜头。
为了效率优化,他还创建了一个“图像库”,把AI生成的数百张近似图像、特别是表情图,将其整理成素材库,来减少反复输出图片的周折。
Rootport对这种“念念咒语”就能输出图像的模式感到兴奋,他认为“(AI技术)为没有艺术天赋的人进入漫画行业铺平了道路”。只要你有好故事,人人都可以是漫画家。
从去年火爆至今,打着AIGC标签的作品层出不穷。大量的“乌托邦”科幻、暗黑、赛博朋克风格作品兴起。
《Cyberpunk: Peach John》也是其一。事实上,其科幻故事并不稀奇,甚至有点“套路”。故事背景设定的“新冈山”充满了《银翼杀手》和《神经漫游者》的影子,都是1980年代的城市。粉红色头发的Peach John是一位失去记忆的少年,在老夫妇的帮助下,主人公和强大的敌人斗智斗勇,踏上了寻找被盗数据的冒险征途。
也有人对该作品产生质疑“为什么故事并非来自AI创作”,但这并不妨碍这部漫画以“里程碑式”的身份夺得流量和关注——当世界第一辆汽车问市,没有人在意它到底多少马力。
“AI头啖汤”吸引着大众趋之若鹜,每个人都想“驯化”AI这头猛兽。在炫技和概念面前,“讲一个好故事”反而成了退而次之。
今年年初以来,科幻杂志《Clarke’s World》被大量AI生成类投稿“淹没”。《Clarke’s World》的投稿量飙升,其中大量被标记为垃圾邮件,仅去年就收到了约11500份投稿。《Clarke’s World》的“困扰”一方面来自于AI生成类作品的版权问题,另一方面来自于大量灌水作品的识别压力。为此杂志方不得不暂时关闭了投稿入口。
“这些(AI生成作品)的创作者往往来自于YouTube或TikTok博主,他们试图泡制一些东西,用最小的努力赚快钱”。
在国内社交媒体平台上,有关Midjourney、DALL-E 2、Stable Diffusion以及ChatGPT等的教程点击轻松过万。流量背后都是庞大的跃跃欲试者。
漫画家@刘冲LDART 在社交媒体平台分享了他的测试,1P漫画“从落笔到最后码完文字,全部工作只要半个小时”。他分享了其生产过程:基于手绘的分镜草稿生成数十张初稿草图,再从中筛选,通过PHOTOSHOP加工最终成稿。“熟悉一下软件就行,完全零画技都能做”。
不久前在腾讯漫画平台,@脑玩家mindplayer 发布了其AI辅助创作漫画《The ARES Awekening ARES觉醒》,并在社交账号上自称“中文世界第一部”。
这并非唯一案,国内社交媒上有不少博主开始更新起原创AI漫画故事,也有人尝试将小说改编,结合AI语音生成动态漫画。也有人指出,快看上已经有用AI生成辅助的漫画。
悲观者认为,AI正在催生更多“内容垃圾”,使内容创作变得模板化,循规蹈矩,失去灵感而索然无味。
但AIGC打开了创作者大门的同时,创作者集体入场也反向快速催化AI技术的进化。去年6月,科幻小说作家Brian Martinez出版了AI艺术生成的图画小说《Lungflower》。彼时这部作品的画面充满了“AI的早期痕迹”,人物面目和轮廓线模糊、构图简单、色彩晕染过度,当然这也离不开剧情氛围设定。
T. Kingfisher在 Twitter 上连载的故事画面变得更加精致,形式偏向于“图片配文字”的图文小说模式。而推出了系列漫画《The Bestiary Chronicles》的Steve Coulson已经在创作中导入简单的景别和构图,画面也更加细腻。
从去年下半年AIGC火烧全球至今,短短半年多时间,AI生成漫画已经肉眼可见的进步,尽管诸多作品依然存在“通病”:不一致的面孔、身体、道具和服装;角色刻画受限,面部不得不弱化或是用道具遮住;畸形手;视觉上更强调大全景和氛围感,而非人物(以此强化AI在风景上的优势,弱化人物一致性问题,但这也同样也面临背景一致性的问题)。
无论是《Cyberpunk: Peach John》或是芸芸作品,今天的兴奋感都只是AIGC进化史上一个注脚。
在大量AI生成内容走热下,相关版权问题依然尚处空白。
2022年9月,数字艺术家 Kris Kashtanova 向美国版权局提交了漫画书《黎明的查莉娅》(Zarya of the Dawn) 的注册申请并获得批准,该作品包含通过Midjourney 的AI 技术生成的漫画图像。由此,Kris Kashtanova也成为第一个获得 AI 创作作品版权的人。
但在获悉漫画中图像是由Midjourney 生成后,版权局随后对其决定进行审查并要求提供更多信息。
今年2月底,美国版权局重新做了裁决——取消了此前的版权认证,给出了“有限版权”的裁定:Kashtanova创造的内容,包括文字和其他原创内容将受到保护,但AI生成的图像并不受版权保护。
Kashtanova指出,这些图像是经由自己编纂敲文本而生成,但版权局给出了回应:Midjourney “随机”生成了图像,即 Kashtanova 并未“实际形成”这些图像,也因此并非图像的作者。
Kashtanova 的律师辩称,版权局犯了错误,忽略了文本编写也在提升着AI生成图像的创造力水平。但这一观点并没有获得支持。
该案也给出了版权判断指导原则:即版权只保护人类创作。
不过,版权局也肯定了对AI生成类二次加工创造的认可:当艺术家以创造性的方式选择、安排或修改 AI 生成的材料时,这类人工智能辅助作品可以注册版权。换而言之,AI直接生成的素材,则不被版权局认可。
但这也隐含另一难题,如何甄别AI生成与二次加工,二者之间又如何裁定。根据美国版权局声明,版权申请人必须声明其作品中是否使用了AI生成技术,已提交申请但缺少此声明的申请人必须进行修改。
目前国内著作权方面暂无AI相关说明。法学界尚未对于人工智能生成内容的可版权性分析及其权利归属问题达成共识,目前仍处于“技术跑在版权保护前面”的阶段。
时下,有关“AI让内容创作者失业”的讨论让人诚惶诚恐。论如何,如若洪流将至,没有人能独善其身,“打不倒就加入”。
不少漫画从业者指出,数据算法迭代可以输出更精确的图像,但无法准确输出“情绪张力”。AI无法像漫画家一样,故意夸张细节来刻画人物和情绪,微表情、景深、脚本等,那些属于艺术家的灵光乍现就是最无可替代的部分。
一些创作者们也正企图“去人工智能化”,通过反复“投喂”、优化文本和驯化逻辑,使作品摆脱人工智能的痕迹。
Rootport给出了一种更为自洽的观点:用AI搞创作好比用MIDI创作音乐。一个优质作品更像是“AI+HUMAN”琴瑟和鸣的产物。
AIGC改变了内容生产模式从而改变着职业环境,但这并不意味着作者们将沦为一个“文本熟练”的新型码字工,相反,时下乃至未来无疑都更需要创造力。
参考资料:
日本第一部人工智能漫画:机器魔术还是艺术威胁?TechCrunch:Science fiction publishers are being flooded with AI-generated stories标签: