编者按:
科学创新和艺术创新有交叉和糅合的地方,最好的结果是二者良性互动发展,共同探索和揭示世界的内在秘密。有人说艺术和科学总在山顶相遇,其实艺术和科学从未分开过。随着不断迭代的算法和不断增强的算力,越来越多的艺术创作者意识到改变或许已经来临。
【资料图】
全文约1948字,建议阅读时间5分钟。
漫步于卢浮宫无数画作中,你是否期待一位画师为你记录下独一无二的瞬间,给这个世界留下一份凝视与回眸?走进国家图书馆浩瀚书海中,你是否期待有人陪你一同探索世界?意外闯进J.K罗琳创建的魔法学校,你是否期待有人为你递上魔杖让所有平面之物跃然纸上?
最新的人工智能技术正悄然将这一切变成现实,这些建立在数学基础上的抽象能力正成为人类拥有特殊技能的朋友,与我们共同追逐着未来的无限可能。
写实派画家——GAN
生成对抗网络(GAN/Generative Adversarial Networks) 就像这个时代的写实派画家,这位画家的大脑和画笔就是 Generator 和 Discriminator 两个网络。在实际使用过程中,我们提供真实输入后,它会在Generator中生成假图片并在Discriminator中和真图做对比。起初,Discriminator很容易分辨真假图片。但随着Generator通过Discriminator的反馈不断优化生成的图片,分辨难度不断提升。最终,当Discriminator没办法分辨真假时,假图片就作为最终产物出现在了我们面前。
自诞生以来,生产对抗网络就在 鸟类、花卉 等图片的生成上不断展现出惊人的能力,而其生成的足以乱真的人脸照片和根据文本描述生成的照片,已经成为设计师必备的工具:前者可以作为素材库让设计师轻松积累素材,后者则能帮助设计师可以快速定向获取设计灵感来源。
印象派画家——VAE
除了“写实派画家”生成对抗网络,人工智能领域也有“印象派画家”—— 变分自编码器(VAE,Variational Auto-encoder) 。不同于生成对抗网络,变分自编码器在获得输入时会先用“ 取色器”(编码器,encoder) 提取画面的重要信息,并以此为核心拓展范围。例如,编码器取“红色”后会将该信息扩大到“红色系所有颜色”,再将这些扩大后的信息作为生成元素,举一反三生成更多新数据。
目前,这位AI时代的“梵高”已经在包括 图像和音频合成 等领域找到了施展空间。由于举一反三的属性,变分自编码器生成的新数据具有更好的 扩展性 和 多样性 ,也更方便地设计师对这些数据做定向调整,从而将更符合预期的数据存入素材库作为灵感来源。
语言课代表——BERT
如同机器将图片依性质拆解为RGB等数值后才能理解图片一样, BERT(Bidirectional Encoder Representations from Transformer) 也依据对文本的拆解在纷繁的语言世界中找到了梳理脉络、理解奥秘的方法。
我们可以将BERT理解为做英语试卷的考生,第一道题“ MLM(MASKED LANGUAGE MODEL) ”类似完形填空,我们给BERT的语料库会随机遮挡15%的词语,让BERT根据上下文猜测空缺部分从而训练其了解不同语境下的词语运用,进而更准确的对语义做出理解。第二道题“ NSP(NEST SENTENCE PREDICTION) ”会给到成组的句子,让BERT判断两个句子是否连续以及句子间的关系。有了这些基本能力后,我们只要增加输出层训练就能将BERT应用到不同场景。
目前,诞生不到五年的BERT已经可以和 阅读理解、搜索与信息检索 结合起来,帮助设计师将 多轮对话 等场景变成现实。除此之外,BERT还能利用其理解学习能力在长文本中提取出重点内容信息,让人们可以更高效地理解文本。
让二维变立体的神奇魔杖——NeRF
在更高维度上应用人工智能技术的努力从未停止, 神经辐射场(NeRF,Neural Radiance Fields) 的脱颖而出因此并不意外。神经辐射场能将图像分为3个空间位置向量和2个相机观测向量,在此基础上输出 体密度(volume density,可以理解为透明度) 和基于观测角度的物体空间点色彩,完成从“ 空间点位置+观测角度 ”到“ 空间点色彩+体密度 ”的映射。
在三维空间重建二维图像具有广阔应用前景。它能帮我们准确快速建立数字人体,从而成为数字人领域重要的建模工具;它也能运用到自动驾驶行业,让现实路况和虚拟情况实时融合,为自动驾驶提供天气和雨雪等场景数据,让设计师围绕人车交互进行更准确的设计思考。
技术从不抽象,它们总能直观地刺激我们的感官、激发我们的想象力。伴随着代码的迭代,技术终将以更加具象的形式成为我们的朋友。我们也将与它一同探索未知并阐述理解、思考艺术并定格瞬间,突破边界并一同走进那个虚实融合且酝酿着无数可能的“魔法世界”。
标签: