97ai:阿里达摩院用AI“抄”了20万页古书 迎接海外

 2021-07-08 11:10    77  

视频加载中...

封面新闻记者欧阳宏宇一批离家百年、去国万里的中文古籍善本回来了,这次是以数字化的形态97ai。5月18日,“汉典重光”海外古籍数字化回归发布会在中国科技馆举行。一批珍藏于加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,落地汉典重光古籍平台。借助阿里达摩院的技术,首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,公众可通过汉典重光平台翻阅、检索古籍。据悉,达摩院AI对20万页古籍的识别准确率达到97.5%。缺少系统性整理海外古籍仍颠沛流离中国古籍虽然其体量巨大,但大量古籍因各种原因散佚流失海外。据联合国教科文组织调查统计,目前在全球200多座博物馆中,记录在案的中国文物有167万件,其中包括大量古代典籍文献。“十三五”期间,国家确定将《海外中文古籍总目》作为古籍整理出版工作的重点之一,大量流播海外的中文古籍也在以影印出版、购买等形式源源不断“回家”。但出版界、图书馆界、学术界等多头出击,工作分散,且开发利用上存在重复浪费、质量不高等问题,导致海外中文古籍的回归之路充满荆棘。“如果不能系统整理文献,就不能在前人基础上研究。”据国家图书馆副馆长张志清介绍,如今的古籍发布还受传统藏书楼等旧观念制约,国家图书馆在网上发布的7.2万册古籍检索还远远不够。“顺应时代,需要科技企业利用大数据、云计算和AI等技术形成结构化、标准化、可视化的平台型服务。”海外古籍回归技术充当“数字化保镖”2019年,阿里巴巴和四川大学提出“数字化回归”设想,四川大学历史文化学院王果副院长与该院教授、中央文史研究馆馆员陈力牵线搭桥,沟通北美、欧洲、日韩等地藏书机构,获得加州大学伯克利分校支持,达成共识,将伯克利东亚图书馆的中文古籍善本逐步数字化,其中的很多都是消失多年后重回公众视线的珍本。据阿里巴巴达摩院院长张建锋介绍,达摩院技术团队与四川大学专家联手研发了一套全新的古籍识别系统。利用单字检测、无监督单字聚类、小样本学习、主动学习等机器学习方法,构造了一套边识别古籍、边训练模型的系统,以97.5%的准确率完成对20万页古籍的整体识别。比起专家录入,这套人机交互的识别系统将效率提升了近30倍,还可自我进化,不断提升准确率和效率。张建锋表示,阿里计划将古籍数字化技术工具同平台一并捐赠给权威公共机构,并持续投入人力物力。科技的最高境界,就是用来理解文化,文物古籍无论修复还是合理使用再也经不起等待。“古籍平台要完全发挥作用,应成为一个知识工具。”参与了平台搭建的四川大学历史文化学院教授陈力认为,平台已解决了查询古籍,保护原件,和古文字识别的问题。他希望有更多力量参与中国古籍的保护和传承,让更多普通人有机会接触古籍、使用古籍,让所有蒙尘的古籍重焕新生,让书写在古籍里的文字活起来。

AI全自动生成二次元妹子?网友:人人都能定制二次元老婆

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

在游戏市场愈发精品化的现在,一款游戏除了玩法的创新97ai、优秀的世界观故事,最开始玩家能够接触了解到,也是最直观能够展现游戏素质的元素就是美术风格,对于部分玩家而言,甚至可能是某一特定角色的立绘。优秀的美术也是为什么很多二次元游戏如此受玩家欢迎的原因之一。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

但美术对于很多技术出身的开发者而言却并不算易事97ai,优秀的美术设计对于本就资金紧张的小团队而言更是一笔不小的支出。但是有问题就会有解决方案。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

近日日本科技公司Preferred Networks(后文简称PFN)旗下的CryPko团队在官网上更新了他们产品最新的成果:由人工智能生成的“立绘级”二次元人物。虽然团队目前还没有放出具体的商业化方案,只是有效果图,但是从质量上来看已经可以和很多游戏里的人物一较高下了。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

PFN这家公司GameLook之前曾报道过,他们主要从事物联网方向“深度学习”的研究,公司在人工智能的方向上已经取得了不少的成果,机器人装机量世界第一的日本企业发那科(FANUC)以及丰田汽车都和他们有合作关系。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

而CryPko就曾因为将人工智能和区块链两大技术联合起来,将所有二次元形象,以ERC721的形式,永久地印在了区块链网络上引发过媒体的关注。在当时,CryPko展示出来的技术还只是处于“做个二次元头像”的水平,此次的效果图可以说是在沉寂一段时间后放出的大招。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

生成对抗网络GAN

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

近些年来,其实用AI作画或者是自动生成角色已经不是一项陌生的技术了,在去年日本游戏开发者大会CEDEC2020上,《怪物弹珠》的开发商Mixi就展示了自己的CreativeAI生成游戏中的角色,虽然同样尚在研发之中,但是这项技术在未来对生产力的提升,对于游戏的长期开发和运营的意义,也同样得到了Mixi方面负责人的肯定。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

包括CryPko、Artbreeder等众多项目在内,利用人工智能生成图像的技术通常都基于同一个机器学习的方法,那就是生成对抗网络(GAN,全称:Generative Adversarial Network),该方法由伊恩·古德费洛等人于2014年提出。生成对抗网络由一个生成器与一个判别器组成。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

生成器 (Generator)通过机器生成数据,目的是“骗过”判别器,判别器 (Discriminator)判断这个数据是真实的还是由机器生成的,目的是找出生成器做的“假数据”,GAN正是通过让两个神经网络相互博弈的方式进行学习。

OTdhaTrpmL/ph4zovr7mkanpmaLnlKhBSeKAnOaKhOKAneS6hjIw5LiH6aG15Y+k5LmmIOi/juaOpea1t+WkluWPpOexjeKAnOWbnuWutuKAnQ==

两者间的博弈类似于警察和小偷

简单来说就是,首先判别器前期通过学习和训练,已经有了一部分辨别真假的能力,但是并不强。这时候我们将生成器制造的假数据提供给判别器进行判断,经过不断地训练后,根据判别器的结果反馈,生成器的能力也会越来越强。

一段时间后生成器的能力,就会超出判别器的水平,判别器失去了作用。这个时候就需要开始训练判别器,同样地经过一段时间的学习和训练,判别器的鉴别能力进一步增强,生成器的假数据又无法骗过判别器了,两个网络之间就进入了新一轮的循环。

在经过前面两道程序的不断重复之后,不论是生成器还是判别器此时的水平都已经非常高了,最终通过了判别器的判别,成功输出的结果也将更加接近于真实。

GAN这种将博弈论引入机器学习的做法,事实证明它对于机器的无监督学习,甚至是半监督学习、完全监督学习都有着正面作用。目前GAN被主要用于生成以假乱真的图片、生成影片、三维物体模型等领域,包括抖音的漫画滤镜、之前大火的“FaceApp”等,都利用了这种方法。

在2019年,生成对抗网络甚至成功地模拟了暗物质在太空中特定方向的分布,并预测了将要发生的引力透镜。

AI生成的假照片

虚拟偶像的工业化制作

在经过长时间的训练之后,CryPko已经有了长足的进步,并且不仅仅是从生成头像变为了半身像,在日本的二次元盛会Comic Market97上,CryPko曾经展示过两个新功能,一个是用户通过鼠标或者数位板修改各个部位的形状时,这些变化将即时地反映到 Crypko 生成的角色上,利用该系统,用户不需要绘画基础即可进行角色插图设计。

另一个则是利用深度学习技术,将插图自动分成可动的部位,不需要再手动添加骨骼,从而可以利用 E-mote™ 动画软件为角色添加动画。

对于CryPko,PFN在今日也成功将其使用在了自己新的企划当中,PFN联手唱片公司以及动画公司,为日本虚拟歌手HACHI制作了一个近两分钟的MV,MV当中角色的面部表情、角色的发型包括服装都是在 HACHI此前的官方形象上,通过CryPko自动生成的,因此HACHI在新的MV当中整个人的风格也有了一定的改变。

左:MV中形象 右:原版形象

画师的内卷竟然来自AI

在机器不断 “取代”各行各业的工作的时候,作为典型的创意领域,美术作为一个极具主观色彩,包含创作者个人情感和意志的行业,即使在同为创意产业的写作、作曲等被AI拿下的时候,作画却一直都是机器几乎不可能逾越的大山,但是CryPok以及Mixi的CreativeAI都在向我们展示另一种可能。

当然AI进入这一领域自然可以大幅度提高内容的生产效率,单单从目前CryPok展示的成果以及PFN新的企划来看,只需要通过CryPok生成角色形象,然后进行细节的修改,利用上文提到的方法以及PFN 6个小时完成 200件以上的3D模型化的技术,批量生产内容,这些都将大大提高动画等作品的制作效率。

并且这一技术对小型独立游戏开发团队而言,也将是福音,既能批量产出角色立绘甚至是游戏场景,即使最终产出的内容有穿模或者细节上的瑕疵,需要后期调整,这种批量生产的模式也将大大降低游戏的美术成本,保证游戏中人物立绘和美术质量的稳定性。

日本ACG内容众包公司WHOMOR先前在接受日媒采访时就曾表示:“使用CryPko生成的画面本身就已经被分成了数个部分,再使用PFN提供的工具,就能很轻松地和M2的Emote动画工具进行联动,制作出动画。在他们的工作中,有30%到40%的内容最终都可以通过AI来完成。”

但即便如此,GameLook依然坚定认为,实际上事实也证明了,AI在很长一段时间内在创意领域都不会也无法取代人脑,而是作为美术、作曲等人的辅助工具。

最简单的一点就是AI短期内无法形成独立的审美和风格。以美术为例,虽然经过训练,它可以产出精致的立绘,但是目前包括CryPok在内的所有AI,从GAN的逻辑来看,更多的是对真实的仿照和模拟,它无法生产出具有个体特色的内容,更不用谈审美这种本就因人,因场合而异的层面了。

画面的创造性来源于画师的个人意志,即使是商业作品,美术作品中最具有价值的部分依然是其中融合的情绪和思想,以及审美情趣。虽然绘画中有很多重复性的基础部分是非常有规律的,这一部分也是机器可以替代的,但是缺乏创造力和情感也就意味着机器人与创意领域之间的鸿沟,暂时依然无法被逾越。

对于非专业人士或者是小团队而言,这项技术,包括未来AI的发展将为它们带来巨大的红利,与此同时对于专业人士而言,在很长一段时间内,AI依然只是一种工具而已,灵活地利用工具只会提高自己的效率以及作品的质量,就像WHOMOR的董事齐藤隼大所说的:

“在技术不发达时,摄影也是一件十分需要技巧的事,而随着技术的发展,现在不懂摄影的人也能够用智能手机拍出精美的相片,AI在绘画领域的应用最终可能也会如此。”

本文标签:

原文链接:https://www.xgfox.com/bcrm/626.html

本文版权:如无特别标注,本站文章均为原创。