您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 河池分类信息网,免费分类信息发布

谷歌AI神技:大脸畸变一键还原,拍照无需C位,实时运行无PS痕迹

2019/7/25 23:05:19发布165次查看
栗子 发自 凹非寺
量子位 报道 | 公众号 qbitai
真令人脸大。
合照的时候,没有谁喜欢站在最边上。
因为脸会被镜头无情地拉扯,不止变得宽广,还会有些歪斜:
△ 97°视场角
不过,谷歌刚刚推出了一门法术,可以让广角照片里的人脸,不用再扭曲变形:
左一的妹子,右一的妹子,脸型都显得更加对称自然了。
那么,增加一波难度。
带上墨镜,带上帽子,拉长的脸依然可以复原:
△ 103°视场角
用手挡住半张脸,ai还是没有被迷惑:
△ 103°视场角
不止是这样,ai把人脸调正的同时,也不会扭曲了背景。
比如下图,中间是dxo viewpoint的人脸修正,后面的栏杆被挤成了一条弧线;而右边是谷歌算法,修好了人脸,栏杆依然直挺:
团队说,整个修复过程都是ai自动完成,并且在移动端也可以运行。
这只善良又聪颖的ai,登上了顶会siggraph 2019。
也在reddit论坛收获了1.9k的热度:
有人说,pixel的广角前置镜头已经用上了这个算法,拍完之后点开照片预览,发现自己的脸已经收窄了。
现在就来看看,人物和背景,到底是怎样兼顾的吧。
互补才是完美谷歌说,从前想要纠正镜头畸变,总是需要职业的修图士。
因为,让机器自动完成的话,常常是修好了一处扭曲,又制造了另一处新的扭曲。
不过,团队也正是从这些不完美的算法之间,发现了新世界的大门:
先看透视投影 (perspective projection) 。从一个投射中心出发,把一个3d物体投在2d表面上。忠于透视原理,近大远小。
这种投影一定有失真,比如站在边上的人,离投射中心比较远,脸就大了起来。不过,它拉伸的主要是人脸,背景并不容易发生扭曲。
而球极平面投影 (stereographic projection) 就不同了。把一个球面投射到平面上,并不忠实反映距离,却十分忠实地反映角度。就像这张地图。
这种投影也一定有失真,但对一张照片来说,主要是背景里的直线会变弯,而人脸不易被拉伸。
如此说来,两种投影愉快地互补了。
观察到这个美丽的现实,研究人员当然要把它们的优点,用优雅的方式结合起来。
一句话概括,就是让透视投影去处理背景,球极平面投影去处理局部 (人脸) 。
当然,要让两种原本冲突的投影方式和平共处,并不是一句话的事。具体说来:
△97°视场角
输入的照片如上,已经先用透视投影处理过。
第一步,找出目标区域:人脸,包括头发。
这里,要用人物分割算法,给输入图像里的人类做个mask;再用人脸检测器,标出脸部的边界框。最后,把mask和边界框的交集,用绿色标注出来。
第二步,为输入的 (透视投影) 照片,算出一个球极平面投影。
如果把这个投影可视化,会发现边角的人脸已经修好,只是背景里,左边的窗棱和右边的墙弯了 (下图) 。
所以就有了关键的下一步:
第三步,用上前两步的数据,算出一个网格 (mesh) 。这个网格依然是做球极平面投影,但只要调整人脸区域,背景尽量保持原样。
为了不影响背景,这里用到了能量最小化 (energy minimization) 方法,来平息两种投影之间的冲突,促成更加平滑的过渡。
这样,就有了一个兼顾人脸和背景的、优化过的网格:
第四步,用这个网格来捏那张输入的照片,得到的就是最终答案:
右下角的人脸自然了,背景里的直线也还是直线。
团队说,这个方法可以胜任70°-120°的视场角。
并且,几乎不受场景的限制:
单人自拍可以,多人合照可以。
△ 103°视场角
△ 97°视场角
室内户外都表现稳定;光线明暗也不影响ai的发挥。
△ 114°视场角
除了开头提到的帽子、墨镜、手遮脸,这些没有难倒ai的因素之外,脸朝侧面也不会给算法造成困惑。
△ 103°视场角
还要注意的是,团队是为了移动端的应用,才开发了这只ai。它的运行速度,足以支持手机上相机app的正常交互:即时修图,即时分享。
如果说有什么缺憾,大概就是在捏脸的同时,还不能把身体一起捏好。
而人在角落,身体也可能被拉伸,如果只把脸修到正常的形状和大小,身体有时候就显得太大:
即便这样,ai也已经满足了广角人像拍摄的大部分需求。
大家一起自拍的时候,就算拿着手机的那个人是你,也不用再担心自己的脸被拉宽拉长了。
三个少年ai的爸爸,三位谷歌少年,全部来自宝岛。
一作名叫施易昌 (yichang shih) ,本科念台大,硕博都在麻省理工,实习经历遍布adobe、谷歌研究院、微软研究院等等。
2015年,从闪耀的csail实验室拿到博士学位,如今已是谷歌的高级软件工程师 (senior software engineer) ,主攻移动设备上的计算摄影。
二作是赖威昇 (wei-sheng lai) ,本科硕士都在台大,现在是加州大学默塞德分校博四的学生。曾经在adobe和英伟达实习,不久前刚刚结束在谷歌作为学生研究员的历程。
三作叫梁家恺 (chia-kai liang) ,本科和博士都在台大。2008年博士毕业,现在是谷歌的高级专家软件工程师 (senior staff software engineer) 。
one more thing虽然,三位作者里有两位都曾经在adobe实习。
但这支团队孕育的ai,画风温柔善解人意。
比起一周前adobe发布的“反向ps”利器,那只能把p过的美照打回原形的ai (如下) ,这广角人像的修复师ai,大概算得上爱的奉献了。
论文传送门:
l
与前人算法比较:
l
与市面产品比较:
l
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(qbitai)对话界面,回复“招聘”两个字。
量子位 qbitai · 头条号签约作者
追踪ai技术和产品新动态

河池分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录