杜克大學研究人員開發了壹種新的人工智能工具,稱之為 PULSE(Photo Upsampling via Latent Space Exploration,通過潛在空間探索的照片上采樣),這款工具可以將模糊的、無法識別的人臉圖像經由計算機生成高清晰度肖像,細節更加精細。
以前的方法可以把人臉圖像放大到原始分辨率的8倍,但是杜克大學團隊想出了新的方法,利用少量像素即可創造出分辨率高達原始64倍的逼真面孔,合理填補出原本不存在的細紋,睫毛和須發等特征。
他們的 AI 工具會「想象」出壹些原本不存在的特征,即使是原本 LR 照片中無法看到的細節,比如毛孔、細紋、睫毛、頭發和胡茬等,經過其算法處理後,都能看得壹清二楚。
來看壹個具體示例:
領導該團隊的杜克大學計算機科學家辛西婭·魯丁(Cynthia Rudin)說:「以前從來沒有像現在這樣,能用這麽少的像素,就創造出擁有大量細節的超分辨率圖像。」
在實際應用方向上,論文的***同作者 Sachit Menon 介紹稱:「在這些研究中,我們只是用面部作為概念驗證。
但從理論上講,該技術是通用的,從醫學、顯微鏡學到天文學和衛星圖像,都可以通過該技術改善畫質。」
打破傳統操作,實現最佳效果
傳統方法是在獲取壹幅低分辨率圖像後,通過嘗試使它們與計算機以前看到的高分辨率圖像中的相應像素平均匹配來“猜測”需要額外的像素。由於這種平均匹配,頭發和皮膚中的紋理區域可能無法從壹個像素到下壹個像素完美地排列,最終看起來模糊而且失真。
因此,杜克大學的研究小組想出了不同的方法,這套系統不會先獲取壹張低分辨率圖像然後慢慢增加細節,而是會破壞人工智能生成的高分辨人像樣本,在縮小到相同大小之後,盡可能尋找與輸入圖像相似的面孔。
研究團隊主要使用了“生成式對抗網絡”這種機器學習工具,這是近年來復雜分布上無監督學習最具前景的方法之壹。模型通過框架中(至少)兩個模塊:生成模型(Generative Model)和判別模型(Discriminative Model)的互相博弈學習產生相當好的輸出結果。簡單來說就是壹組算法產生壹張圖像,另外壹組算法來判斷這種圖像是真還是假。如果判定為假,算法就會重新生成圖片,壹旦判定為真,開發人員就會檢查結果,以確定算法是否需要調整。
這套系統可以在幾秒鐘內將壹張16*16像素的人臉照片轉換成1024*1024分辨率的圖像,低分辨率圖像中晚期無法辨認的細節,在新的版本中都變得清晰可見。