フトンナイズ

布団にだって知能があるかもしれないでしょう.

fakeapp / deepfakersの技術背景をメモする

最近、redditでfakeappもしくはdeepfakesという動画の自動顔合成器みたいなやつが流行っている。

fakeapp自体はredditのスレにチュートリアル付きで上がっている。
スレッドいろいろ見て回るのはいいけど、ネタがネタだけに超閲覧注意。
こういうネタ、はてなには向かないので、リンクは貼らない。興味あればご自分で検索してほしい。

最近は、OpenPoseの顔特徴点抽出器でも70点くらいそこそこ速く取れてしまうし、Menpoプロジェクトも充実してきたので、顔のアラインも含めて顔まわりの処理はかなり実用性高いところまで来ているのだろう。
(faceappはdlibで顔を取ってきているんだけども。OpenPoseにしたら適用できる画像の幅は増えそう)

keras実装のコード自体も公開されているようで、ちゃんと読みきれてないが、意外と層が深くないCNNのautoencoderというかencoder+decoderモデルっぽい。
GANじゃないのが意外かもしれないが、そこそこデータがあるケースでないと上手く行かないのではないかと思うし、時系列方向に整合性ある内容を出力させるにはちょっと工夫が必要だ。
一応、PRで議論されているようではある。

人間、こういう面白い道具が出ると真っ先にエロに使うわけだが、他にも使いみちがありそうと思ったり。
そもそも、顔を自在に操りたいよねみたいな研究はいくつかある。表情を転写したり、顔を入れ替えてみたり、RGB画像から3D顔モデルを出してみたり。

www.youtube.com

人の顔じゃなくても良くない?っていう話は出るけど、 やっぱり人の顔まわりのアライメントや検出技術は非常に長い歴史の積み重ねがあるので、真っ先にという感じだろうか。。。