こんにちは、荒井(@yutakarai)です。
Googleだけが機械学習に枝分かれしている唯一の検索巨人ではありません。
中国の検索エンジンBaiduは、AIシステムの開発にも大きく投資しています。
声を生成する
以下の図は、自然言語処理システムの重要な段階を示した図になります。
BaiduのR&Dラボで最も興味深い開発の1つは「Deep Voice」と呼ばれるものです。
「Deep Voice」は、本物の人間の発話と区別することが非常に難しい完全な合成人間の声を生成するAIシステムです。
「Deep Voice」は、アクセントや発音、声のピッチなどの音の持つ微妙な要素を「学習」して、スピーカーで声を正確に再現することができます。。
すごくないですか・・
「Deep Voice」技術の最新のモデルである「Deep Voice 2」は、音声検索や音声パターン認識システムの背後にある自然言語処理とも連携がされているそうです。
これは、リアルタイムの翻訳やバイオメトリックセキュリティなど、数多くの潜在的な用途だけでなく、音声検索アプリケーションにも大きな影響を与える可能性があります。
まとめ
今回紹介したBaiduが開発しているような生成モデルは、すでに信じられないほど説得力があります。
まもなく私たちは人間の声かAIが生成した声かを、区別することができなくなるはずです。
生成的なモデリングの改善は、音声だけでなく画像や、さらには人の持つ個性(アイデンティティ)さえももたらすことができるようになるかもしれません。
AI脅威論に踊らされるな。映画「ターミネーター」の世界はまだやってこない
こんにちは、荒井(@yutakarai)です。 以前こんなツイートをしました。 「AIに仕事奪われるぞー」ていうAI脅威論ってまぁわかるけど、煽りすぎるのもよくないよね。数年後にはターミネーターの世界になるんじゃないかって本気で誤解している...