テルアビブに拠点を置く「D-ID」は12月13日、テキスト、画像、アニメーションを1つのインターフェースで組み合わせた、初のマルチモーダルジェネレーティブAIに基づく動画プラットフォームをリリースした。このセルフサービス型動画プラットフォームは、D-ID独自のジェネレーティブAI技術と、オープンAIの「GPT-3」、Stability AIの「Stable Diffusion」を統合したもので、ユーザーが入力したテキストをもとに顔や音声をデジタル合成し、その顔をアニメーションとして動かしながら119の言語でテキストを読み上げるものだ。