ホーム/AI用語集/マルチモーダル技術まるちもーだるマルチモーダルテキスト・画像・音声・動画を横断的に扱うAI。詳しい解説テキスト・画像・音声・動画など複数種類の入出力を扱えるAI。GPT-4oやGemini 1.5 Proが代表例。画像を見て説明する、音声で会話する、などが可能です。関連用語LLMLarge Language Modelの略。ChatGPTなどの大規模言語モデル。← 用語集トップに戻る