IA Multimodal: Combinando Texto, Imagem e Áudio