Яндекс Метрика

// аудио

ИИ-модели в домене: аудио.

Языковая модель, Мультимодальная модель, Аудио03.06.2026
Gemma 4 12B
Google DeepMind
Генерация текстаОтветы на вопросы
Языковая модель, Мультимодальная модель, Аудио, Видео11.05.2026
TML-Interaction-Small
Thinking Machines
Генерация текстаЧат-бот
Аудио23.04.2026
Grok Voice Think Fast 1.0
xAI
Speech-to-speech
Аудио15.04.2026
Gemini Flash 3.1 TTS
Генерация аудио
Языковая модель, Мультимодальная модель, Компьютерное зрение, Аудио29.03.2026
Qwen3.5-Omni-Flash
Alibaba
Генерация текста
Языковая модель, Мультимодальная модель, Компьютерное зрение, Аудио29.03.2026
Qwen3.5-Omni-Plus
Alibaba
Генерация текста
Генерация изображений, Видео, Аудио12.02.2026
Seedance 2.0
ByteDance
Генерация видеоГенерация аудио
Аудио25.09.2025
Suno v5
Suno
Генерация аудио
Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио, Математика01.08.2025
Gemini 2.5 Deep Think
Google,Google DeepMind
Генерация текстаMathematical reasoning
Аудио20.05.2025
Lyria RealTime
Google DeepMind
Генерация аудио
Аудио14.04.2025
DolphinGemma
Google DeepMind,Georgia Institute of Technology,Wild Dolphin Project
Генерация аудиоРаспознавание речи
Аудио27.03.2025
CassetteAI
CassetteAI
Генерация аудио
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение27.03.2025
GPT-4o (Mar 2025)
OpenAI
Чат-ботГенерация изображений
Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео, Аудио, Распознавание речи26.03.2025
Qwen2.5-Omni 3B
Alibaba
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео, Аудио, Распознавание речи26.03.2025
Qwen2.5-Omni 7B
Alibaba
Генерация текстаОтветы на вопросы
Видео, Аудио06.03.2025
Character-3
Hedra AI
Генерация видеоText-to-video
Видео, Компьютерное зрение, Аудио13.02.2025
OmniHuman-1
ByteDance
Генерация видеоImage-to-video
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение29.01.2025
GPT-4o (Jan 2025)
OpenAI
Чат-ботГенерация изображений
Мультимодальная модель, Языковая модель, Распознавание речи, Компьютерное зрение, Видео, Аудио26.01.2025
Baichuan-Omni-1.5
Baichuan
Генерация текстаОтветы на вопросы
Аудио, Языковая модель, Распознавание речи, Мультимодальная модель19.12.2024
Typhoon2-Audio
Typhoon / SCB 10X
Генерация текстаSpeech synthesis
Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио11.12.2024
Gemini 2.0 Pro
Google DeepMind
Генерация кодаГенерация текста
Языковая модель, Компьютерное зрение, Аудио, Распознавание речи, Видео, Мультимодальная модель11.12.2024
Gemini 2.0 Flash
Google DeepMind,Google
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Аудио25.11.2024
Fugatto 1
NVIDIA
Генерация аудио
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение20.11.2024
GPT-4o (Nov 2024)
OpenAI
Чат-ботГенерация изображений
показано 24 из 61