MiniMax 推出 Hailuo 視訊代理和語音設計,擴展其多模態 AI 功能
簡單來說 MiniMax 結束了為期一週的產品發表會,推出了由人工智慧驅動的視訊創作工具 Hailuo Video Agent 和多語言文字轉語音產生器 Voice Design。
中國人工智慧公司 極小 宣布已推出 Beta 階段的 Hailuo 視訊代理。這款由人工智慧驅動的應用程式只需單擊即可將基本的文字或圖像提示轉換為簡短、高品質的影片片段。它利用逐幀實體模擬、基於動作的提示和多模態解析等先進技術,以易於理解的格式提供創意的影片內容。
這次 Beta 版發布標誌著該產品開發之旅的開始,引入了旨在激發創意的早期創意功能,標誌著 AI 視訊生成新時代的開始。
該平台允許用戶選擇喜歡的創意代理風格,用簡單的語言描述他們的想法,而無需任何技術知識,然後收到由海螺代理生成的完整渲染、精美的影片。
Hailuo 視訊代理的開發分為三個不同的階段。第一階段包含預置的視訊代理模板,只需一個命令即可將用戶提交的文字或圖像生成高品質、富有創意的影片。
第二階段將引入半客製化影片代理,讓使用者可以修改影片創作流程的各個方面,包括腳本、視覺效果和畫外音。第三階段將推出一個完全自主的端到端視頻代理,能夠將創意輸入轉化為最終剪輯的視頻,且無需過多的人工幹預。
MiniMax 表示,它打算在夏季逐步實施代理創建工具的第二階段。
此外,MiniMax 還推出了 Voice Design,這是一個先進的零樣本文字轉語音模型,利用可學習的說話者編碼器,無需轉錄即可準確複製參考語音的音色。該技術可實現高品質且富有表現力的語音合成,包括一次性語音克隆功能。它支援 32 種語言的輸出,並提供情緒調節和專業級語音客製化等先進功能,體現了多語言和自適應語音生成領域的重大進步。
MiniMax推出MiniMax-M1 LLM和Hailuo 02視訊模型
MiniMax 是一家人工智慧新創公司,被認定為中國傑出的新興人工智慧公司之一。該公司專注於開發涵蓋文字、語音、圖像和視訊生成的大規模多模態人工智慧系統,其中包括其海螺視訊模型。
其基礎設施支援數十億個文字標記和數百萬個影片片段的生成。 MiniMax 得到了阿里巴巴、騰訊和 IDG 等重要投資者的支持,並躋身中國高成長人工智慧新創公司之列,這些企業通常被稱為“小龍”,在過去一年中吸引了大量風險投資。
上週,該公司推出了多項新技術,包括名為 MiniMax-M1 的大型語言模型 (LLM)。該模型據稱比中國其他專有模型更有效率,據報導在多項基準測試中均超越了 DeepSeek 的 R1-0528 模型。此外,MiniMax 也推出了其視訊生成工具的新版本。 海螺02號 ,它提供原生 1080p 解析度、提高對使用者指令的遵從性以及增強模擬複雜物理環境的能力。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
Bitget 現貨槓桿新增 LA/USDT!
AINUSDT 現已上架合約交易和交易BOT
Bitget 發布 2025 年 6 月份保護基金估值報告
關於 Bitget Token(BGB)2025 年第二季度燒毀的公告
加密貨幣價格
更多








