「華爾街日報」報導,科技巨擘 Meta Platforms 正在開發一款以影像與影片為核心的全新人工智慧( AI )模型,內部代號為 Mango ,同時也在研發下一代、以文字為主的大型語言模型。
Meta 人工智慧長汪滔( Alexandr Wang )表示,這款新模型將於近期亮相,並與一款代號為 Avocado 的大型語言模型一同推出。
根據聽取相關發言的人士轉述,汪滔今天與 Meta 產品長柯克斯( Chris Cox )進行一場公司內部問答,談到這些 AI 模型。相關模型預計 2026 年上半年推出。
汪滔還表示,新一代文字模型 Avocado 的重點之一,是提升程式撰寫能力。
此外, Meta 正處於探索所謂「世界模型」( world models )的早期階段,這類 AI 透過接收視覺資訊來學習並理解所處環境。
Meta 今年夏天重組 AI 團隊,聘請了汪滔領導新成立的「 Meta 超級智慧實驗室」( Meta Superintelligence Labs )。
Meta 執行長祖克柏( Mark Zuckerberg )親自展開大規模招聘行動,從 OpenAI 挖角 20 多名研究人員,並組建一支逾 50 名研究員、工程師及其他 AI 專才組成的新團隊。
影像生成成為大型 AI 模型公司競爭中的關鍵戰場。 Meta 今年9月推出一款名為 Vibes 的 AI 影片生成工具,是與新創公司 Midjourney 合作開發。 Meta 發布 Vibes 不到一週後, OpenAI 也推出自家 AI 影片生成應用程式 Sora 。
谷歌( Google )今年稍早推出影像生成工具 Nano Banana ,帶動 Gemini 使用成長,月度活躍用戶數從7月的4.5億人,至 10 月底時已超越 6.5 億人。
在第三代 Gemini 於 11 月發布後, OpenAI 執行長阿特曼( Sam Altman )宣布公司進入「紅色警戒」狀態,隨後迅速推出新版 ChatGPT Images 影像生成產品。
阿特曼上週與媒體會面時,強調 AI 影像生成對消費者的重要性,表示這是許多用戶最感興趣的功能之一。
(新聞資料來源 : 中央社)
評論被關閉。