OpenAI發表更新版圖像模型 支援多語言文字呈現
OpenAI 21日發佈新版圖像生成模型ChatGPT Images 2.0。(擷自OpenAI官網)
OpenAI週二(21日)發佈人工智慧(AI)影像生成模型的更新版本:ChatGPT Images 2.0。公司表示,使用者利用新版能夠建立更精確且複雜的圖表與科學示意圖,還能產生更貼近多種風格的視覺內容,並支援多語言文字呈現。
OpenAI說,ChatGPT Images 2.0圖像模型在迴應使用者前,進行更長時間的運算,讓系統能搜尋更多線上資訊,深入思考如何構建圖像。新模型將提供給付費用戶使用。
這是OpenAI致力提升產品對專業人士吸引力的一環。公司現在的產品策略是簡化產品線,在企業市場上與競爭對手Anthropic抗衡。同時,也爲最快可能在今年實現的首次公開發行股票(IPO)鋪路。
OpenAI先前關閉了Sora AI影片生成工具,但理解圖像生成工具的價值。負責ChatGPT Images 產品團隊的Adele Li本週向媒體簡報時就表示,圖像生成是人們使用AI的「核心」需求。
OpenAI指出,目前每週有數億活躍用戶透過ChatGPT製作圖像,每週生成的圖像數量超過10億張。
Adele Li表示,OpenAI生成圖像的版面具有良好結構,製作複雜的科學圖示已有顯著進步。這些性能的提升,相信在教育工作者、科學家及家長等族羣中,更具實際應用價值。