GPT-4o是進一部發展已問世一年多的GPT-4模型。OpenAI技術長穆拉蒂(Mira Murati)表示,本次更新使得模型能夠以更精細的方式處理圖片、影音短片與文字,並且可以通過語音與使用者進行即時互動。與當前市面上的語音助理不同,使用者可以在與新的語音功能交談時隨時打斷它,而且新模型幾乎可以即時回應。
OpenAI的主管們在發表會上展示了這款新模型的多項功能,包括程式碼分析、語言翻譯、解決數學問題等,而且所有這些功能幾乎都是即時完成的。這項更新的推出正值Google即將舉行年度開發者大會之際,OpenAI這一舉措被視為對競爭對手的回應。
除了功能的增強外,GPT-4o還新增了可以透過語調或臉部表情來偵測使用者情緒的功能。它還能夠在不同的情緒語調之間快速轉換,例如從戲劇化的聲音轉換成機器人聲調,甚至是唱歌。這些功能將在數週內提供給每月支付20美元費用的ChatGPT-Plus付費用戶使用。
值得一提的是,OpenAI表示,雖然GPT-4o的速度是目前其最高級產品GPT-4 Turbo的兩倍,但其價格卻只有後者的一半。同時,所有使用免費版本ChatGPT的用戶都將可以使用GPT-4o中的圖像與視覺功能。
OpenAI的執行長奧特曼表示,公司正在努力開發下一代AI模型,並將會比GPT-4o更加出色。儘管外界預期這一新模型可能會在2024年上半年推出,但OpenAI並未對此進行確定性的回應。