財聯社2月22日訊(編輯 牛占林)谷歌公司周四宣布,正在努力解決Gemini AI模型圖像生成功能最近出現的問題,在此過程中,將暫停人物圖像的生成,并在不久后重新發布改進版本。
此前一天,谷歌致歉稱,發現Gemini大模型在某些歷史圖像生成描述中存在不準確之處,功能沒有達到目標,正在努力進行改善。
近日以來,社交媒體上一直有人在抱怨Gemini的文生圖功能,如在以“美國開國元勛華盛頓”為主題的圖片中,出現了婦女和有色人種,但這是不正確的。
此外,當用戶讓Gemini生成納粹德國士兵時,Gemini生成了由黑人、亞裔和白人女性身穿納粹德軍制服的照片。
還有用戶抱怨Gemini不會顯示白人的照片。當Gemini被要求展示一張白人的照片時,Gemini表示它無法滿足這一要求。當被提示顯示黑人的圖像時,Gemini反而提出顯示“慶祝黑人的多樣性和成就”的圖像。
當被要求展示慶祝白人多樣性和成就的圖片時,Gemini表示,它對滿足這一要求“猶豫不決”?!皬臍v史上看,媒體報道壓倒性地青睞白人及其成就。這導致了一種扭曲的看法,即他們的成就被視為常態,而其他群體的成就往往被邊緣化或忽視。在這種情況下,只關注白人可能會使這種不平衡永久化?!?/p>
分析稱,這可能是對AI領域長期存在的種族偏見問題的過度糾正,即谷歌追求的“多元文化”。相較于以往的AI模型,Gemini在種族偏見問題方面進步了不少,但問題是“過度了”。
Gemini是谷歌規模最大、功能最強大的多模態人工智能模型,就在上周,該公司發布了最新一代AI模型Gemini 1.5,相較于去年12月發布Gemini 1.0,Gemini 1.5取得了飛躍式的發展。
谷歌Gemini的高級產品總監Jack Krawczyk表示,該公司的圖像生成能力反映了這家科技巨頭的“全球用戶群”,它會認真對待代表性和偏見?!癎emini的圖像生成確實產生了廣泛的人群,這通常是一件好事,因為全世界的人都在使用它,但它沒有抓住重點?!?/p>
本月早些時候,谷歌開始通過Gemini提供圖像生成服務,但在追趕微軟支持的OpenAI之際,新工具Sora的推出給了谷歌當頭一棒。Sora能夠僅僅根據提示詞就生成60秒的連貫視頻,震撼了整個科技圈。
據悉,OpenAI的Sora不僅能準確呈現細節,還能理解物體在物理世界中的存在,無論是畫面、景深還是運鏡,甚至是人物微表情、動物神態都已經足夠精彩逼真。