儘管每個朋都有新LLM模型出現,但影響力卻不聲稱「無限制」的FLUX,在監管遠遠未能追上的情況下,大家惟有自求多福。
去年曾經有一段時間出現大量假新聞圖片,如教宗方濟各穿著白色羽絨便證實為人工智能假照片,結果各大平台禁止名人、品牌等的圖片生成。然而,XAI公司推出的Grock 2和Black Forest Labs開發的FLUX。這些模型不僅在性能上表現出色,更因其幾乎無限制(uncensored的內容生成能力引起廣泛關注。
Grock 2集成到X平台,在聊天機器人競賽中表現出色,超越了其他大型語言模型。它能夠生成幾乎不受限制的圖像和文本,包括一些具有爭議性的內容。例如,有用戶生成了穿著內衣的Taylor Swift和手持刀具的Barack Obama。這種無限制的特性在公共平台上推動了AI創作的邊界,引發了對AI倫理和社會影響的深入討論。
FLUX則是一個新興的AI圖像生成工具,由Black Forest Labs開發。FLUX團隊包括幫助構建Stable Diffusion的成員,他們開發了三個模型:Flux One Schnell(最快速模型,適用於本地開發和個人使用)、Flux One Dev(中級模型,用於非商業應用)和Flux One Pro(頂級模型,用於企業解決方案)。FLUX在某些方面表現出色,特別是在真實感圖像和文本生成方面。與Mid Journey相比,FLUX在生成真實感圖像方面不相上下,並且在文本生成(如標誌和模因)方面表現更佳。FLUX的一個顯著優勢是其提示詞遵從性,能夠捕捉提示中的所有元素,這是Mid Journey常常忽略的一個方面。雖然FLUX目前無法生成NSFW(不雅、淫褻)內容,但由於其開源性質,理論上用戶未來可能會生成此類內容。此外,FLUX計劃在未來成為一個文本到視頻的模型,這將進一步擴展其應用範圍。
大公司的AI創新
雖然我們可以用Poe、ChatGPT等手機應用程式,然而Google發布了新一代Pixel 9智能手機,搭載多項AI功能。其中最引人注目的是Gemini Nano大型語言模型,它能夠在移動設備上實現每秒45個標記的輸出速度,這在移動AI領域是一個重大突破。Google還推出了Gemini Live語音助手,作為對GPT-4語音助手的回應。新的Pixel手機還具備許多AI驅動的功能,如通話記錄和摘要生成、智能截圖、照片放大優化等。這些功能大大提升了用戶體驗,展示了AI在日常生活中的實際應用價值。Google推出了新一代AI耳機Pixel Buds Pro 2,專為與AI助手Gemini進行長時間對話而設計。在圖像生成領域,Google發布了Imagine 3模型,並在其Image FX平台上開放測試。將來AI裝置將會人人手執一部。
AI工具的普及與改進
Midjourney引入了新的網頁編輯器,允許用戶直接在平台上編輯圖像。OpenAI發布了GPT-4的更新版本,雖然只是小幅改進和錯誤修復。另一個值得關注的發展是,ChatGPT的免費用戶現在每天可以使用DALL E 3生成兩張圖像,無需額外費用。這進一步降低了普通用戶接觸高級AI技術的門檻。Runway公司則升級了其Gen 3模型,現在可以以七倍的速度生成視頻。這種進步為視頻創作和編輯帶來了新的可能性。
法律和倫理挑戰
隨著AI技術的快速發展,相關的法律和倫理問題也日益凸顯。例如,Midjourney因生成模仿藝術家風格的圖像而面臨訴訟,這涉及到AI創作與版權保護的複雜問題。在遊戲行業,動作捕捉演員因擔心他們的數據被用於訓練AI進行遊戲表演而罷工,這反映了AI對傳統工作崗位的潛在威脅。另一方面,環球音樂與Meta達成了AI變現和保護人類創作者權利的協議,顯示了業界在平衡AI發展和保護創作者權益方面的努力。
香港方面,與AI相關的詐騙案持續上升,Deep Fake技術讓騙案更防不勝防,香港網絡安全事故協調中心便聯同數字政策辦公室舉行2024網絡安全宣傳周活動讓公眾了解相當風險。政府的宣傳和參與,對市民應對新型犯罪尤其重要。
Comments