10月21日已讀 3 分鐘

[Money Leaders Club 金星匯｜未來人語] 無限制FLUX：打開的潘朵拉盒子？

儘管每個朋都有新LLM模型出現，但影響力卻不聲稱「無限制」的FLUX，在監管遠遠未能追上的情況下，大家惟有自求多福。

去年曾經有一段時間出現大量假新聞圖片，如教宗方濟各穿著白色羽絨便證實為人工智能假照片，結果各大平台禁止名人、品牌等的圖片生成。然而，XAI公司推出的Grock 2和Black Forest Labs開發的FLUX。這些模型不僅在性能上表現出色，更因其幾乎無限制(uncensored的內容生成能力引起廣泛關注。

Grock 2集成到X平台，在聊天機器人競賽中表現出色，超越了其他大型語言模型。它能夠生成幾乎不受限制的圖像和文本，包括一些具有爭議性的內容。例如，有用戶生成了穿著內衣的Taylor Swift和手持刀具的Barack Obama。這種無限制的特性在公共平台上推動了AI創作的邊界，引發了對AI倫理和社會影響的深入討論。

FLUX則是一個新興的AI圖像生成工具，由Black Forest Labs開發。FLUX團隊包括幫助構建Stable Diffusion的成員，他們開發了三個模型:Flux One Schnell(最快速模型，適用於本地開發和個人使用)、Flux One Dev(中級模型，用於非商業應用)和Flux One Pro(頂級模型，用於企業解決方案)。FLUX在某些方面表現出色，特別是在真實感圖像和文本生成方面。與Mid Journey相比，FLUX在生成真實感圖像方面不相上下，並且在文本生成(如標誌和模因)方面表現更佳。FLUX的一個顯著優勢是其提示詞遵從性，能夠捕捉提示中的所有元素，這是Mid Journey常常忽略的一個方面。雖然FLUX目前無法生成NSFW(不雅、淫褻)內容，但由於其開源性質，理論上用戶未來可能會生成此類內容。此外，FLUX計劃在未來成為一個文本到視頻的模型，這將進一步擴展其應用範圍。

大公司的AI創新

雖然我們可以用Poe、ChatGPT等手機應用程式，然而Google發布了新一代Pixel 9智能手機，搭載多項AI功能。其中最引人注目的是Gemini Nano大型語言模型，它能夠在移動設備上實現每秒45個標記的輸出速度，這在移動AI領域是一個重大突破。Google還推出了Gemini Live語音助手，作為對GPT-4語音助手的回應。新的Pixel手機還具備許多AI驅動的功能，如通話記錄和摘要生成、智能截圖、照片放大優化等。這些功能大大提升了用戶體驗，展示了AI在日常生活中的實際應用價值。Google推出了新一代AI耳機Pixel Buds Pro 2，專為與AI助手Gemini進行長時間對話而設計。在圖像生成領域，Google發布了Imagine 3模型，並在其Image FX平台上開放測試。將來AI裝置將會人人手執一部。

AI工具的普及與改進

Midjourney引入了新的網頁編輯器，允許用戶直接在平台上編輯圖像。OpenAI發布了GPT-4的更新版本，雖然只是小幅改進和錯誤修復。另一個值得關注的發展是，ChatGPT的免費用戶現在每天可以使用DALL E 3生成兩張圖像，無需額外費用。這進一步降低了普通用戶接觸高級AI技術的門檻。Runway公司則升級了其Gen 3模型，現在可以以七倍的速度生成視頻。這種進步為視頻創作和編輯帶來了新的可能性。

法律和倫理挑戰

隨著AI技術的快速發展，相關的法律和倫理問題也日益凸顯。例如，Midjourney因生成模仿藝術家風格的圖像而面臨訴訟，這涉及到AI創作與版權保護的複雜問題。在遊戲行業，動作捕捉演員因擔心他們的數據被用於訓練AI進行遊戲表演而罷工，這反映了AI對傳統工作崗位的潛在威脅。另一方面，環球音樂與Meta達成了AI變現和保護人類創作者權利的協議，顯示了業界在平衡AI發展和保護創作者權益方面的努力。

香港方面，與AI相關的詐騙案持續上升，Deep Fake技術讓騙案更防不勝防，香港網絡安全事故協調中心便聯同數字政策辦公室舉行2024網絡安全宣傳周活動讓公眾了解相當風險。政府的宣傳和參與，對市民應對新型犯罪尤其重要。

[Money Leaders Club 金星匯｜未來人語] 無限制FLUX：打開的潘朵拉盒子？

相關文章

Comments