https://news.cnyes.com/news/id/5847178
發布時間:
2025-01-28 01:51
記者署名:
羅昀玫
原文內容:
DeepSeek 週二 (28 日) 發布開源多模態人工智慧 (AI) 模型 Janus-Pro,其中
Janus-Pro-7B 在 GenEval 和 DPG-Bench 基準測試中打敗 OpenAI 的 DALL-E 3 和
Stable Diffusion。
DeepSeek 團隊正式發表兩款多模態框架,即 Janus-Pro 和 JanusFlow。
(圖片:蘋果)
(圖片:DeepSeek 專家)
Janus-Pro 是一款統一多模態理解與生成的創新框架,透過去耦合視覺編碼的方式,大幅
提升了模型在不同任務中的適配性與表現。
JanusFlow 是一款透過生成流 (Rectified Flow) 與自迴歸語言模型融合實現統一的框架
,不僅在理解任務中表現優異,還能製作高品質影像,同時展現框架設計的極簡與強大。
其優異表現顯示,Janus-Pro-7B 在人工智慧任務中具有競爭優勢,這可能會影響該領域
未來的研發方向。
隨著科技業努力應對 Janus-Pro-7B 的推出及其影響,現在市場高度關注在其他公司將如
何應對 DeepSeek 的挑戰。
AI 觀察家 Rowan Cheung 表示,DeepSeek 的新模型可以為人工智慧效能設定新標準。
AI 戰局正迅速變化,競爭可能會更加劇,新模式的出現,會導致進一步的創新,並可能
導致更多的市場波動。AI 寵兒輝達 (NVDA-US) 在美股週一午盤時段暴跌超過 17%。
心得/評論:
github
https://github.com/deepseek-ai/Janus
https://arxiv.org/abs/2410.13848
github與論文
解決了多模態模型中,視覺理解與生成之間的衝突
去年已經發布過1.3B的模型,就有不少人覺得在理解prompt和圖片辨識方面很有潛力
現在最新的pro 7b還有待測試
不知道對市場的影響如何,但openai的dalle本來就蠻爛的
--
https://i.imgur.com/DDUQjOU.jpeg
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.141.114 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738007253.A.543.html
原文標題:
DeepSeek深夜發布新款開源AI模型Janus-Pro
原文連結:
沒有留言:
張貼留言