根據“The 新旗Information”的報道顯示,兩位直接知情人士透露,艦級深度求索(DeepSeek)預計將在未來幾周內推(2月中旬農歷新年前后)出代號為V4的人工新一代旗艦級人工智能模型,該模型主打強勁的模型代碼生成能力。
據悉,春節DeepSeekV4在超長代碼提示詞的前后處理與解析上實現了關鍵突破,支持百萬級tokens上下文窗口。發布

可一次性消化整個中型項目的艦級代碼庫、技術文檔與需求說明,人工精準理解跨文件依賴關系,模型解決復雜軟件項目開發中的春節上下文斷裂問題,這對開發大型系統、前后重構遺留代碼、發布理解復雜技術文檔具有革命性價值。新旗
V4還解決了AI訓練中的一個常見難題 ——數據模式理解能力在訓練全階段無衰減,這與傳統模型隨著訓練次數增加性能下降的情況形成鮮明對比。
該突破使模型能更高效地從海量數據中學習,擺脫單純記憶數據的局限,形成更深刻的抽象理解能力。
DeepSeek員工基于公司內部基準開展的初步測試顯示,該模型在代碼生成領域的表現優于Anthropic、Claude、生成式預訓練變換器系列(OpenAI GPT)等現有主流模型。
還有行業消息稱,V4 可能采用全新的mHC架構,具備更好的并行計算效率和國產芯片適配能力,有望降低部署成本,提高推理速度,為大規模商業化應用奠定基礎。
值得一提的是,就在本月4日,DeepSeek 在arXiv上更新了R1論文,頁數從22頁擴展到86頁,新增完整訓練管線拆解、20多個評測基準的詳細數據,被視為給V4的發布做好了技術準備。
