精选 DeepSeek发布Prover-V2模型,参数量达6710亿
ceshi阅读:2025-04-30 18:43:03
DeepSeek在Hugging Face社区发布新模型DeepSeek-Prover-V2-671B。
该模型参数达6710亿,采用safetensors文件格式,支持多种计算精度,便于**训练与部署,可能是Prover-V1.5的升级版。
模型基于DeepSeek-V3架构,使用MoE模式,包含61层Tran**ormer层和7168维隐藏层,支持**16.38万位置嵌入,适用于复杂数学证明。
通过FP8量化技术,可减小模型体积并提升推理效率。
本文地址:https://licai.bestwheel.com.cn/qk/246749.html
文章标题:精选 DeepSeek发布Prover-V2模型,参数量达6710亿
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。







