刚刚DeepSeek-V31「终极版」重磅发布!最大提高超36%V4R2还远吗?
时间: 2025-10-19 10:25:58
作者: 破碎物料
此次更新在坚持模型原有才能的基础上,针对用户反应的问题进行了改善,包含:
DeepSeek前次更新为8月21日,短短一个月,获得这一成果来之不易,可喜可贺。
值得一提的是,新模型在Humanitys Last Exam(人类最终的考试)中,成果提高起伏高达36.48%!
之前,有网友发现:DeepSeek V3.1输出中随机带有「极」字。网友称:
这一Bug现已导致DeepSeek V3.1无法从事编程或对输出结构灵敏的相关作业。期望官方提前修正。
这次更新明确已处理「偶发反常字符等状况」,结合「Code Agent优化」,期望这次更新能完美处理DeepSeek无法从事编程或对输出结构灵敏的相关作业的Bug。
至于中英文稠浊,是LLM的老毛病了,比方OpenAI o3-mini等模型被曝运用中文推理。
咱们也对之前在网上撒播最广的会触发「极你太美」Bug的Prompt进行了测验:
现在,新模型给出了5种定时器完成办法,多处都运用了time.Second。
咱们通过屡次测验,均未能复现出该Bug,阐明Bug的确或许已被修正了。
与DeepSeek-V3.1比较,新模型在东西运用与Agent使命中的体现有较大提高:
在计算机术语中,终端(Terminal)也称终端设备,是计算机网络中处于网络最外围的设备,大多数都用在用户个人信息的输入以及处理结果的输出等。