首页热点新闻正文

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

热点新闻 12小时前 5

声明：本文来自于微信公众号量子位 | 公众号 QbitAI，作者：西风梦晨，授权站长之家转载发布。昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下，Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT

声明：本文来自于微信公众号量子位 | 公众号 QbitAI，作者：西风梦晨，授权站长之家转载发布。

昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～

就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹:

Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下，Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o，和Claude-3.5-Sonnet也能比一比。

基座模型对比中，Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B，在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

更令AI社区关注的是，Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型，经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek，还有阿里通义Qwen，网友们不忘艾特奥特曼:

祝大家新年快乐，特别祝Sam。

阿里研究员在模型发布后也都还不睡，纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦:

Qwen2.5-Max在基准测试中表现良好，希望大家可以试试看，新年快乐!