DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配

热点新闻 6
声明:本文来自于微信公众号量子位 | 公众号 QbitAI,作者:梦晨,授权站长之家转载发布。DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。再加上春节期间的三大运营商全面接入DeepSeek等消息,它的影响力已不仅限于AI和互联网,正在往产业更深层进发。总之,对于用户和开发者来说不用再看“服务器繁忙

声明:本文来自于微信公众号量子位 | 公众号 QbitAI,作者:梦晨,授权站长之家转载发布。

DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:

  • 国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。

  • 平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。

再加上春节期间的三大运营商全面接入DeepSeek等消息它的影响力已不仅限于AI和互联网,正在往产业更深层进发。

总之,对于用户和开发者来说不用再看“服务器繁忙”的脸色,可以多换几个地方再试了。

随着官方服务器不堪重负,以及DeepSeek-V3API优惠结束恢复原价,各大云服务商也抓住机会卷了起来。

云服务卷价格,新式芯片卷速度

腾讯云率先上线支持联网搜索的DeepSeek,结合自家旗下搜狗搜索提供搜索增强API。

同时支持集成私域知识库,一键整合RAG。

商汤和阿里直接卷起了价格。

商汤大装置平台上3个月内可限时免费使用1000万tokens,同时支持128K最大上下文长度限制。

阿里云为新用户提供100万免费tokens,同时蒸馏版模型价格也比较低。

与此同时,各类芯片正在输出速度上展开激烈竞争。

通用GPU方面,AMD员工透露MI300X上的DeepSeek-R1满血版速度比刚发布时已经快了3倍,并发布官方Docker Image镜像。

在英伟达与CUDA生态之外,提供AMD与ROCm的另一种选择。

三大新型AI推理芯片Groq、Cerebras、Sambanova已经把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。

快到你都看不清发生了什么,推理思维链完成了、代码写完了,一眨眼直接运行了。

One More Thing

还有一条有意思的消息,ai.com域名现在已定向到DeepSeek官网。

甚至有传言称是DeepSeek重金拿下了该域名。

不过一直关注大模型的朋友可能还记得,这个域名曾先后定位到ChatGPT和xAI。

大概率是域名所有人个人行为~

国家超算互联网平台

https://www.scnet.cn/

腾讯云DeepSeek专题

https://cloud.tencent.com/developer/special/deepseek

阿里云DeepSeek解决方案

DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配

https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms

商汤大装置

DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配

https://www.sensecore.cn

参考链接:

[1]https://x.com/AnushElangovan/status/1888006978959741390

[2]https://x.com/Dev__Digest/status/1887337604267332022

打赏
版权声明 本文地址:http://sdlongpai.cn/post/69694.html
1.文章若无特殊说明,均属本站原创,若转载文章请于作者联系。
2.本站除部分作品系原创外,其余均来自网络或其它渠道,本站保留其原作者的著作权!如有侵权,请与站长联系!
广告二
扫码二维码