DeepSeek横空出世 超ChatGPT登顶应用榜首 每股大跌

近一周,来自中国的深度求索(DeepSeek)发布的DeepSeek R1模型在全球爆红,随着热度不断攀升,DeepSeek应用在1月26日一度因用户流量暴增,出现服务器短暂繁忙甚至“崩溃”的情况。而到1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美国地区的下载榜上超越了ChatGPT。 这个引发硅谷震动的应用由量化基金公司幻方旗下的大模型公司打造,仅使用2048块H800 GPU的情况下,就完成了6710亿参数模型的训练,训练成本仅为557.6万美元,远低于其他顶级模型的训练成本(例如GPT-4的10亿美元)。 作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。 一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动,更对美国市场产生了强烈的刺激,由此产生的关键质疑是,美国科技巨头们花重金囤GPU的意义何在,英伟达3.5万亿美元市值的真正价值何在,美国政府处心积虑管制先进AI芯片对华出口的作用又何在。受此影响,今天开盘的美股市场上芯片股遭遇重大挫折,三大股指全线下跌,道指跌0.9%,纳指跌3.61%,标普500指数跌2.22%。芯片股重挫,英伟达跌超12%,博通、台积电跌超11%。