近日,DeepSeek公司传出重大新闻,预示着人工智能领域即将迎来新的变革。
据路透社2月25日报道,DeepSeek正加速其新一代AI模型R2的发布进程。原本计划于5月面世的R2,现在由于DeepSeek团队的努力,预计将会提前与公众见面。DeepSeek特别强调,新模型在编程能力和多语言推理方面实现了显著进步。对于这一消息,幻方量化相关负责人表示,请以官方公告为准。
此外,DeepSeek API开放平台也在今日重新启动了API充值服务。此前因服务器资源紧张,该平台自2月初起暂停了API服务的充值功能。
关于DeepSeek-R2的到来,市场充满期待。根据2月25日路透社的消息,DeepSeek计划将R2的发布时间提前至近期,而不是原定的5月初。虽然具体的发布时间尚未公布,但公司已明确表示新模型将在多个关键领域实现改进。
行业观察者指出,DeepSeek的成功离不开其背后母公司幻方投资超过十年的研究投入和技术积累。特别是2020年和2021年间,幻方投资巨资建立了两个配备约1万片NVIDIA A100芯片的AI超级计算中心,为DeepSeek提供了强大的算力支持。
值得一提的是,DeepSeek前员工透露,公司的成功很大程度上归功于技术领导者对成本效益的追求,通过采用混合专家(MoE)技术和多头潜在注意力(MLA)等创新方法,大幅降低了AI模型的运行成本。根据伯恩斯坦经纪公司的分析,DeepSeek提供的服务费用仅为OpenAI同类产品价格的二十分之一到四十分之一,这直接促使了竞争对手如OpenAI和谷歌调整他们的定价策略。