知名百科  > 所属分类  >  商业百科   

DeepSeek

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,中文简称为深度求索,是一家专注于先进大语言模型(LLM)及相关技术研发的试验与发展型企业。该公司由量化资管领域的知名巨头幻方量化于2023年7月17日创立,注册地位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。

2024年1月5日,DeepSeek正式推出了其首个大型模型——DeepSeek LLM。同年5月,该公司宣布开源第二代MoE大模型DeepSeek-V2,凭借其卓越的性能与亲民的价格,DeepSeek赢得了“AI界拼多多”的绰号。12月26日,DeepSeek宣布DeepSeek-V3模型的首个版本正式上线并同步开源。

进入2025年,DeepSeek于1月20日正式发布了DeepSeek-R1模型,该模型在性能上与OpenAI的GPT-1正式版不相上下。1月31日,DeepSeek R1 671b作为英伟达NIM微服务的预览版在build.nvidia.com平台上发布。2月,DeepSeek-R1、V3、Coder等系列模型相继上线国家超算互联网平台。同时,DeepSeek的日活跃用户数于2月1日突破3000万大关,创下了达成这一里程碑的最快记录。

截至2025年2月2日,DeepSeek已攀升至140个国家苹果App Store下载排行榜的首位,并在美国的Android Play Store中也位居榜首。截至2月9日,DeepSeek App的累计下载量已超过1.1亿次,周活跃用户规模最高接近9700万。2月21日,DeepSeek宣布将陆续开源5个代码库。2月26日,该公司开源了DeepGEMM。次日,DeepSeek发布了其“开源周”第四日的内容,即优化的并行策略。据IndiaTimes于3月31日报道,DeepSeek在2月录得了5.247亿次新的网站访问量,超越了ChatGPT,在整体规模上仍位列第三。4月30日,DeepSeek在AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的模型。然而,7月根据国际半导体研究机构Semianalysis的最新报告,DeepSeek的全球用户使用率从2025年1月的50%急剧下降至7月的3%,官网访问量在2月至5月期间也下滑了63%。

目录

发展历程 编辑本段

早期发展阶段

于2023年4月,幻方量化正式发布公告,宣告其全面进军人工智能技术领域,并宣布成立独立的科研实体——深度求索公司。同年7月17日,DeepSeek在杭州市拱墅区市场监督管理局顺利完成注册登记。8月2日,公司注册资本调整至1000万元,并完成章程备案手续,同时投资人变更为宁波程恩企业管理咨询合伙企业(有限合伙),企业类型变更为其他有限责任公司。2023年10月,DeepSeek成功完成由幻方量化主导的Pre-A轮融资,所获资金主要用于大型语言模型的研发及团队规模的扩张。

进入2024年,DeepSeek于1月5日正式推出首个大型语言模型DeepSeek LLM,该模型拥有670亿参数,基于一个包含2万亿token的中英文数据集进行训练。同年5月,DeepSeek宣布开源第二代基于混合专家(Mixture of Experts, MoE)架构的大型语言模型DeepSeek-V2。该模型在性能上与GPT-4Turbo相当,但成本仅为GPT-4的百分之一,因此被业界誉为“AI界的拼多多”。

2024年9月5日,DeepSeek官方更新了API支持文档,并宣布将DeepSeek Coder V2与DeepSeek V2 Chat两个模型合并,升级为全新的DeepSeek V2.5模型。API用户可通过deepseek-coder或deepseek-chat接口访问新模型,该模型在写作任务及指令遵循等方面进行了显著优化。11月20日,DeepSeek宣布推理模型DeepSeek-R1-Lite预览版正式上线。同年12月26日,DeepSeek宣布DeepSeek-V3首个版本正式上线,并同步开放源代码

模型热度飙升

2025年1月11日,DeepSeek官方App正式面世,并同步登陆iOS与安卓应用市场。紧接着,1月20日,DeepSeek隆重推出DeepSeek-R1模型,该模型在数学运算、代码生成及自然语言推理等任务上的表现,已媲美OpenAI o1正式版。1月24日,据国外大模型排名Arena显示,DeepSeek-R1在基准测试中跃升至全类别大模型第三位,尤其在风格控制类模型(StyleCtrl)分类中,与OpenAI o1并列榜首,其竞技场得分高达1357分,略胜一筹于OpenAI o1的1352分。

至1月27日,DeepSeek应用在苹果应用商店免费APP下载排行榜上,成功登顶15个国家和地区。同时,在美国区域,DeepSeek从1月26日的第六位跃居至首位,超越了ChatGPT、Meta旗下的社交媒体Threads,以及Google Gemini、Microsoft Copilot等美国科技巨头的生成式AI产品,实现了中国应用在中国及美国苹果App Store同时占据榜首的历史性突破。

1月31日,DeepSeek R1 671b版本作为英伟达NIM微服务预览版,在build.nvidia.com平台发布。该微服务在单个英伟达HGX H200系统上,每秒最高可处理3872个token。开发人员得以对API进行测试与实验,预计该API将很快作为英伟达AI Enterprise软件平台的一部分,以可下载的NIM微服务形式正式推出。

进入2月,DeepSeek-R1、V3、Coder等系列模型,陆续上线国家超算互联网平台。截至2月2日,DeepSeek应用迅速占据140个国家苹果App Store下载排行榜首位,并在美国Android Play Store同样夺得榜首。然而,2月6日,因服务器资源紧张,DeepSeek暂停了API服务充值,直至同月25日方重新开放。

4月4日,DeepSeek携手清华大学研究团队,联合发布了题为《奖励模型的推理时Scaling方法及其在大规模语言模型中的应用》的学术论文,提出了自我原则点评调优(SPCT)与元奖励模型(Meta Reward Model)两项核心技术,为提升大语言模型(LLM)推理能力提供了创新性的方法论。该论文已在arXiv平台公开(https://arxiv.org/abs/2504.02495 ),相关代码与部分模型权重正逐步开源。

开源代码库

2025年2月21日,DeepSeek正式对外宣布,将分阶段公开其五个核心代码库。紧接着,在2月24日,该公司启动了备受瞩目的“开源周”活动,并率先推出了针对Hopper GPU特别优化的FlashMLA代码库。该解码内核以高效MLA架构为核心,专为处理复杂多变长度的序列数据而设计。

DeepSeekDeepSeek

2月26日,Deepseek继续其开源步伐,正式公布了DeepGEMM代码库。随后,在2月27日上午10点05分,DeepSeek发布了“开源周”第四日的重大进展:一系列优化的并行策略,涵盖DualPipe这一创新的双向管道并行算法,该算法旨在V3/R1训练中实现计算与通信的高效重叠。同时,还推出了EPLB,一种专为V3/R1设计的专家并行负载均衡解决方案。此外,DeepSeek还慷慨地分享了其训练和推理框架的性能分析数据,旨在为开源社区提供深入了解通信与计算重叠策略及其底层实现细节的宝贵资源。

2月28日,作为“开源周”的压轴之日,DeepSeek宣布开源其全数据访问加速引擎——3FS(Fire-Flyer文件系统)。3FS作为一款高性能的并行文件系统,全面支持V3/R1版本中的训练数据预处理、数据集高效加载、检查点的保存与重载,以及推理阶段的向量嵌入搜索和KVCache快速查找功能。

进入4月30日,DeepSeek在AI开源社区的标杆平台Hugging Face上,发布了一款名为DeepSeek-Prover-V2-671B的先进模型。该模型采用了更为高效的safetensors文件格式,并支持多元化的计算精度,从而极大提升了模型训练与部署的速度和资源利用率。其参数规模高达6710亿,或可视为2024年发布的Prover-V1.5数学模型的重大升级版。同日,Deepseek还推出了DeepSeek-Prover-V2-7B(增强版)模型,以及配套的DeepSeek-ProverBench数据集。DeepSeek-Prover-V2-671B在MiniF2F-test数据集上展现了卓越的性能,通过率高达88.9%,专注于形式化定理证明领域。结合DeepSeek-Prover-V2-7B模型在子目标搜索方面的优化,以及ProverBench基准数据集的发布,DeepSeek正有力推动数学AI领域的蓬勃发展。

业务拓展 编辑本段

2025年3月,杭州深度求索人工智能基础技术研究有限公司正式提交了多枚DeepSeek Chat商标的注册申请,其国际分类涵盖了教育娱乐、广告销售等多个领域。截至3月17日,相关商标的注册申请状态仍处于审核阶段。同年4月1日,该公司,作为DeepSeek的关联企业,所申请的“一种广度数据采集的方法及其系统”专利获得公布。

业务数据

据某权威AI产品榜单统计,DeepSeek应用在上线后的短短20天内,日活跃用户数(DAU)迅速攀升至2215万。2025年2月8日,根据QuestMobile的数据,DeepSeek在1月28日的日活跃用户数首次超越豆包,并在2月1日成功突破3000万大关,创造了应用史上达成此里程碑的最快记录。截至2月9日,DeepSeek App的累计下载量已超过1.1亿次,周活跃用户规模最高接近9700万。其中,1月20日至1月26日期间,该应用的周下载量达到226万次,而次周的下载量更是飙升至6300万次,环比增长超过2700%。3月31日,IndiaTimes报道指出,DeepSeek在2月期间录得了5.247亿次新的网站访问量,超越了ChatGPT,尽管在整体规模上仍位列第三。然而,7月时,根据国际半导体研究机构Semianalysis的最新报告,DeepSeek的全球用户使用率已从2025年1月的50%显著下降至7月的3%,官网访问量在2月至5月期间也下滑了63%。另一家AI模型集成平台Poe的统计数据显示,其核心模型R1的使用率在2月至4月间减半,从7%跌至3%。进入2025年二季度,DeepSeek的月均下载量从第一季度的8111.3万大幅下降至2258.9万,降幅高达72.2%。

定价收益模式

DeepSeek API的定价策略为:每百万输入Tokens收费1元,每百万输出Tokens收费2元。该优惠期截至北京时间2025年2月8日24:00。优惠结束后,价格调整为每百万输入Tokens 2元,每百万输出Tokens 8元。而deepseek-reasoner模型自上线起即采用每百万输入Tokens 4元,每百万输出Tokens 16元的计费标准。2月26日,DeepSeek API开放平台宣布实施错峰优惠定价策略,每日优惠时段为北京时间00:30至08:30,其余时间则按标准价格计费。在优惠时段内,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是降至25%。

合作机构概览

2025年3月,上海消防与DeepSeek携手,针对三类特定场景展开了深入应用。在日常办公类政务应用场景中,DeepSeek凭借其快速文本分析能力,精准识别警情关键信息,为科学高效的决策提供了有力支撑。在数据治理专项工作应用场景中,DeepSeek的深度学习和数据分析算法在数据分类标注、清洗去重、关联整合等三大主攻方向上发挥了强大作用,有效融合了分散在不同系统和部门的数据,为消防业务提供了全面且准确的数据支持。在网络安全AI智能体应用场景中,DeepSeek的数据分析和模式识别能力被应用于训练“网络安全智能体”,使其能够及时识别异常行为和潜在的入侵威胁,有效防范网络攻击对消防业务造成的影响。

获得荣誉 编辑本段

2025年5月11日,DeepSeek入选2025福布斯中国人工智能科技企业TOP50。

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 红果短剧    下一篇 小米汽车业务爆发式增长:二季度收入突破206亿元

标签

同义词

暂无同义词