深度求索(DeepSeek)震撼 AI 圈的中国力量,重塑行业格局

AI资讯 作者:佚名 发布:2025-01-28 13:38:49
10 0 0
深度求索(DeepSeek)震撼 AI 圈的中国力量,重塑行业格局

在全球人工智能飞速发展的中,近期有这么一家来自中国的初创公司 —— 深度求索(DeepSeek),以其卓越的技术实力和创新成果,迅速崛起并在国际舞台上崭露头角,引发了全球范围内的广泛关注。它不仅在技术领域取得了重大突破,还对美国人工智能市场产生了巨大的冲击,成为了改变行业格局的重要力量。

一、深度求索公司简介

深度求索,全称杭州深度求索人工智能基础技术研究有限公司,于 2023 年 7 月 17 日正式成立。作为一家创新型科技公司,它专注于开发先进的大语言模型(LLM)和相关技术,从成立之初就致力于在人工智能领域开辟出一条独特的发展道路。在硅谷,DeepSeek 早早就被称作 “来自东方的神秘力量”,也是网上热议的 “杭州六小龙” 之一。尽管成立时间不长,但凭借着对技术的执着追求和勇于创新的精神,DeepSeek 迅速在竞争激烈的人工智能领域站稳了脚跟。

二、技术突破与创新成果

  1. 新一代大语言模型 V3:2024 年底,DeepSeek 发布了新一代大语言模型 V3,并宣布开源。测试结果显示,该模型在多项评测中表现优于主流开源模型,且具有显著的成本优势。这一成果的发布,让 DeepSeek 在人工智能领域崭露头角,吸引了众多开发者和研究人员的关注。
  1. 最新开源模型 R1:在本月世界经济论坛 2025 年年会开幕当天,DeepSeek 发布了其最新开源模型 R1,再次引发全球人工智能领域的高度关注。R1 模型在技术上实现了重要突破,它采用纯深度学习的方法让 AI 自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的 o1 模型正式版。而令人惊叹的是,R1 模型的训练成本仅为 560 万美元,远远低于美国开放人工智能研究中心、谷歌、“元” 公司等美国科技巨头在人工智能技术上投入的数亿美元乃至数十亿美元。这一成本优势使得 DeepSeek 的模型在市场上具有更强的竞争力。
  1. 多模态模型 Janus-Pro 和 JanusFlow:1 月 27 日晚间,在发布新版本即将上线的消息后不久,DeepSeek 就在人工智能开源社区 HuggingFace 发布了参数大小从 10 亿到 70 亿不等,名为 Janus-Pro 和 JanusFlow 的一系列开源多模态模型。本次发布的新模型,重点在于文生图能力方面,进一步拓展了 DeepSeek 在人工智能领域的技术边界。随后,在除夕之夜,DeepSeek 正式发布了集理解与生成于一体的多模态大模型 Janus-Pro。Janus-Pro 采用了创新性自回归框架,并实现了多模态理解与生成的统一,是对去年发布的前代模型 Janus 的全面升级。它通过将视觉编码解耦为独立的通道,克服了先前方法的局限性,同时仍然使用单一且统一的 Transformer 架构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成方面的固有角色冲突,还显著提升了框架的灵活性。结果显示,升级后的 Janus-Pro 在多模态理解和文生图能力上都实现了显著突破,同时文生图的稳定性也得到了提升。而且,在训练上一如既往地只用了非常少的算力,1.5B 和 7B 这两款模型,分别在配备 16/32 个计算节点的集群上进行,每个节点装配 8 张 Nvidia A100(40GB)GPU,总训练时间约为 7/14 天。

三、市场影响与地位提升

  1. 冲击美国人工智能主题股票:当地时间 1 月 27 日,受 DeepSeek 的冲击,美国人工智能主题股票遭遇大规模抛售。美国芯片巨头英伟达(NVIDIA)股价历史性暴跌,当日股价暴跌约 17%,市值一日内蒸发近 6000 亿美元,创美国历史上任何一家公司的单日最大市值损失。此外,博通公司股价下跌 17%,超威半导体公司(AMD)股价下跌 6%,微软股价下跌 2%。人工智能领域的衍生品,如电力供应商也受到重创,美国联合能源公司股价下跌 21%,Vistra 的股价下跌 29%。市场分析认为,此次美国股市震荡的核心原因是 DeepSeek 的最新突破,动摇了美国科技行业的 “无敌” 地位,令市场对美国科技行业的竞争力产生疑虑,导致人工智能主题股票遭抛售。安内克斯理财公司首席经济学家雅各布森表示,人们真正感到诧异的是,像英伟达这样的公司,被认为几乎垄断了人工智能生态系统中的所有芯片,但也许 “护城河” 并不像人们想象的那么强大,这可能是其股价下跌的原因。
  1. 登顶苹果应用商店美国区免费应用榜单:目前,DeepSeek 开发的移动应用程序已超越 OpenAI 的 ChatGPT,登顶苹果手机应用商店美国区免费应用榜单。这一成绩充分证明了 DeepSeek 在用户体验和市场认可度方面的优势,也进一步提升了其在全球人工智能市场的影响力。

四、行业评价与展望

北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek 最大的优势在于算法的改进和优化,节省了算力和数据量。

以前如果说 OpenAI 是 “大力出奇迹”,如今 DeepSeek 则是 “小力也可以出奇迹”—— 小的算力用新的方法也能创造奇迹。英伟达 AI 科学家 Jim Fan 称赞 DeepSeek 是 “真正开放的前沿研究,赋能所有人”。南京大学人工智能学院教授俞扬表示,DeepSeek 在算法上进行了相应的优化,使得训练成本大幅降低。开源虽然面临着保护知识产权和开源社区秩序维护等挑战,但它也促进了 AI 开发者社区的协作生态,推动了 AI 技术的发展。

从整个 AI 大模型产业来看,DeepSeek 的成功或许代表了一种全新的发展方向 —— 通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为 AI 大模型产业的发展提供了新的思路。尽管 DeepSeek 取得了令人瞩目的成绩,但它也面临着一些挑战。例如,其线上服务近期受到大规模恶意攻击,不得不暂时限制了 + 86 手机号以外的注册方式。在多模态理解和文本生图方面,Janus-Pro 当前仍然存在一些局限性,如在 OCR 等需要精细识别的任务上表现受输入分辨率限制,生成图像在细节表现上仍有不足等。

这些挑战并不能阻挡 DeepSeek 前进的步伐。相信在未来,DeepSeek 将继续凭借其创新能力和技术实力,在人工智能领域取得更加辉煌的成就,为全球人工智能的发展做出更大的贡献。

暂无评论

暂无评论...
版权声明:本文内容由互联网用户自发贡献或者转载,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 210093010@qq.com,一经查实,本站将立刻删除。
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断