deepseek ai公司背景,细说Deepseek背后的人

Author Avatar
风萧萧兮
2025-09-26
阅读0

这两天被DeepSeek V3.1刷屏了吧?8月21日悄悄上线的这个版本,简直是给国产AI打了一针强心剂。专门为国产芯片设计的UE8M0 FP8格式,直接绕开了英伟达的技术壁垒——说实话,这招真的很绝。在英伟达H20停产的档口,DeepSeek这步棋走得太妙了。

Deepseek是什么?

image.png

你要真想了解DeepSeek,建议你直接去它官网看看。翻到最底下,你就能看到几个关键信息:

DeepSeek这个名字归杭州深度求索人工智能基础技术研究有限公司所有——听起来很正式对吧?其实就是个专门搞AI的公司。不过说实话,DeepSeek更像是个品牌,涵盖了一堆技术研究和产品。

简单来说,DeepSeek就是个AI大模型,和ChatGPT差不多的概念。但它的野心可不小——自然语言处理、机器学习、深度学习、大数据分析,这些听起来高大上的技术它都玩得转。

你问我它到底能干啥?哎,这就多了去了。

逻辑推理、文本生成、图像分析、语音识别、个性化推荐...八大领域样样精通。就像一个超级全能的数字助手,你扔给它什么问题,它基本都能给你个像样的答案。

当然,是不是真的有那么神,这个见仁见智啦。

Deepseek AI公司背景

image.png

创始人——梁文锋1985年出生,广东湛江人,浙大毕业。看起来很普通对吧?但人家2008年就开始玩机器学习做量化交易了——那时候AI还没这么火呢!

2015年成立幻方量化,2019年管理规模就破百亿了。你说这速度快不快?2023年7月又搞出DeepSeek,从量化投资跨界到通用AI,这个跨度还真不小。

最有意思的是,2025年1月20日,他还参加了李强总理主持的座谈会,在会上发言。3月27日直接上了胡润富豪榜,身价330亿。从技术宅到商业大佬,这个转变还真不是每个人都能做到的。

核心团队的配置也很有意思。高华佐北大物理系的,曾旺丁北邮的在读生,邵智宏清华交互式AI博士生...还有朱琪豪这个GRPO算法的贡献者,北大计算机博士。赵成钢负责基础架构,还在英伟达实习过——这个经历挺有意思的,在英伟达学技术,回来做可能颠覆英伟达的事情。

说到底,这个团队的学术背景都很强,北大、清华、中山大学的博士一大堆。但我觉得更重要的是,他们有实战经验。不是那种只会写论文的学院派,而是真正在产业一线干过的人。

你看DeepSeek的发展轨迹,从量化投资到AI大模型,从闭源到开源,从依赖进口芯片到适配国产芯片,每一步都踩在了时代的节拍上。当然,它能走多远,还得看后续的发展。但至少现在看来,这确实是个值得关注的中国AI力量。

DeepSeek的故事还在继续写着。V3.1版本的发布,标志着国产AI正在从跟随者变成引领者的角色转换。虽然路还很长,挑战也不少,但有这样的技术实力和开放心态,我对国产人工智能的未来还是挺乐观的。毕竟,技术无国界,但创新有温度。

Deepseek牛在哪?

image.png

说到这里,我得承认,DeepSeek确实有两把刷子。美国那边的科技圈现在对它也挺关注的,原因嘛,你听我慢慢道来:

技术创新这块儿,DeepSeek玩得真的很溜。它用的这个"数据蒸馏技术",听起来玄乎,其实就是把数据里最精华的部分提取出来,让训练更高效。

就像你煲汤,要把骨髓里的营养都熬出来一样。

更绝的是它的"混合专家"方法——这个概念我觉得挺巧妙的。传统AI模型就像一个班级,不管什么问题都是全班一起回答,结果大家七嘴八舌反而效率不高。

DeepSeek不一样,它会根据你的问题,专门叫对应的"专家"来回答。

问医疗问题就找医疗专家,问翻译就找翻译专家,还有个"班长"负责协调。

这样既省电又精准,确实聪明。

开源策略这一点,我个人觉得是最有胆量的。2025年1月推出R1模型的时候,直接开源,这在当时的环境下真的需要勇气。

你想想,美国那边各种技术封锁,大家都藏着掖着,DeepSeek反其道而行之,就是要开放。

结果呢?英伟达股价都被它搞跌了。这不是技术问题,这是商业模式的冲击啊!

市场格局的影响就更有意思了。8月21日的V3.1版本上线,说是悄悄的,其实业内人都盯着呢。

混合推理架构、思考效率提升、Agent能力增强...听起来都很厉害。但真正让人眼前一亮的是那个"深度思考"按钮——你可以随时切换思考模式和非思考模式。

更关键的是,它适配国产芯片的参数精度。

这意味着什么?意味着咱们不用完全依赖英伟达的GPU了!这对整个AI产业链来说,绝对是个重磅炸弹。

0
好文章,需要你的鼓励