网易首页 > 网易号 > 正文 申请入驻

AI界的拼多多又来整活!deepseek全新上线R1-Lite预览版!

0
分享至



幻方量化旗下AI初创公司DeepSeek宣布其推理模型R1-Lite预览版正式上线!AI领域再次掀起了波澜!

DeepSeek的产品线以开源为主,包括多个百亿级参数的模型,如DeepSeek-LLM、DeepSeek-Coder,以及混合专家模型(MoE)DeepSeek-V2和V2.5。

DeepSeek-R1-Lite模型的推出,标志着公司在推理模型领域的重要进展。

DeepSeek R1系列模型采用先进的强化学习技术进行训练,其推理过程深入细致,并包含大量的反思与验证环节。

模型在思维链的长度上能够达到数万字的级别,并在数学、代码以及各类复杂逻辑推理任务上展现出卓越的性能。

正式版的DeepSeek-R1模型将完全开源

DeepSeek-R1-Lite预览版的推出,也标志着中国国产大模型在推理模型在实际应用中迈出了重要一步。

在具体的性能测试中,DeepSeek-R1-Lite在美国数学竞赛(AMC)中难度最高的AIME赛事以及全球顶级编程竞赛Codeforces等评测中,均取得了优异的成绩,甚至超越了GPT-4o等知名模型。

deepseek也在X上发布了DeepSeek-R1-Lite-Preview 在各项基准测试中的成果(如图)。


进一步验证了DeepSeek-R1-Lite在复杂逻辑推理任务上的强大实力。DeepSeek-R1-Lite的推理过程不仅长度可观,而且其包含的反思与验证环节也大大增强了其推理的准确性。

官方提供的数据显示,模型在数学竞赛上的得分与其所允许的思考长度紧密相关。


图:DeepSeek-R1-Lite预览版的推理扩展法则,推理越深入,性能越好。

换句话说,给予模型更多的思考时间,其推理的准确率也会相应提升。尽管DeepSeek-R1-Lite已经展现出了强大的推理能力,但官方表示该模型目前仍处于迭代开发阶段。目前,DeepSeek-R1-Lite仅支持在网页上使用,尚未开放API调用功能。

不过,DeepSeek公司也透露,正式版的DeepSeek-R1模型将完全开源,并公开技术报告以及部署API服务。

AI界拼多多-DeepSeek是谁?

DeepSeek(深度求索)是由幻方量化创始人梁文锋创立的AI初创公司,专注于开发通用人工智能(AGI)底层模型和技术。

公司成立于2023年,源于梁文锋在量化投资领域的成功和对AI的热衷,幻方量化是国内量化私募领域的巨头之一,管理规模曾一度飙升至千亿,为DeepSeek提供了强大的资金和硬件支持。

DeepSeek的核心技术包括其创新的MLA(多头潜在注意力机制)架构和DeepSeekMoESparse结构。这些技术使得推理成本大幅降低。

例如,DeepSeek V2模型的推理成本仅为每百万token 1块钱,远低于市场上的其他同类产品。这种架构创新不仅降低了显存占用,还减少了计算量,从而实现了成本的大幅下降。

DeepSeek的主要产品包括多个百亿级参数的模型,如DeepSeek-LLM、DeepSeek-Coder、DeepSeek-V2和V2.5等。这些模型在数学、代码和复杂逻辑推理任务上表现出色。

DeepSeek还提供了API服务,支持128K上下文长度,并且与OpenAI API兼容容。DeepSeek的API定价为每百万输入token 0.14美元,每百万输出token 0.28美元。

这一价格显著低于当前市场上的其他同类产品,仅为GPT-4-Turbo价格的近百分之一。

由此,引发了中国大模型价格战,迫使包括字节、腾讯、百度、阿里等大厂纷纷降价。

deepseek也一举成名。

也是为什么DeepSeek被称为AI界的拼多多。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
公道在欧洲,美国蒙羞日!北欧波罗的海 8 国发布乌克兰联合声明

公道在欧洲,美国蒙羞日!北欧波罗的海 8 国发布乌克兰联合声明

大风文字
2025-02-15 16:54:41
退休后不管有钱没钱,都要养成这30个好习惯,一辈子努力不进医院

退休后不管有钱没钱,都要养成这30个好习惯,一辈子努力不进医院

职场火锅
2025-02-14 21:24:43
医院回应女医生辱骂患者“老妖婆”:这次网友都站医生这边了!

医院回应女医生辱骂患者“老妖婆”:这次网友都站医生这边了!

今日养生之道
2025-02-16 11:32:54
厦门首例纯中药治癌案例入选国家成果库

厦门首例纯中药治癌案例入选国家成果库

人民日报健康客户端
2025-02-15 16:03:04
重大利好落地,明日复牌!

重大利好落地,明日复牌!

数据宝
2025-02-16 19:33:52
俄罗斯最新民意调查:高达70%俄民众支持将特别军事行动坚持到底!

俄罗斯最新民意调查:高达70%俄民众支持将特别军事行动坚持到底!

凯撒谈兵
2025-02-16 20:04:51
云浮烧炮众人被炸后续:点炮者曝光!重伤者家属发声,治疗费70万

云浮烧炮众人被炸后续:点炮者曝光!重伤者家属发声,治疗费70万

奇思妙想草叶君
2025-02-15 23:25:08
港亚控股:于2月13日购买一枚比特币

港亚控股:于2月13日购买一枚比特币

财联社
2025-02-16 18:17:14
“指纹锁”正逐渐退出中国家庭?听开锁师傅说完,我茅塞顿开

“指纹锁”正逐渐退出中国家庭?听开锁师傅说完,我茅塞顿开

阿裤趣闻君
2025-02-15 18:21:35
婆婆:儿媳,这趟旅游花了3万,你报销下,儿子:你没儿媳了

婆婆:儿媳,这趟旅游花了3万,你报销下,儿子:你没儿媳了

言言说
2025-02-15 21:28:21
一口气吃了10多个!女子痛到崩溃:再也不敢了

一口气吃了10多个!女子痛到崩溃:再也不敢了

鲁中晨报
2025-02-16 22:15:43
中美关系有变?特朗普撕破脸了,美航母突然行动,全球都慌了

中美关系有变?特朗普撕破脸了,美航母突然行动,全球都慌了

傲气经说
2025-02-16 12:45:03
大反转!莎拉强势回应,马科斯丑闻曝光,杜特尔特或将出面辩论

大反转!莎拉强势回应,马科斯丑闻曝光,杜特尔特或将出面辩论

历史有些冷
2025-02-15 21:00:03
中国U20男足刚提前出线!就收到亚足联重磅罚单,球迷直言没想到

中国U20男足刚提前出线!就收到亚足联重磅罚单,球迷直言没想到

我就爱说足球
2025-02-16 11:45:27
乌军发布“情人节惊喜”!3艘无人艇击沉俄军唯一防空导弹巡洋舰

乌军发布“情人节惊喜”!3艘无人艇击沉俄军唯一防空导弹巡洋舰

大风文字
2025-02-15 13:07:39
证监会停止降温牛市!2月16日,今日凌晨的三大消息持续发酵!

证监会停止降温牛市!2月16日,今日凌晨的三大消息持续发酵!

风口招财猪
2025-02-16 00:43:45
卡罗琳把发言人干成直播带货,各种数据信手拈来!

卡罗琳把发言人干成直播带货,各种数据信手拈来!

小蚁讲故事
2025-02-16 17:46:39
太反常了!多国媒体承认:中国已经强大到无需再向世界证明什么

太反常了!多国媒体承认:中国已经强大到无需再向世界证明什么

粤语音乐喷泉
2025-02-16 01:19:39
王钰栋将官宣签约五大联赛球队!新东家高层点名让他来,引发热议

王钰栋将官宣签约五大联赛球队!新东家高层点名让他来,引发热议

我就爱说足球
2025-02-16 14:48:50
刘晓庆美国过情人节,67岁张暴默罕见露面,两人载歌载舞好松弛

刘晓庆美国过情人节,67岁张暴默罕见露面,两人载歌载舞好松弛

扒虾侃娱
2025-02-15 19:56:39
2025-02-16 22:39:00
亿欧
亿欧
更多优质行业资讯请访问亿欧网
119575文章数 95245关注度
往期回顾 全部

科技要闻

官宣!百度搜索将接入DeepSeek

头条要闻

泽连斯基被指对特朗普发出"含蓄警告":不接受背地交易

头条要闻

泽连斯基被指对特朗普发出"含蓄警告":不接受背地交易

体育要闻

麦克朗三夺扣篮王:历史首人12扣8次满分

娱乐要闻

琼瑶去世两个月后,林婉珍也离开了

财经要闻

良品铺子遭遇上市以来最艰难时刻

汽车要闻

或全系搭华为乾崑智驾 岚图梦想家新款车型将上市

态度原创

本地
房产
教育
健康
公开课

本地新闻

非遗版春节|古法滚元宵,年味儿一口爆浆

房产要闻

热度爆表!广州的赢面,依旧很大!

教育要闻

“七招”巧解教师写作“无米炊”

抑郁症患者称好的“乌托邦”宝地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版