应该没人看这个频道吧
我的体感是目前国内大模型使用起来差别真不大,某些个模型Benchmark分数都是追得很紧,用起来能力上感觉差不多。
豆包方便在字节会做应用,浏览器插件、播客和视频总结啥的都是他们先搞出来的。所以我看来落地比能力更重要。
另外尝试了DeepSeek的R1,貌似和GPT o1、Gemini Thinking Model类似。就是让模型“思考”(这就是所谓的后训练?)
DeepSeek这次做得很好,并且开源出来是给国内模型给了一个新“抄路”。很快通义、豆包估计也要用强化学习之类去做模型了。到时候再看DeepSeek R1能力是否还能保持领先就是一个问题了。有可能还是大厂做得更好一些。我看“大模型六小龙”至少死4个。
豆包方便在字节会做应用,浏览器插件、播客和视频总结啥的都是他们先搞出来的。所以我看来落地比能力更重要。
另外尝试了DeepSeek的R1,貌似和GPT o1、Gemini Thinking Model类似。就是让模型“思考”(这就是所谓的后训练?)
DeepSeek这次做得很好,并且开源出来是给国内模型给了一个新“抄路”。很快通义、豆包估计也要用强化学习之类去做模型了。到时候再看DeepSeek R1能力是否还能保持领先就是一个问题了。有可能还是大厂做得更好一些。我看“大模型六小龙”至少死4个。
最近DeepSeek风声是真大,我就比较好奇啊,到底是真本事还是舆论衬得它厉害了。
另外发现林亦做的这个大模型野榜竟然把DeepSeek给撤下去了,不知是什么原因。。。上星期看的时候还有DeepSeek的说,并且当时看榜的时候确实是DeepSeek屠榜,然而是v2.5模型屠的榜,而不是靠最近很火的“超越GPT4o”的MoE模型v3拿的榜首。当然了,我只是提到这一有趣的现象,这榜确实是野榜,并不能准确说明什么问题。
另外就是榜上的模型能力和我体感感受差距还是比较大的。理论上GLM、Gemini、Qwen很强,但我觉得这几个并不好用,目前还是GPT用的比较多。
当然如果有时间尝试一下别的模型也是好的。
另外发现林亦做的这个大模型野榜竟然把DeepSeek给撤下去了,不知是什么原因。。。上星期看的时候还有DeepSeek的说,并且当时看榜的时候确实是DeepSeek屠榜,然而是v2.5模型屠的榜,而不是靠最近很火的“超越GPT4o”的MoE模型v3拿的榜首。当然了,我只是提到这一有趣的现象,这榜确实是野榜,并不能准确说明什么问题。
另外就是榜上的模型能力和我体感感受差距还是比较大的。理论上GLM、Gemini、Qwen很强,但我觉得这几个并不好用,目前还是GPT用的比较多。
当然如果有时间尝试一下别的模型也是好的。
不说还以为是用着wm的Linux
How I make Windows look good
How I make Windows look good
哇,这什么时候推出的,我才知道
https://www.jetbrains.com/zh-cn/rust/
记得之前在哪个大佬的Rust教程里还是别的地方提到:还是希望JetBrains能出一个专门给Rust的IDE。
这下真有了
https://www.jetbrains.com/zh-cn/rust/
记得之前在哪个大佬的Rust教程里还是别的地方提到:还是希望JetBrains能出一个专门给Rust的IDE。
这下真有了
从中文互联网爬出来的人是这样的https://github.com/sunface/rust-course/issues/1439