大模型使用体验对比

关于前几天大模型使用的调查。
前四名依次是：豆包、DS、GEMINI、千问，用户数远远超过其他大模型。

从我个人的使用体验来说，豆包在专业问题上的逻辑性和准确性非常差，我被坑了几次彻底放弃了，现在只会问生活类问题。我也提醒大家注意，在问专业问题时，一定要小心求证。
DS很好用，但之前算力资源太差，我现在都是用元宝的DS内核，感觉一般的专业场景够用了，尤其是偏信息收集类的问题。不知道元宝和DS是不是有很大区别？
GEMINI是最猛的，逻辑深度秒杀国产大模型，而且信源大量采用海外专业媒体，有效突破中文财经媒体的语料弱智和片面的障碍。遇到需要深入分析讨论的问题我会选择GEMINI，比如前一阵我跟GEMINI讨论了很久为什么高市上台日元反而升值。虽然结论和元宝的结论大同小异，但在分析的过程中，GEMINI甚至会引用相关的经济学公式来阐述逻辑。唯一的问题就是GEMINI登录麻烦且大陆用户无法付费。
千问我还没用过，之前还叫通义千问的时候被豆包摁在地上打我就卸载了，回头试试。我个人很反感千问靠点奶茶来获客的玩法，主观上就有些偏见。

这两天很火的某港股上市没进恒科没进港股通涨得很好的大模型，我用了一下，印象极差。这玩意在问答方面就是弱智，这水平肯定撑不起股价。据说新模型编程水平极高，有没有程序员朋友点评一下？反正我感觉最近的很多动作更像是“市值管理”。
去年有朋友有机会接该公司的PREIPO份额，问我看法，我给出了否定意见。现在想想实在是对不起人家。
但我还是觉得未来能活下来的大模型只会是大厂出品。

所以恒科跌得亲妈爆炸我也硬着头皮拿着，一方面相信AI的价值还是由恒科创造，一方面这些公司安全垫够厚。

发布于四川