关于前几天大模型使用的调查。
前四名依次是:豆包、DS、GEMINI、千问,用户数远远超过其他大模型。
从我个人的使用体验来说,豆包在专业问题上的逻辑性和准确性非常差,我被坑了几次彻底放弃了,现在只会问生活类问题。我也提醒大家注意,在问专业问题时,一定要小心求证。
DS很好用,但之前算力资源太差,我现在都是用元宝的DS内核,感觉一般的专业场景够用了,尤其是偏信息收集类的问题。不知道元宝和DS是不是有很大区别?
GEMINI是最猛的,逻辑深度秒杀国产大模型,而且信源大量采用海外专业媒体,有效突破中文财经媒体的语料弱智和片面的障碍。遇到需要深入分析讨论的问题我会选择GEMINI,比如前一阵我跟GEMINI讨论了很久为什么高市上台日元反而升值。虽然结论和元宝的结论大同小异,但在分析的过程中,GEMINI甚至会引用相关的经济学公式来阐述逻辑。唯一的问题就是GEMINI登录麻烦且大陆用户无法付费。
千问我还没用过,之前还叫通义千问的时候被豆包摁在地上打我就卸载了,回头试试。我个人很反感千问靠点奶茶来获客的玩法,主观上就有些偏见。
这两天很火的某港股上市没进恒科没进港股通涨得很好的大模型,我用了一下,印象极差。这玩意在问答方面就是弱智,这水平肯定撑不起股价。据说新模型编程水平极高,有没有程序员朋友点评一下?反正我感觉最近的很多动作更像是“市值管理”。
去年有朋友有机会接该公司的PREIPO份额,问我看法,我给出了否定意见。现在想想实在是对不起人家。
但我还是觉得未来能活下来的大模型只会是大厂出品。
所以恒科跌得亲妈爆炸我也硬着头皮拿着,一方面相信AI的价值还是由恒科创造,一方面这些公司安全垫够厚。
发布于 四川
