我也在搭建AI智体,也算是深度用户,就目前状态看,工作流消耗大量Token但是创收效果不明显。
虽然能辅助很多资料整理的工作,但是给出的决策结果往往暗藏很多坑,需要反复纠错。尽管在历史事件呈现和复现推理过程中出现了很多惊人的能力,但是在实时决策过程中存在大量谬误。
这不是模型能力的问题,而是数据源和基于结果合成中依旧存在很多无法精确的随机模式,也就是他的结果依旧还是合成概率。我感觉合成幻觉在要求精准决策的交易体系里导致的偏差会造成极大的不确定风险。所以现在的模式更是证据抽取 + 方案候选 + 风险清单的组合来工作。
另外Token消耗存在依旧是难以控制的成本,要求越多推理过程越复杂,消耗的Token越大,但是结果不一定是自己想要的,这就很尴尬。
总而言之,当下大模型在解决线性推导和基于客观规律已经成型的领域相对高效甚至说优秀,所以在图文处理和编码这些有很强的可视化结构等领域很好用,但在一些需要抽象推演和决策的领域还缺少灵魂,总觉得少了点什么。
发布于 广东
