人工智能工具使用总结

总结一下我现在使用的人工智能工具。

现在最高频使用的是谷歌两件套，Gemini与NotebookLM，从Gemini而言，一开始只是试试，但是一旦进入这个生态就不太能离手，主要是针对每一个话题都开了一个对话进程，比如准备公众号文章、提炼报告概述、SKILL的技巧以及如何操作Obsidian，这种话题的优势在于，它可以记住过去所有沟通的信息以及达成的基本规则（比如报告概述1500字，用中文），积累的多了，就成为一个财富，关键是，它在所有问题上都没有掉过链子，无论是编写一段Python，还是指导如何使用一个人工智能工具，这其中也包括中国的人工智能平台，比如我就是在Gemini的指导下知道了怎么在可画中把一个图片格式的PPT中的文字提取出来从而可以进行文字编辑。可以说，它算是一个老大哥，有它在，就不慌。

NotebookLM算是一个专家，一个迄今为止还无法超越的专家，将各种文档扔给它，就可以形成相当高水准的输出，尤其是NotebookLM的演示文稿与信息图，那基本上是碾压式的存在，别说超越，连接近的都没有。唯一的瑕疵是偶尔中文会出点小问题（这个是nano通病），而且输出完全是图形化的，但是从关键信息提炼到形成最容易被人理解的呈现方式，可以说顶级咨询公司也不过如此。所以说这个工具基本上是无法替代的，小试了一下它的音频生成功能，立刻就听出来我曾经听的一个播客就是这么做的，不过不敢多试，额度有限，拿来做演示文稿都不够用。曾经想要充值，但是无法打通充值通道于是只能放弃。

Thae是个多面手，从开发一个软件到公众号的排版，基本上想干的事用对话的方式就可以做的七七八八，对于在这个领域深耕的人（尤其程序开发），应该是个强大的武器，不过我暂时用不到，只是浅尝而已。

电脑上还装了一个夸克，充值了的，算是一种支持吧，平时各种生活问题与信息查询还有事实核实，就可以交给它，比如昨天提到的那个关于人工智能的文章，是先在别人微博中看到的，微博里只提到了中文名，把这个信息扔给夸克（千问），它可以直接帮助找出原文链接。

还有就是浏览器上安装的DeepSider，也是充值的，好处在于可以调用包括Gemini在内的各种人工智能应用，由于可以充值，所以一些工作，比如用nano作图，就交给它了，后续还会在这里琢磨一下sora的视频功能。

然后就是昨天尝试了一下的Vidu，国产视频生成工具，尝试了一下很强大，但是太贵了，这个或许适合企业做视频内容，对于只是好奇的个人有点太奢侈了。

然后就是可画，用它做一些演示文稿，只不过看过NotebookLM后，其他做出来的怎么都觉得差点意思。

最后就是昨天刚装的Clawdbot，这个东西很厉害，就是不稳定，安装调试都很费劲。麻烦与不稳定是可以理解的，因为一方面这个工具很新，另外一方面它算是破圈，就是用一种简单粗暴的方式强行将人工智能的能力植入到传统体系中，它基本上就是在模拟一个人在电脑上操作，大量使用最通用的CLI命令，而不是用智能体之间通讯的MCP，如此简单粗暴，问题频出也是难免的，但是的确是一个方向。

目前就是这些，下一步视频制作可以先放放，贵，而且一时半会用不上，音频制作（比如播客）可以尝试一下，作图以及演示文稿制作需要加强，还有就是各种智能体了。

基本上就是看我多快被替代。

发布于北京