#ai的真相#
周末,把自家搞的读书软件又加了工,发现我想像的东西,有些能作到,有些不能。
-
1)首先,本地的语音朗读模型就不用想了,绝对比不上去挂微软 edge tts(浏览器的自然语音),同时解开我一个大迷惑,为什么系统 windows 自己的语音那么烂呢?
-
很简单,咱们听到的 edge tts 是有大伺服器在网络的那一端计算,并生成感情,而本机不管是自带的,还是装ai 模型,最大的问题,就是声线平直,无血无肉,听来会胆寒。
-
2)其次,edge tts 有个缺点,会宕,其实是当你读的小说句子太短太碎,请求过於密集,它会判断成攻击,於是,我又想了一招,让我的程序跳节点,一旦被挡,就跳节点再作请求。
-
3)好,问题又来了,我挂在本地的 python 很顽固,得手动关,可我怎么能容忍呢,於是又想到一招,让我的程序本体和 python 中间,建立 pin 的关系,一旦 python 接收不到 pin 了,在几十秒钟,就自动把自己给杀了。
-
4)来都来了,不然怎么办?……於是,我又想著把读书软件装上了「语音操控」,可问题很快出快,软件自己读书,自己又开著麦克风在监听,於是「开始」「停止」,只要小说中出现同样句子,它立刻反应,这可不行。
-
试了几招,终於无法可想,於是我就把原来的「读书」「开始」「跳下一段」一类字眼,全改成黑话。读书变成「读册」(闽南话的中文写法),停止叫「休困」(闽南语的休息,中文写法),跳下一段,变成「跳段」,跳上一段,变成「上跳段」。
-
终於完全。
-
5)结论(我的心得):
-
edge 真的很强,不但后台有「语音朗颂」功能,其实,「语音控制」也是内建的,只是一般人根本不知道,不会去调用。我现在电脑里有两套语音输入,一套是挂的千问的模型,一套就是直接跑 edge ,很难一语道尽。
-
其次,愈发觉得市面上一堆反人性的程序,其实都是程序猿的傻冒导致。
-
当然,我说的是屁话,因为我有 agent 帮忙,我根本不用管程序怎么写,可对於程序猿而言,我的随便一个举动,对彼而言,可能都是大工程。
-
还是老话一句,程序猿真的要小心了,饭碗得砸,不仅 ai 抢生意,连我们文科生的手都伸进来了……。
-
以上。
