今天手搓了一个app,叫“Loomian”。它是一个低调的个人助理。每当我在手机上截屏时,它会把图片发给服务器,生成一段描述,作为记忆素材。我还可以在app里记录一段语音片段,上传到服务器上记录转录文字。我随时可以在app(图一)上和网页端(图二)对这些记忆素材提问,像截屏里展示的那样。
它很低调,“存取记忆”这个行为只需要顺手截屏即可,这对重度依赖手机的用户来说非常方便。依托强大的大模型图像识别能力,图片中的信息可以准确提取(比如快递单号、日历行程)。它的想象空间极大:除了图片和语音,我可以在服务器加上更多记忆素材,比如实时导入Gmail,Google Doc的更新,YouTube上看过的视频,chrome浏览记录等等。这些素材之间可以联动,回应也不止产生回答,而是调用其他工具:比如我发一段语音“刚才截屏里的微信联系人记得提醒我下周follow up一下”;“今天在arxiv上看的论文,帮我生成一片Deep Research”报告。我可以在这个平台上探索各种信息素材和Agent玩法。我相信类似功能在不久地将来会逐渐出现,但是手搓一个独属自己的私人助手,创造的体验很棒。
发布于 美国
