黄健楸 25-08-19 14:34
微博认证:AI博主

谷歌Gemini现在能直接读指定网页内容。除了网站内容,还可以直接读图片(图一)、PDF(图二),感觉又干灭了一个赛道

可在AIStudio开启URL context选项试用(图三),注意要完整的URL链接,即带https://

0️⃣用例0️⃣
1️⃣读论文(图二)
2️⃣社区分析。(图四)
3️⃣分析代码。(图五,大体能看懂代码,但不可尽信)
4️⃣其他“主题阅读”。可以多个网站同时分析、对比、检查这点,可以深挖许多需求。

0️⃣限制0️⃣
1️⃣模型本身限制。这个功能直接将网站内容发给大模型,价格也是大模型词元价格;
2️⃣网址数量。二十个;
3️⃣内容大小。单个网址检索的内容大小上限为 34MB;
4️⃣文件类型:PDF、PNG、JPG、BMP、WEBP、TXT、RTF、HTML、JSON、XML、CSS、JS、CSV ;
5️⃣特殊的,付费内容、在线文档等不支持。

虽然能配合搜索,但中文用例貌似不太机灵的样子(图六、图七)

文档详见🔗 ai.google.dev/gemini-api/docs/url-context 🔗

不由感叹一句,谷歌工程能力相当强悍

发布于 广东