宝玉xp 23-07-11 14:47
微博认证:前微软Asp.Net最有价值专家 2025微博年度新知博主 科技博主

刚看了篇文章《Code Interpreter == GPT4.5》
http://t.cn/A60ZZMoY

类似于ChatGPT是GPT3.5,作者把Code Interpreter比作GPT4.5。

当年GPT3.5是和ChatGPT一起宣布的,其中包括了text-davinci-003和code-davinci-002两个模型。这样做有两个目的:

1. 让大家直观上了解GPT3.5模型优于GPT3(2020年份)模型
2. 表明新的聊天模式是通用人工智能的未来之路

那么对于Code Interpreter,是否也是:
1. 明显优于GPT-4
2. 这一新范式是通用人工智能的未来之路

先回顾一下Code Interpreter

Code Interpreter是一个实验性的ChatGPT模型,可以将Python写入Jupyter Notebook,并在沙盒中执行:
1. 不能联网
2. 支持最大100MB的上传/下载(包括.csv、.xls、.png、.jpeg、.mov、.mp3、.epub、.pdf、整个git repos的.zip文件
3. 预装了330多个库,如pandas(数据分析)、matplotlib、seaborn、folium(图表和地图)、pytesseract(OCR)、Pillow(图像处理)、Pymovie(ffmpeg)、Scikit-Learn、PyTorch和Tensorflow(ML)

基于上面的功能可以非常灵活的生成无数种代码组合,一些被网友们发觉出来的经典案例包括:
- 使用p5.js创建游戏 twitter.com/icreatelife/status/1678184683702566922
- 绘制备忘录 twitter.com/swyx/status/1677567255377494016?s=20
- 创建交互式仪表盘 emollick.github.io/Superhero/
- 数据预处理 http://t.cn/A60ZZMoj
- 通过文本分析比特币价格周期 twitter.com/aakashg0/status/1677129073561329664
- 编写复杂的AST操作代码 twitter.com/simonw/status/1677775703130128384?s=20
- 人脸检测 twitter.com/shacrw_/status/1677774686648713216?s=20
- 图片生成视频 twitter.com/dotey/status/1677829065540001794?s=20

在Discord上有一个 code-interpreter-output 的频道有很多精彩案例 discord.com/channels/974519864045756446/1126427755274313768

需要注意的是,Code Interpreter实际上引入了两件新事物,而不是一个,分别是沙箱和模型:

- 在七月之前的alpha测试阶段,通常只是强调Python沙盒以及在沙盒中可以做的事情,对自主编码能力只是顺便提及。
- 但上周正式发布后,重点一直放在Code Interpreter提供的模型的质量上。并且从实际使用的效果来看,它似乎比现在的GPT-4更好,比如说它不仅可以编写代码,而且可以分解成多个步骤自主运行,自主决定什么时候不继续运行,以及和用户进行交互,让用户做出选择或者进一步输入或上传新的内容。

当然现在Code Interpreter一些硬件之外的限制,比如说:
- 运行环境经常会重置代码执行状态,丢失已上传的文件,其从失败中恢复的能力有限。
- OCR能力比较弱 twitter.com/sergedoub/status/1677785441070874624
- 有些事情即使它明明可以做到,但是它有时候还是会拒绝执行,你需要“欺骗”它去继续执行 twitter.com/dotey/status/1678607399106629632?s=20
- 它没办法在代码中调用GPT3/4,因为它无法访问网络,而它又总是试图编写代码来解决问题,所以无法完成数据增强等任务。

但总的来说,Code Interpreter的能力还是令人印象深刻。

(未完待续)

发布于 美国