更方更正的物理
24-07-25 09:57

昨天丁源森教授来台里做了个大语言模型LLM在天文学研究中的应用和前景的报告。感觉听到了不少有意思的东西呢!

1.丁老师觉得,现在我们指导AI做下游工作(比如我让AI帮我总结资料、给需求写代码)但未来可能会发展成AI指导我们开展研究(赛博博导[doge])

2.科研的本质是强化学习过程:“数据和理论”(先验知识库)、通过“分析工具”(写代码)、“评估结论”、“总结出因果关系”。在这些过程中,人类依赖经验和直觉。而丁老师针对“拟合SED”这个课题,拆分这些任务,训练了四个LLM分别执行四部操作,给定奖励函数并不断迭代。拆分任务组合LLM组合起来的效果优于prompt单个LLM,可以复现JWST的一些重大发现(高红移星系认证、寻找“小红点”等)。【但是这些赛博博士生目前还是比真的博士生贵的[doge]未来就不好说了[苦涩]】

3.AlphaFold的出现极大改变了生物学研究的方向,为什么天文领域没有经历“AlphaFold”时刻呢?因为生物比宇宙复杂太多了[开学季]!许多生物研究都是因为模型复杂度卡住了分析数据的脖子。但宇宙很简单,天文中许多标准模型只有寥寥数个参数,所以用普通方法也能搞定。

4.丁老师最新的arxiv:2407.11194(《谁赢了天文学“一站到底”》)评估了市面上的一些闭源开源的LLM在处理天文领域问题的能力。图1 展示了准确度(y轴)对比成本(x轴)。平行斜线代表性价比,越往左上跨越这些斜线,性价比越高、性能越好、技术越有突破。可以看到gpt4o确实是目前保证准确度下性价比最好的;Claude是一帮子物理学家搞出来的,准确度一骑绝尘但是贵;llama-3-8B很不行但是前几天出了个70B可以媲美gpt4o;很遗憾国产全军覆没……

发布于 上海