昨天丁源森教授来台里做了个大语言模型LLM在天文学研究中的应用和前景的报告。感觉听到了不少有意思的东西呢！1.丁老师觉得，现在我们指导AI做下游工作（比如我让AI帮我总结资料、给需求写代码）但未来可能会发展成AI指导我们开展研究（赛博博导[doge]）2.科研的本质是强化学习过程：“数据和理论

昨天丁源森教授来台里做了个大语言模型LLM在天文学研究中的应用和前景的报告。感觉听到了不少有意思的东西呢！

1.丁老师觉得，现在我们指导AI做下游工作（比如我让AI帮我总结资料、给需求写代码）但未来可能会发展成AI指导我们开展研究（赛博博导[doge]）

2.科研的本质是强化学习过程：“数据和理论”（先验知识库）、通过“分析工具”（写代码）、“评估结论”、“总结出因果关系”。在这些过程中，人类依赖经验和直觉。而丁老师针对“拟合SED”这个课题，拆分这些任务，训练了四个LLM分别执行四部操作，给定奖励函数并不断迭代。拆分任务组合LLM组合起来的效果优于prompt单个LLM，可以复现JWST的一些重大发现（高红移星系认证、寻找“小红点”等）。【但是这些赛博博士生目前还是比真的博士生贵的[doge]未来就不好说了[苦涩]】

3.AlphaFold的出现极大改变了生物学研究的方向，为什么天文领域没有经历“AlphaFold”时刻呢？因为生物比宇宙复杂太多了[开学季]！许多生物研究都是因为模型复杂度卡住了分析数据的脖子。但宇宙很简单，天文中许多标准模型只有寥寥数个参数，所以用普通方法也能搞定。

4.丁老师最新的arxiv：2407.11194（《谁赢了天文学“一站到底”》）评估了市面上的一些闭源开源的LLM在处理天文领域问题的能力。图1 展示了准确度（y轴）对比成本（x轴）。平行斜线代表性价比，越往左上跨越这些斜线，性价比越高、性能越好、技术越有突破。可以看到gpt4o确实是目前保证准确度下性价比最好的；Claude是一帮子物理学家搞出来的，准确度一骑绝尘但是贵；llama-3-8B很不行但是前几天出了个70B可以媲美gpt4o；很遗憾国产全军覆没……

发布于上海