大模型是否真的在“推理”?一种重新定义逻辑推理的思考
这几年,大语言模型(比如 GPT 系列)的能力持续提升。它们现在不仅能处理复杂的问题,还能生成条理清晰的解释,甚至在逻辑推理任务中的表现,也越来越接近人类。 这个趋势让我开始认真思考一个问题:它们真的在“推理”吗? 按照我们过去的理解,“逻辑推理”是...
这几年,大语言模型(比如 GPT 系列)的能力持续提升。它们现在不仅能处理复杂的问题,还能生成条理清晰的解释,甚至在逻辑推理任务中的表现,也越来越接近人类。 这个趋势让我开始认真思考一个问题:它们真的在“推理”吗? 按照我们过去的理解,“逻辑推理”是...
最近有一件让我特别开心的事情。 我的英语口语水平突然有了显著提升。昨天我们组开了一个复盘会议,平时内向腼腆的我,竟然能够用英语在全组面前侃侃而谈,而且还讲得很有结构感。 我的表达套路其实挺清晰的: 先指出“我讲的主题是什么”——这个很重要。 接着讲...
两周没写文章了,感觉隔了很久。 自从上次熬夜写完《如何爱上健身》那篇文章后,我的生活就陷入一种自动循环,很平淡,像机器一般地运行。有些事在推进,有些事停滞。今天复盘了过去几个月的状态,问题不少。 最大的问题是,我忽然意识到:我已经厌倦了写“情绪”与“...
健身半年以上了,最近成果显著,身材有变化,精神也有变化。是时候写篇文章,复盘一下我是怎么从0开始、摸索、踩坑、最终形成稳定健身习惯的。 去年5月(2024.5),我开始有氧训练——跑步。我很喜欢看 Institute of Human Anato...
加州理工学院Charles C. Lauritsen高能物理实验室1985年10月14日 致 Stephen Wolfram 博士普林斯顿高等研究院自然科学学院 亲爱的Wolfram: 我并不认为当前科学的组织结构会妨碍“复杂性研究”——我...
一位曾是Tomonaga学生、后来也成为Feynman学生的人写信向他表示祝贺。Feynman回信询问他现在在做什么。对方答复说:“我正在研究相干理论,并将其应用于电磁波在湍流大气中的传播……这是一个朴实而脚踏实地的问题。” 亲爱的Koichi:...
最近写文章,越来越难了。每次想写一个主题,我总觉得素材积累不够;或者,哪怕有了一个思路,头脑里想一遍,假想出来的内容毫无吸引力。 比如今天我想写的主题是:“我无法创造的东西,我就不懂。”这是一个让我很有共鸣的观点,今天正好看到这句话,我非常认同。 我...
「Happy Path」陷阱是什么?「Happy Path」(快乐路径) 指的是在系统设计、软件开发或业务流程中,只考虑最理想、最顺利的执行路径,而忽略异常情况、边界条件或用户非预期行为的现象。 简单例子假设设计一个用户登录功能: Happ...
说实话,每当我站在杠铃前准备开始训练时,我都会忍不住想:这根看似简单的铁棒,竟然能引发我体内如此复杂而精妙的生理级联反应!作为一个对运动科学痴迷到几乎”病态”的研究者,我今天想和你分享力量训练背后那些令人着迷的科学机制——相信我,当你真正理解了这些...
The Unreasonable Effectiveness of an LLM Agent Loop with Tool Use文章基本信息 标题:The Unreasonable Effectiveness of an LLM Agent Loo...