Hacker News

我宁愿读指令

作者: claytonwramsey | 发布时间: 2025-05-05 03:17:28

内容摘要

使用大型语言模型进行写作的弊端

本文批判了过度依赖大型语言模型（如 ChatGPT）进行写作的现象。作者认为，无论是学生、博主、评论者还是学术论文审稿人，都不应让电脑替自己执笔。文章首先通过一个模拟的学生回答为例，指出大型语言模型生成的文本具有冗长、空洞、风格化（倾向于使用加粗的项目符号列表）且缺乏原创性的特点，很容易被识别。

作者分析了人们使用语言模型写作的潜在原因，包括觉得写作不重要、认为模型能产生更好的作品（尤其是在非母语使用者或初学者中），以及出于商业或推广目的（“利益攸关”）。然而，文章的核心论点是，人类写作的主要目的是传达原创思想，无论是琐碎的个人经历还是复杂的学术观点。语言模型本身没有思想，其输出只是对现有文本的模仿和拼凑，使用模型写作比抄袭更糟糕，因为它甚至无法传达人类的观点。

对于那些认为写作目的不重要的情况，作者认为如果内容本身没有价值，那么通过语言模型生成文本只会浪费时间和精力。即使是看似不重要的课堂写作或学术审稿，其背后也应包含思考和理解，而语言模型无法提供这些。

对于认为模型能写得更好的情况，作者反驳说，语言模型生成的文本往往模糊了原文意义，增加了不必要的废话，甚至可能编造细节。虽然语法可能看似流畅，但缺乏人类作者对内容的内在理解。特别是在编程领域，“意念编程”（vibe coding）过度依赖模型生成代码，导致程序缺乏“理论”基础（对代码逻辑结构的理解），产生有安全漏洞且难以理解和维护的“死胎”程序。

作者通过一个实验进一步证明，将文章的引言输入大型语言模型后，模型生成的续写内容乏味、空洞，只是对原意的冗长重复，缺乏深度和原创性。

最终的结论是，无论何种形式的生成式创意输出（文本、图像、音频、视频），其内容都缺乏人类视角和深度，不如直接呈现促成其生成的原始“提示”。写作的意义在于分享自身的经历和思想，如果缺乏这些，就没有写作的价值。作者呼吁停止使用电脑代笔，强调人类原创思想的价值远高于大型语言模型生成的任何内容。

讨论焦点

这些热门讨论主要围绕使用大型语言模型（LLM）的有效性、影响和争议展开。讨论焦点包括：1. LLM 生成文本的质量和冗余问题。2. LLM 在不同领域的实际应用（工作、创意写作、学术、编程）。3. LLM 对个人能力、教育和就业市场的影响。4. LLM 检测和作弊问题。5. 关于在工作交流中使用 LLM 摘要的态度和争议。作者 necovek 指出工作中使用 LLM 产生大量无意义文本，认为只需要更简洁的原始输入。作者 jsheard 和 necovek 讨论聚焦 LLM 像反压缩算法，将简单想法变成臃肿混乱，质疑其价值，认为只有提供者受益。作者 throwawaysleep 则反驳 jsheard 的观点，认为他个人在工作中成功利用 LLM 产生的冗余文本（如白皮书、Jira 任务、文档）来显得复杂和全面，并获得赞扬。作者 musicale 对 jsheard 的观点进行补充，认为 LLM 主要擅长数据和文本的翻译和缩减，而非扩展，除非是重复性或样板文本。作者 charlieyu1 认为冗长的写作要求是人类的问题而非 LLM 的问题。作者 kace91 评论说用 LLM 猜原始提示就像有损美化。作者 agentultra 对 kace91 的评论表示，利用先进技术和大量能源做这样的事情效率低下。作者 roarcher 分享了与业务分析师（BA）合作的负面经历，该 BA 使用 ChatGPT 生成需求导致难以理解和矛盾的文本，引发作者 roarcher 的愤怒，评论说这令人非常沮丧。作者 ortusdux 分享了一个漫画，暗示 AI 生成和 AI 阅读的循环。作者 ponector 提出 LLM 对提升句子柔和度和礼貌性有用，对比可能对美国人显得粗鲁的直白文本。作者 kevinventullo 提出了 LLM 压缩复杂思维的正面用途，通过键入杂乱的想法让 LLM 总结，认为其输出更清晰有效，并引用了帕斯卡的话作为类比。作者 bost-ty 赞同原文作者观点，认为提示本身比 LLM 输出更有趣、原创和人性化。作者 bost-ty 结合自身编程经验，认为垃圾提示得到垃圾代码，并希望听到创意写作和学术写作方面的反驳。作者 Herring 回应 bost-ty，认为 Gemini 在创意写作方面表现优秀，但需要仔细提示和编辑。作者 CuriouslyC 进一步回应 Herring，分享了她主要使用 Gemini 进行创意写作的经验，强调其长上下文能力的价值，如作为测读书人，并指出互动方式比具体模型更重要。作者 vunderba 同意 bost-ty 的观点，强调开放式提示导致平庸和通用的回应是问题的症结，以 DND 战役创作为例，认为 LLM 不擅长自由构思，但可以作为出色的发声板。作者 vunderba 提出一个具体提示，预测 LLM 会给出公式化的物理谜题。作者 Nezteb 尝试了 vunderba 的提示并加入限制，结果输出了无意义的内容。作者 johnfn 尝试了 vunderba 的提示，确实得到了沙漏主题但非物理的谜题。作者 sillysaurusx 回应 vunderba 的例子，认为将温度调至 1.0 导致结果很差，0.7-0.8 是最佳范围。作者 echelon 回应 bost-ty 的求助，分享了他们使用图像和视频扩散模型进行创意工作的例子，但表示仍然不喜欢 LLM。随后在分支 3 回应作者 Ancalagon 时，作者 echelon 再次提及他们的视频作品，并反对原文作者认为生成输出缺乏人类愿景的观点，认为世界会segregate into use LLMs for end-to-end tool or for enhancing human creativity. 作者 ineedasername 对作者 echelon 提供的视频作品的原始输入（图像生成提示词）评论，认为这种输入并不吸引人除非是创作者。作者 necovek 回应 echelon 的视频，表示即使不是创作者，对生成式 AI 的能力和限制感兴趣，宁愿看提示词也不愿看视频。作者 buu700 回应 bost-ty，认为原文作者可能过度概括了他的结论，作者 buu700 描述了他使用 LLM 进行写作的方式，即将大量信息输入 LLM，然后迭代优化，认为这种方式下的最终输出是人与 AI 协作的结果，而只“读提示”是荒谬的。作者 satisfice 回应 buu700，对 LLM 辅助作品表示不信任，认为公众会将此类作品完全归功于 AI，降低个人贡献的价值，担心优秀作品会在大量平庸作品中被淹没。作者 palata 回应 buu700，质疑作者 buu700 在处理信息时的深度，认为只是将信息投入 LLM 并被说服其生成内容合理，并认为作者 buu700 的产出不值得阅读，因为缺乏深度思考和个人观点，强调与实际吸收信息、形成观点的人交流才有趣。作者 sigotirandolas 回应 bost-ty，认为 LLM 在语法、句法审查和查找词语方面有用，但在结构方面作用不大，因为写作的关键是清晰的理解，而非 LLM 能提供的。作者 Ancalagon 支持原文作者观点，但承认经济和学历障碍使得许多人视学历为求职门槛，雇主也助长了复制粘贴式工作，认为世界将被 AI 消耗。作者 bruce511 回应 Ancalagon，讨论了学历作为聪明的代理、以及将学历普及导致学生只关心通过考试获取证书的问题，但强调仍有少部分学生抓住机会真正学习。作者 squigz 回应 bruce511，同意学生只关心证书是因为公司只关心证书，将其作为检查项而非能力的代理。作者 mrweasel 回应 Ancalagon，担心 LLM 已经培养出无法脱离 AI 工作的开发者，认为虽然使用 LLM 辅助工作可以，但不能完全依赖，否则无法处理敏感数据、复杂问题，也无法提升个人技能。作者 mezyt 回应 mrweasel，以反驳的姿态类比自己离不开编译器、 IDE 和静态分析，暗示依赖工具是常态。作者 bee_rider 回应 mrweasel，认为问题不在于能否脱离 LLM，而在于能否理解生成的代码并对其负责，认为理解代码的开发者使用 LLM 是可以接受的，而不理解就推送是野蛮和不负责任的行为（类似于从 Stack Overflow 复制粘贴）。作者 otabdeveloper4 回应 mrweasel，指出许多有开发者工作的人甚至不会写基本的函数，认为问题在于许多开发者本身就没有编程能力。作者 palata 回应 Ancalagon，认为依据学历招聘的人与通过 LLM 获得学位的人价值相当，建议改变评估学生的方式，如通过讨论来考察理解深度，但也更可能认为 LLM 会让一切变得更糟。作者 echelon 在此分支中回应 Ancalagon，表示不完全支持原文观点，重申了 LLM 的两种使用方式，并再次分享视频作为 AI 增强人类创造力的例子。作者 oncallthrow 讨论了 LLM 作弊检测的“假发谬误”，认为低级作弊易于检测，但高明的作弊难以察觉，表示这会破坏审查学生作品的乐趣，因此教师可能会选择离开。作者 Retr0id 回应 oncallthrow，质疑高明作弊难以检测的说法，询问是否有例子，因为他本人从未得到不像 LLM 风格的直接输出。作者 AstroBen 回应 Retr0id，分享了一篇关于 LLM 影响 r/changemymind 用户观点的研究。作者 lionkor 回应 oncallthrow，认为教师的职责是教学而非抓作弊，如果学生作弊是家长允许的，学生最终会在生活中失败。作者 SoftTalker 回应 lionkor 的观点，指出许多现有教育体系中教师的职责是确保一定比例的学生通过国家评估，与家长是否关心无关。作者 sillysaurusx 回应 lionkor，质疑“孩子会在生活中失败”的说法，认为大量学生作弊但最终成功，许多人渴望孩子上大学就是例证。作者 palata 回应 oncallthrow，提出了通过与学生讨论来判断作品真实性的方法，并结合自身招聘经验，强调通过自然交流了解候选人的兴趣和知识深度比标准化测试更有效。作者 makeitdouble 回应 oncallthrow，认为学生通过各种方式（抄袭、找人代写等）不自己完成作业一直存在，AI 只是使其更容易、更易检测和更易规模化，认为这加剧了问题但本质未变，教学本就不应只依赖提交的作品。作者 ineptech 讨论了在工作邮件中使用 Copilot 摘要引发的争议，不同观点包括认为摘要有助于统一理解、是尽职的表现，以及认为摘要是无意义的干扰、是能力不足的表现。讨论无法达成一致。作者 crooked-v 回应 ineptech，认为在摘要中注明“Copilot says”是某种形式的怯懦，为避免责任。作者 triyambakam 反驳 crooked-v，认为这更多是诚实透明，但也可能是懒惰。作者 makeitdouble 也反驳 crooked-v，认为这可能是透明的表现，因为 AI 摘要本身就带有 AI 风格。作者 jsheard 回应 ineptech，指出即使在支持 LLM 的社区（如本站），LLM 复制粘贴的评论也会被迅速降票，反映出人们普遍不愿意阅读他人产生的杂乱内容。作者 jddj 回应 ineptech，表示看了其网站，觉得有趣不失望。作者 coliveira 回应 ineptech，认为在邮件中添加 AI 摘要是承认能力不足，因为任何人都可以自己做摘要，这就像添加谷歌搜索结果页面。作者 prymitive 回应 ineptech，认为 Copilot 摘要有时只是对简单事情的过度阐述，而非真正的总结。作者 duskwuff 回应 ineptech，认为 LLM 本身就不擅长总结结构不良的文本，容易遗漏重点和混淆矛盾之处。

目录

我宁愿读指令

内容摘要

讨论焦点

3D 打印设计

内容摘要

讨论焦点

Helmdar：穿着轮滑鞋扫描布鲁克林

内容摘要

讨论焦点

大型语言模型现代采样傻瓜指南

内容摘要

讨论焦点

Go 中的优雅关闭：实用模式

内容摘要

讨论焦点

选举总督的复杂流程

内容摘要

讨论焦点

类型化 Lisp，入门

内容摘要

讨论焦点

机械蝉演奏帕赫贝尔的卡农

内容摘要

讨论焦点

不停响的亚拉巴马州固定电话

内容摘要

讨论焦点

KaiPod Learning (YC S21) 正在招聘工程副总裁

内容摘要

讨论焦点

Thunderscope 更新：我的看法：开源为何更好

内容摘要

讨论焦点

TScale – 在消费级GPU上进行分布式训练

内容摘要

讨论焦点

最小化 Linux 引导加载程序 (2018)

内容摘要

讨论焦点

无穷的阶

内容摘要

讨论焦点

批判性程序阅读 (1975) [视频]

内容摘要

讨论焦点

载入-存储冲突

内容摘要

讨论焦点

大语言模型作为无偏预言机

内容摘要

讨论焦点

在儿童中，脑电图监测意识可安全减少麻醉剂用量

内容摘要

讨论焦点

间隔23年的天空巡天发现了备受争议的第九行星证据

内容摘要

讨论焦点