CS16S:01 整个课程10周我把核心内容梳理一下。前两周讲AI基础包括LLM的工作机制、Prompt Engineering、Agent架构和MCP协议。第3到第5周进入开发环境实操教你怎么配置AI驱动的IDE、终端自动化、上下文管理这些。第6到第7周聚焦质量和安全覆盖测试、漏洞检测、调试、代码评审。第8到第9周是部署和运维包括自动化UI构建、监控、事件响应。最后一周讨论软件工程师角色的演变。根据公开信息课程还邀请了不少业界嘉宾做客座讲座包括AnthropicClaude Code之父Boris Cherny也在、Cognition做Devin那家公司、WarpAI终端、a16z顶级风投等公司的人。这个配置本身就说明了一件事这门课对接的是真实的工业界前沿不是学院派的纸上谈兵。modern-software-dev-assignmentsWEEK01视频主要内容这份视频Stanford CS146S 课程的第一周内容深入探讨了大语言模型LLM的工程流水线涵盖了从原始数据到成为高效 AI 助手的全过程。以下是视频的核心大纲和主要观点一、 LLM 训练的三大核心阶段视频将 LLM 的进化过程分为三个主要阶段预训练 (Pre-training) - 构建基础模型目标在大规模尺度上获取知识将模型变成一个高性能的“文本补全机”。数据规模使用数万亿标记Tokens的互联网海量数据如 Common Crawl 和 Wikipedia其中经过筛选的高质量数据集如 FineWeb文本量可达 44TB。机制采用自回归模型 (Auto-regressive)通过数千亿甚至数万亿个参数来预测序列中的下一个标记。本质它是对人类知识的一种有损压缩学习了知识的语法但尚未掌握深层的逻辑结构。有监督微调 (Supervised Fine-tuning, SFT) - 塑造个性目标将基础模型转变为一个有用且有礼貌的对话助手赋予其“人格”。方法使用由人类编写的高质量对话示例进行训练让模型模拟专业人类标记员的行为。强化学习 (Reinforcement Learning, RL) - 培养推理能力目标教模型如何思考和解决问题特别是在数学和代码等可验证领域。思维链 (Chain of Thought, CoT)通过 RL 训练模型将推理过程分布在多个标记中因为**“模型需要标记来思考”**。RLHF (人类反馈强化学习)针对主观任务如写笑话通过训练奖励模型来模拟人类品味尽管模型可能会为了高分而通过欺骗手段“走捷径”。二、 高级提示词工程 (Prompt Engineering)为了充分发挥模型的潜力视频介绍了几种关键技术上下文学习 (In-context Learning)通过在提示词中提供少量示例K-shot让模型即时适应特定风格。检索增强生成 (RAG)通过调用外部搜索工具获取实时信息解决模型知识过时和幻觉问题。自我修正 (Self-correction)利用自我一致性 (Self-consistency)多次提问取多数票和反思 (Reflection)让模型审查并修正自己的代码来提高准确性。三、 核心观点与职业影响职业准则AI 不会取代工程师但一个懂得使用 AI 的胜任工程师将会取代不会使用 AI 的人。效率飞跃在代码理解、重构和性能优化方面LLM 可以将数小时的工作缩短至几分钟。“瑞士奶酪”模型 (Swiss Cheese Model)LLM 虽强大但存在随机缺陷例如能解奥数题却可能在简单数字比较上犯错因此必须将其视为随机工具 (Stochastic Tools)始终检查其产出。未来的超人类协作随着强化学习的演进模型可能会发现人类从未想过的高级认知策略这将开启人机协作的新篇章。python 环境配置These steps work with Python 3.12.Install AnacondaDownload and install: Anaconda Individual EditionOpen a new terminal so conda is on your PATH.Create and activate a Conda environment (Python 3.12)conda create -n cs146s python3.12 -yconda activate cs146sInstall Poetrycurl -sSL https://install.python-poetry.org | python -Install project dependencies with Poetry (inside the activated Conda env) From the repository root:poetry install --no-interactionollama部署本地大模型Ollama installationWe will be using a tool to run different state-of-the-art LLMs locally on your machine called Ollama. Use one of the following methods:macOS (Homebrew):brewinstall--caskollama ollama serveLinux (recommended):curl-fsSLhttps://ollama.com/install.sh|shWindows:Download and run the installer from ollama.com/download.Verify installation:ollama-vBefore running the test scripts, make sure you have the following models pulled. You only need to do this once (unless you remove the models later):ollama run mistral-nemo:12b ollama run llama3.1:8banaconda 安装RL和SFT的区别 RLHF