面对海量数据,如何让机器从“死记硬背”进化到“神机妙算”?Lena 和 Eli 将带你拆解线性回归、逻辑回归与 SVM 的核心逻辑,助你掌握从概率预测到模型评估的实战技巧,在数据中寻找确定性。

机器学习的本质其实就是一种从经验中学习的能力,它让我们意识到数据不再是冰冷的记录,而是蕴含着规律的矿脉,让我们能从过去的数据里挖掘出对未来的确定性。
This lesson is part of the learning plan: '机器学习与生成式 AI 进阶路径'. Lesson topic: 构建回归与分类模型 Overview: 学习线性回归、逻辑回归及支持向量机等核心监督学习算法。 Key insights to cover in order: 1. 线性回归通过计算特征的加权和来预测连续值,而逻辑回归则利用 Sigmoid 函数将输出映射为概率进行分类。 2. 支持向量机(SVM)通过寻找最大化类间间隔的超平面来提升模型的泛化能力,尤其适用于中小型复杂数据集。 3. 模型评估不能仅依赖准确率,必须综合考虑精确率、召回率和 F1 分数,以应对类别不平衡等现实挑战。








虽然逻辑回归的名字中带有“回归”二字,且其底层逻辑确实是基于线性回归的加权和计算,但它的最终用途是处理分类问题。它通过引入一个名为 Sigmoid 的函数,将线性回归输出的连续数值压缩到 0 到 1 之间的概率值。通过设定一个阈值(通常为 0.5),模型可以将这些概率转化为明确的类别判断,从而解决“是非题”而非预测连续的数值。
准确率在处理“类别不平衡”的数据集时会失效。例如,在罕见病检测中,如果 1000 个人里只有 1 个病人,一个只会预测“所有人健康”的偷懒模型也能达到 99.9% 的准确率,但它完全漏掉了唯一的病人。因此,开发者需要引入精确率(预测出的病人中有多少是真的)、召回率(所有病人中抓到了多少个)以及 F1 分数(两者的综合平衡)来更真实地衡量模型性能。
支持向量机使用一种被称为“核函数”的技术来处理复杂数据。当数据在低维空间(如平面)中混杂在一起无法用直线分开时,核函数会将这些数据投射到更高维的空间中。在这个高维空间里,原本混杂的数据可能会变得层次分明,从而允许模型插入一个“超平面”将它们完美分开。
过拟合是指模型在训练过程中过度学习了数据中的噪音和细节,导致它像是一个死记硬背的学生,虽然在练习题(训练集)上表现完美,但在面对新数据(测试集)时却无法灵活应对。为了解决这个问题,开发者通常会将数据分为训练集、验证集和测试集,通过在不同阶段的数据表现来确保模型具备真正的“泛化能力”,而不是仅仅记住了答案。
神经网络由输入层、隐藏层和输出层组成,模仿大脑神经元传递信号的方式。它通过“反向传播”机制进行学习:模型先给出一个预测结果,如果发现错误,错误信号会从输出端向输入端反向传递,告诉前面的每一个神经元如何调整连接权重。这种层层递进的结构让它能够自动提取特征,例如在图像识别中,不同的隐藏层可以分别识别线条、圆圈,最终组合成对复杂形状的认知。
From Columbia University alumni built in San Francisco
"Instead of endless scrolling, I just hit play on BeFreed. It saves me so much time."
"I never knew where to start with nonfiction—BeFreed’s book lists turned into podcasts gave me a clear path."
"Perfect balance between learning and entertainment. Finished ‘Thinking, Fast and Slow’ on my commute this week."
"Crazy how much I learned while walking the dog. BeFreed = small habits → big gains."
"Reading used to feel like a chore. Now it’s just part of my lifestyle."
"Feels effortless compared to reading. I’ve finished 6 books this month already."
"BeFreed turned my guilty doomscrolling into something that feels productive and inspiring."
"BeFreed turned my commute into learning time. 20-min podcasts are perfect for finishing books I never had time for."
"BeFreed replaced my podcast queue. Imagine Spotify for books — that’s it. 🙌"
"It is great for me to learn something from the book without reading it."
"The themed book list podcasts help me connect ideas across authors—like a guided audio journey."
"Makes me feel smarter every time before going to work"
From Columbia University alumni built in San Francisco
