Sigmoid 函数‌（又称 S 型函数或 Logistic 函数）-北京尧图网络科技有限公司

Sigmoid 函数‌又称 S 型函数或 Logistic 函数是机器学习和深度学习中一种极其重要的激活函数。它的名称来源于其图像形状类似字母“S”。1. 函数定义与公式Sigmoid 函数的数学表达式为σ(x)11e−xσ(x)1e−x1其中 ee是自然对数的底数。该函数将任意实数输入 xx映射到 (0,1)(0,1) 的开区间内。2. 主要特点‌输出范围受限‌无论输入多大或多小输出始终在 0 到 1 之间。这一特性使其非常适合用于表示‌概率‌。‌平滑连续‌函数处处可导且导数可以用自身表示σ′(x)σ(x)(1−σ(x))σ′(x)σ(x)(1−σ(x))这在反向传播算法中计算梯度非常方便。‌单调递增‌随着输入增加输出也单调增加。‌中心对称‌关于点 (0,0.5)(0,0.5) 中心对称。3. 在机器学习中的应用‌二分类问题的输出层‌由于输出值在 0-1 之间Sigmoid 常被用作二分类模型如逻辑回归最后一层的激活函数输出结果可以直接解释为正类的概率。‌门控机制‌在循环神经网络RNN及其变体如 LSTM、GRU中Sigmoid 用于控制信息的流动如遗忘门、输入门决定哪些信息需要保留或丢弃。‌早期神经网络的隐藏层‌在深度学习早期Sigmoid 曾广泛用于隐藏层但后来逐渐被 ReLU 等函数取代。4. 优缺点分析‌优点‌输出范围固定便于解释为概率。函数平滑梯度计算简单。‌缺点‌‌梯度消失问题‌当输入值非常大或非常小时函数的梯度趋近于 0。在深层网络中这会导致反向传播时梯度几乎无法传递到浅层使得模型难以训练。‌计算成本高‌涉及指数运算 e−xe−x相比 ReLU 等线性分段函数计算速度较慢。‌输出非零中心‌Sigmoid 的输出始终为正这可能导致后续层输入的均值偏移影响收敛速度。5. 与其他函数的对比‌vs Tanh‌Tanh 也是 S 型但输出范围是 (−1,1)(−1,1)以 0 为中心通常比 Sigmoid 收敛更快但仍存在梯度消失问题。‌vs ReLU‌ReLU 在正区间梯度恒为 1有效缓解了梯度消失问题且计算极快因此在现代深度神经网络的隐藏层中ReLU 及其变体如 Leaky ReLU已 largely 取代 Sigmoid。总结来说Sigmoid 函数在‌二分类输出层‌和‌门控机制‌中依然不可或缺但在深层网络的隐藏层中由于其梯度消失缺陷已不再是首选激活函数。

Sigmoid 函数‌（又称 S 型函数或 Logistic 函数）

相关新闻

Transformer 注意力机制深度剖析：从点积到多头注意力的计算图与工程实现

Rust Unsafe 代码编写规范：边界安全与裸指针的工程化实践

10 个实用的 Shell 脚本

最新新闻

孤能子视角:记忆空间

为什么说补充铁锌维可以让毛囊变黑

2026年企业AI数字人直播软件到底哪个靠谱？

市面上口碑好的木豆素Cajaninstilbene Acid标准品对照品生产商哪个好

为什么你的Prompt每次都不准？10条案例说明白

专为函授 / 成人本科打造：5 款 AI 论文工具实测，写作效率翻倍，一次性稳过查重

日新闻

千问AI眼镜：阿里AI战略急先锋，能否在激烈竞争中突围？

四通道全隔离RS485模块设计与工业应用

N_m3u8DL-RE：从零开始掌握流媒体下载的终极指南

周新闻

深入解析P89LPC932A1 CCU模块：输入捕获与PWM实战指南

进化博弈论解析AI代理欺骗行为与风险管控

SCF5250 FlashMedia接口与DMA控制器配置实战：实现嵌入式存储高效数据传输

月新闻