太简单了的就不写了 ## A1-Q2-a-iv SGD: 每iteration只用一个 data point 进行 update,所以梯度: $$ \theta' \leftarrow \theta - \frac{2\alpha}{N} (\theta x_i - y_i) x_i $$ 总梯度: $$ \nabla_{\theta}\mathcal{L} = \frac{2}{N} \sum_{i=1}^{N}(\theta x_i - y_i) x_i $$ ## A1-Q4  ## A2-Q2 补充两个公式吧。对于均匀分布: $$ \left\{ \begin{array}{l} \mu_k = \dfrac{a_k+b_k}{2} \\[6pt] \sigma_k = \dfrac{(b_k-a_k)^2}{12} \end{array} \right. $$ 一般的二分类的边界: $$ d(x) = \ln \frac{P(X|Y=0)P(Y=0)}{P(X|Y=1)P(Y=1)} $$ 当然也可以写成超平面的形式。 ## A2-Q4 重点: $$ \frac{P(Y=1|X)}{P(Y=0|X)} = \frac{P(Y=1)P(X|Y=1)}{P(Y=0)P(X|Y=0)} = \frac{\pi \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_{i,1}}} \exp \left( - \frac{(X_i - \mu_{i,1})^2}{2\sigma_{i,1}^2}\right)}{(1 - \pi ) \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_{i,0}}} \exp \left( - \frac{(X_i - \mu_{i,0})^2}{2\sigma_{i,0}^2}\right)} \label{eq:og-disc-form} $$ ## A3-SVM 见 Cheat Paper ## A4-BP Feed-Forward 不写了 一个需要记的结论:$\delta = (W_{i+1}^{T} \delta_{i+1}) \odot f'(Z_1)$ 注意,如果是最后一层,需要先算出 Loss 对输出的导数,再**逐元素乘以**激活函数的导数。:$\delta_{last} = \frac{\partial L}{\partial \hat{y}} \odot \sigma'(Z)$ 如果是 BCE + Sofmax,那么 $\delta_{last} = \hat{y} - y$ ## A5-Q1 K-means 做题方法:比如是让你最后分成两类,直接选一个 $k=2$ 就行了。然后初始化 centroid 也随便取前 $k$ 个点就行了(随便都行,只是为了方便)。然后算距离,分配每一个点给 centroid,然后重新计算 centroid。迭代更新到收敛就行了(不再有点发生变化) ## A5-Q2 EM 比较重要的一个做题 直接贴一个参考答案就懂了   主要是要注意权重 Loading... 太简单了的就不写了 ## A1-Q2-a-iv SGD: 每iteration只用一个 data point 进行 update,所以梯度: $$ \theta' \leftarrow \theta - \frac{2\alpha}{N} (\theta x_i - y_i) x_i $$ 总梯度: $$ \nabla_{\theta}\mathcal{L} = \frac{2}{N} \sum_{i=1}^{N}(\theta x_i - y_i) x_i $$ ## A1-Q4  ## A2-Q2 补充两个公式吧。对于均匀分布: $$ \left\{ \begin{array}{l} \mu_k = \dfrac{a_k+b_k}{2} \\[6pt] \sigma_k = \dfrac{(b_k-a_k)^2}{12} \end{array} \right. $$ 一般的二分类的边界: $$ d(x) = \ln \frac{P(X|Y=0)P(Y=0)}{P(X|Y=1)P(Y=1)} $$ 当然也可以写成超平面的形式。 ## A2-Q4 重点: $$ \frac{P(Y=1|X)}{P(Y=0|X)} = \frac{P(Y=1)P(X|Y=1)}{P(Y=0)P(X|Y=0)} = \frac{\pi \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_{i,1}}} \exp \left( - \frac{(X_i - \mu_{i,1})^2}{2\sigma_{i,1}^2}\right)}{(1 - \pi ) \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_{i,0}}} \exp \left( - \frac{(X_i - \mu_{i,0})^2}{2\sigma_{i,0}^2}\right)} \label{eq:og-disc-form} $$ ## A3-SVM 见 Cheat Paper ## A4-BP Feed-Forward 不写了 一个需要记的结论:$\delta = (W_{i+1}^{T} \delta_{i+1}) \odot f'(Z_1)$ 注意,如果是最后一层,需要先算出 Loss 对输出的导数,再**逐元素乘以**激活函数的导数。:$\delta_{last} = \frac{\partial L}{\partial \hat{y}} \odot \sigma'(Z)$ 如果是 BCE + Sofmax,那么 $\delta_{last} = \hat{y} - y$ ## A5-Q1 K-means 做题方法:比如是让你最后分成两类,直接选一个 $k=2$ 就行了。然后初始化 centroid 也随便取前 $k$ 个点就行了(随便都行,只是为了方便)。然后算距离,分配每一个点给 centroid,然后重新计算 centroid。迭代更新到收敛就行了(不再有点发生变化) ## A5-Q2 EM 比较重要的一个做题 直接贴一个参考答案就懂了   主要是要注意权重 最后修改:2026 年 01 月 02 日 © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 如果觉得我的文章对你有用,请随意赞赏