/images/logo.png

记一次生产事故

今天是2022年5月19日,忙碌了一上午的小弟激动地开始train了,结果,本来五分钟一轮的乖儿子, 变成了两个多小时,What?!!儿子感冒

深度学习优化策略

训练优化策略 梯度裁剪梯度裁剪策略是解决模型训练过程中梯度爆炸策略的一个有效方法,为什么会导致梯度爆炸呢?我们知道,如果模型如下 $$ f(x)=wx+b $$ 省略b的

Python中一些语法的使用

*args 和 **kwargs传参方法 *args元组传参 1 2 3 4 def add(*args): print(args, type(args)) add(2, 3) 1 (2, 3) <class 'tuple'> 1 2 3 4 5 6 7 8 9 10 def add(*numbers): total = 0 for num in numbers: total += num return total print(add(2, 3)) print(add(2, 3, 5)) print(add(2, 3, 5,

损失函数

经典损失函数 距离度量 F 范数(Frobenius 范数)矩阵所有元素的平方和再开方,他是是向量二范式的拓展类比。 $$ ||A||_F = \sqrt{\sum a_{ij}^2} $$ 如何作为距离度量呢?

好用的Python基础算法应用技巧

排序 列表 内置排序方法 sort() 1 2 3 lis = [4,2,3,1] lis.sort() print(lis) [1, 2, 3, 4] sorted() 1 2 3 4 5 6 7 lis = [4,2,3,1] sorted(lis) print(lis) lis = sorted(lis) print(lis) lis.reverse() print(lis) [4, 2, 3, 1] [1, 2, 3, 4] [4, 3, 2, 1] 带原索引一起排序这种方法的好处是