site stats
大模型训练超参可视化出现“分形”效果!有人将神经网络训练中超参数(学习率)和收敛的关系进行了可视化,发现了神奇的分形效果,不得不感叹规律和数学之美无处不在啊。本质上分形就是重复调用同一个方法,这跟模型训练本质是类似的,这也可能是出现“分形”的原因。原文:
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多