radam在keras&tensorflow中的实现

keras-radam的Python项目详细描述


凯拉斯雷达

TravisCoverageVersionDownloadsLicense

[中文English]

在keras和tensorflow中非正式实现RAdam

安装

pip install keras-rectified-adam

用法

importkerasimportnumpyasnpfromkeras_radamimportRAdam# Build toy model with RAdam optimizermodel=keras.models.Sequential()model.add(keras.layers.Dense(input_shape=(17,),units=3))model.compile(RAdam(),loss='mse')# Generate toy datax=np.random.standard_normal((4096*30,17))w=np.random.standard_normal((17,3))y=np.dot(x,w)# Fitmodel.fit(x,y,epochs=5)

无路缘石的Tensorflow

fromkeras_radam.trainingimportRAdamOptimizerRAdamOptimizer(learning_rate=1e-3)

使用预热

fromkeras_radamimportRAdamRAdam(total_steps=10000,warmup_proportion=0.1,min_lr=1e-5)

问答

关于正确性

经过500步后,优化器产生与官方优化器相似的损失和权重。

使用tf.kerastf-2.0

TF_KERAS=1添加到环境变量中以使用tensorflow.python.keras

使用theano后端

KERAS_BACKEND=theano添加到环境变量以启用theano后端。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
具有未知数量条件的java If语句   java如何在Spark中使用两个“条件”进行过滤?   雅加达ee为ColdFusion提供的最佳Java ee服务器   java如何在jersey的MessageBodyWriter方法中获取writeTo中的anotations值?   java从脚本文件调用jar文件中的函数   java在执行insert语句后,如何获得id值为的语句?   在OS X上设置OpenCV Java绑定   java使用for循环遍历数组x。以字符串形式返回x的元素,其中每个元素由一个空格分隔   ApacheiClientBuilder为Algolia Java创建的APIClient是线程安全的吗?   java在DFS/BFS算法中获取邻居时避免内存分配?   java使用AES/CBC/PKCS5P加密大文件(2GB)   允许保存/加载列布局的Java DB网格组件   队列大小为1的java Spring调度   跑步带有Java参数的exe   java正则表达式将所有“<”和“>”标记替换为“&lt;”及“&gt;”在<<![CDATA]>标签?   java何时同步变量?