超参数调试

1. 随机选取,而不是grid search:举个极端的例子,比如Adam algorithm中的learning rate 和 为了防止0为分母而加的一个比较小的值,很明显搜索后者是没什么用的,如果用5*5的grid search,最重要的learning rate只搜索了5个,而如果random的话可以search到25个learning rate  2. 在合适的范围内随机选取超参数,比如有
相关文章
相关标签/搜索