首頁猿問請問c++語言中的全局優(yōu)化算法如何掌握？

請問c++語言中的全局優(yōu)化算法如何掌握？

C++

開滿天機 2018-07-09 18:10:43

c++語言中的全局優(yōu)化算法如何掌握

查看完整描述

1 回答

慕神8447489

TA貢獻1780條經(jīng)驗獲得超1個贊

所有機器學(xué)習(xí)開發(fā)者都會遇到同樣一個問題：你有一些想要使用的機器學(xué)習(xí)算法，但其中填滿了超參數(shù)——這些數(shù)字包括權(quán)重衰減率、高斯核函數(shù)寬度等等。算法本身并不會設(shè)置它們，你必須自己決定它們的數(shù)值。如果你調(diào)的參數(shù)不夠好，那么算法是不會工作的。那么該如何是好？

在調(diào)參時，絕大多數(shù)人只會憑經(jīng)驗進行猜測。這不是個好現(xiàn)象，我們需要更合理的方法。所有人都希望一些黑箱優(yōu)化策略如貝葉斯優(yōu)化變得實用化，但在我看來，如果你不把貝葉斯優(yōu)化的超參數(shù)調(diào)對，它就無法展現(xiàn)專家級的調(diào)參能力。事實上，我認識的每個使用貝葉斯優(yōu)化的人都有著相同的經(jīng)驗。最終，如果我認為手調(diào)參數(shù)更加方便，我就會轉(zhuǎn)回到傳統(tǒng)方法上去，這也是所有使用類似工具的人都會遇到的事。所以結(jié)果就是我們一般不會使用自動超參數(shù)選擇工具——令人沮喪的結(jié)論。我們都希望出現(xiàn)一個無參數(shù)的全局優(yōu)化器，其中的超參數(shù)選擇是我們可以信任的。

我們不需要想象上界是如何幫助我們評估最優(yōu)點的。例如，如果你選擇最大上界作為下一次迭代，你就已經(jīng)非常接近全局極大值了。論文作者隨后繼續(xù)證明了這種方法的一些不錯的屬性。值得一提的是，他們是用數(shù)學(xué)方法證明的，同時也實踐展示了這種方法在很多非常規(guī)情形下要比隨機搜索要好——考慮到隨機超參數(shù)搜索（Random Search for Hyper-Parameter Optimization，James Bergstra & Yoshua Bengio）的效果非常強大，這是一個強有力的聲明。在論文中，研究人員也對貝葉斯優(yōu)化等算法進行了比較，并展示了 LIPO 的競爭力。

此時此刻你或許會說：「等一下，我們并不知道 Lipschitz 常數(shù) k 的值！」這不是一個大問題，因為它非常容易估計，例如，可以將 k 設(shè)置為每次迭代前觀察到的 f(x) 的最大斜率。這相當(dāng)于解決如下問題：