大語(yǔ)言模型在中間段還是迷路了嗎?
前几天,我谈过在知识提取相关的任务中,我看到的一些因调整LLM的温度所带来的不一致性。


我决定再看看这个话题,并谈谈我观察到的行为。不仅Gemini-1.5-Flash-002没有让我失望,给出了更多意想不到的结果,我还找到了一些强有力的证据,表明长窗口仍然会忽略数据。以下是我在视频中使用的笔记。
點(diǎn)擊查看更多內(nèi)容
為 TA 點(diǎn)贊
評(píng)論
評(píng)論
共同學(xué)習(xí),寫下你的評(píng)論
評(píng)論加載中...
作者其他優(yōu)質(zhì)文章
正在加載中
感謝您的支持,我會(huì)繼續(xù)努力的~
掃碼打賞,你說(shuō)多少就多少
贊賞金額會(huì)直接到老師賬戶
支付方式
打開(kāi)微信掃一掃,即可進(jìn)行掃碼打賞哦