我正在嘗試從向量列表中檢索向量的最近鄰居,使用:neigh = NearestNeighbors(metric='cosine')neigh.fit(列表)如果vector1和vector2在所有維度上具有相同的精確值,我所閱讀和見證的內(nèi)容,從這兩個(gè)向量中檢索到的距離將等于 0。我正在使用kneighbors方法來查找距離。neigh.kneighbors(vector_input)但是,在某些情況下(并非所有情況),即使兩個(gè)向量相等,檢索到的距離也不等于 0,而是一些小數(shù)字,例如 2.34e-16。len([i for i, j in zip(vector_from_list,vector_input) if i == j])返回列表的維度,這意味著每個(gè) i-index 元素等于另一個(gè)向量的 i-index 元素。因此,如果我沒記錯(cuò)的話,向量是完全相等的。所有向量的 dtype 是 np.float64求距離的方法不一致嗎?或者我是否忽略了 scikit 方法中的某些內(nèi)容(例如參數(shù))?
1 回答

元芳怎么了
TA貢獻(xiàn)1798條經(jīng)驗(yàn) 獲得超7個(gè)贊
我認(rèn)為這是一種預(yù)期的行為。
如果要使用距離等于零的條件,請(qǐng)考慮使用numpy.isclose。例如,
import numpy as np
a = 2.34e-16
b = 1.7e-14 # both tiny values, almost zero
print(a==b) # prints False
print(np.isclose(a,b)) # prints True
您可以通過設(shè)置函數(shù)的其他參數(shù)來設(shè)置您希望值的接近程度。有關(guān)更多信息,請(qǐng)參閱文檔。
或者,您也可以使用 python 的內(nèi)置函數(shù)math.isclose。請(qǐng)參閱文檔。例子,
import math
a = 2.34e-16
b = 1.7e-14 # both tiny values, almost zero
print(math.isclose(a,b, abs_tol=1e-10)) # True
添加回答
舉報(bào)
0/150
提交
取消