我的_get_new_urls的函數(shù)中,在往new_urls中add的時(shí)候,add前的元素前面明明沒有u,add后卻前面多加了一個(gè)u,不知道是為什么,求大神告知。
def?_get_new_urls(self,page_url,soup): ????new_urls=set() ????links=?soup.find_all('a',href=re.compile(r"/item/*")) ????for?link?in?links: ????????new_url=link['href'] ????????new_full_url=urlparse.urljoin(page_url,new_url) ????????print?new_full_url ????????new_urls.add(new_full_url) ????print?new_urls ????return??new_urls
下面的輸出中,明明網(wǎng)址前面沒有u的呀,add后莫名其妙多了u,是為啥??