我想確切地知道在這個(gè)標(biāo)記器中使用指定的模式對(duì)文本做了什么:from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'[a-zA-Z]\w+\'?\w*')text_token = text.apply(tokenizer.tokenize)其中“text”是一個(gè)熊貓系列,每一行都是一個(gè)句子。我特別想了解r'[a-zA-Z]\w+\'?\w '* 部分。詳細(xì)信息(每個(gè)組件的解釋?zhuān)⒉粍俑屑ぁ?
文本標(biāo)記器模式的解釋
ibeautiful
2021-06-05 13:15:35