第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

不確定如何開始使用 NLP 分析用戶反饋

不確定如何開始使用 NLP 分析用戶反饋

MM們 2023-06-27 10:35:55
我有大約 138,000 條用戶反饋記錄,我想對其進行分析,以了解用戶最常說的話的大致模式。每一個的評分都在 1-5 星之間,所以我不需要做任何類型的情感分析。我最感興趣的是將數(shù)據(jù)集分成 >=4 顆星,看看我們在哪些方面做得很好,以及 <= 3 顆星,看看我們需要改進哪些地方。我遇到的一個關(guān)鍵問題是我希望看到很多 n 元語法。其中一些我知道,比如“HOV 車道”、“拼車車道”、“繞道時間”、“讓開”等。但我也想以編程方式檢測常見的二元組和三元組。我一直在玩Spacy,但它似乎沒有任何能力在語料庫級別上進行分析,只能在文檔級別上進行分析。理想情況下,我的管道看起來像這樣(我認為):將已知 n 元語法列表導入到分詞器中將每個字符串處理為標記化文檔,刪除標點符號、停用詞等,同時在標記化期間尊重已知的 n 元語法(即“HOV Lane”應(yīng)該是單個名詞標記)找出我錯過的語料庫中最常見的二元組和三元組使用找到的 n 元模型重新標記按評級劃分(>=4 和 <=3)查找語料庫中每個數(shù)據(jù)分割的最常見主題我似乎找不到一個工具,甚至是一組工具,可以讓我在這里做我想做的事情。我是否以某種錯誤的方式處理這個問題?任何有關(guān)如何開始的指示將不勝感激!
查看完整描述

1 回答

?
largeQ

TA貢獻2039條經(jīng)驗 獲得超8個贊

Bingo 為您的問題提供最先進的結(jié)果!

它被稱為——零短期學習。最先進的 NLP 模型,用于無需注釋數(shù)據(jù)的文本分類。

讓我知道它是否適合您或有任何其他幫助。


查看完整回答
反對 回復 2023-06-27
?
子衿沉夜

TA貢獻1828條經(jīng)驗 獲得超3個贊

VADER工具非常適合情感分析和基于 NLP 的應(yīng)用程序。

我認為建議的工作流程適合本案例研究。與您的特征提取密切合作,因為它非常重要。大多數(shù)時候,三元組對于這些用例來說是有意義的。

使用Spacy將是一個更好的決定,因為 SpaCy 基于規(guī)則的匹配引擎和組件不僅可以幫助您找到正在搜索的術(shù)語和句子,而且還允許您訪問文本內(nèi)的標記及其與正則表達式相比的關(guān)系。


查看完整回答
反對 回復 2023-06-27
  • 1 回答
  • 0 關(guān)注
  • 157 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號