文章詳情頁
python - 用sklearn求大文本的tfidf特征?
瀏覽:132日期:2022-06-27 15:50:07
問題描述
上面的數據是從reuters數據集中取得7303個訓練集,用sklearn對其取tfidf特征,得到的結果都是0,這是怎么回事?
當我從這些數據中取一部分時,對于這些少部分數據能夠得到正確的tfidf結果。
問題解答
回答1:上代碼,可能是你精度太低或者min_count導致的
比如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。
相關文章:
1. mysql 可以從 TCP 連接但是不能從 socket 鏈接2. sql語句 - 如何在mysql中批量添加用戶?3. mysql 非主鍵做范圍查找實現原理的一點困惑4. java - jdbc如何返回自動定義的bean5. 怎么php怎么通過數組顯示sql查詢結果呢,查詢結果有多條,如圖。6. mysql - 數據庫建字段,默認值空和empty string有什么區別 1107. mysql - JAVA怎么實現一個DAO同時實現查詢兩個實體類的結果集8. mysql建表索引問題求助9. mysql - PHP定時通知、按時發布怎么做?10. 事務 - mysql共享鎖lock in share mode的實際使用場景
排行榜
