文章详情页
python - 用sklearn求大文本的tfidf特征?
浏览:194日期:2022-06-27 15:50:07
问题描述
上面的数据是从reuters数据集中取得7303个训练集,用sklearn对其取tfidf特征,得到的结果都是0,这是怎么回事?
当我从这些数据中取一部分时,对于这些少部分数据能够得到正确的tfidf结果。

问题解答
回答1:上代码,可能是你精度太低或者min_count导致的
比如词频是1,总词数1e9,对应的tf就是1e-9,被忽略了。
相关文章:
1. 修改mysql配置文件的默认字符集重启后依然不生效2. java - mybatis源码分析3. python相关问题求解决,有偿4. android - 安卓activity无法填充屏幕5. java - ehcache缓存用的是虚拟机内存么?6. java - MongoDB关闭连接7. css - 移动端h5播放器问题求解决,急急8. angular.js - 用angularjs的service封装百度地图api出错,请问原因?9. mysql - 我用SQL语句 更新 行的时候,发现全部 中文都被清空了,请问怎么解决?10. mysql - 数据库:获取两个字段与获取*,传输的数据量差距大吗?
排行榜

网公网安备