文章详情页

python - 用sklearn求大文本的tfidf特征？

浏览：220日期：2022-06-27 15:50:07

问题描述

python - 用sklearn求大文本的tfidf特征？上面的数据是从reuters数据集中取得7303个训练集，用sklearn对其取tfidf特征，得到的结果都是0，这是怎么回事？

当我从这些数据中取一部分时，对于这些少部分数据能够得到正确的tfidf结果。 python - 用sklearn求大文本的tfidf特征？

python - 用sklearn求大文本的tfidf特征？

问题解答

回答1：

上代码，可能是你精度太低或者min_count导致的

比如词频是1，总词数1e9，对应的tf就是1e-9，被忽略了。

Python 编程

上一条：正则表达式 - 在python中怎么匹配IP地址下一条：python - Scrapy LOG信息输出到文件

相关文章：

1. font-family - 我引入CSS3自定义字体没有效果？2. dockerfile - 为什么docker容器启动不了？3. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题4. docker内创建jenkins访问另一个容器下的服务器问题5. css - 如何讓圖片像雲一樣的行為？6. docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？7. css3 - CSS优先级问题8. javascript - 网页打印页另存为pdf的代码一个问题9. docker镜像push报错10. nignx - docker内nginx 80端口被占用

排行榜

					
					font-family - 我引入CSS3自定义字体没有效果？
javascript - 网页打印页另存为pdf的代码一个问题
css3 - CSS优先级问题
Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
nignx - docker内nginx 80端口被占用
docker镜像push报错
dockerfile - 为什么docker容器启动不了？
docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？
docker内创建jenkins访问另一个容器下的服务器问题
css - 如何讓圖片像雲一樣的行為？
docker安装后出现Cannot connect to the Docker daemon.
				

热门标签