文章详情页
java - 爬虫爬取图片问题?
浏览:121日期:2023-10-31 08:12:21
问题描述
刚才修改了下 POM,大家可以重新下载源码这是我写的爬虫的项目地址 项目不报错,但是问题是下载图片到本地后经常性的是图片不完整,如下:
这是下载图片的核心代码,如下:
@Override public void run() {Response res = null;try { res = Jsoup.connect(src).ignoreContentType(true).timeout(30000).execute(); byte[] bytes = res.bodyAsBytes(); File file = new File(path + name); if (!file.exists()) {RandomAccessFile raf = new RandomAccessFile(file, 'rw');raf.write(bytes);raf.close(); }} catch (IOException e1) { e1.printStackTrace();} }
经过资料查询,感觉是范围请求 Range的问题或者自己没发现的问题?希望大家给看下,谢谢
问题解答
回答1:感觉是响应数据没获取完整,你debug一下看看响应的实际数据大小和你保存的数据大小是否有出入。
又或者因为还有一部分数据还在缓冲区中,没来得及写到文件,此时进程退出,导致数据不完整,关闭文件流之前执行一下flush操作。
标签:
java
相关文章:
1. javascript - webpack 多入口文件生成HTML文件;2. dockerfile - [docker build image失败- npm install]3. docker gitlab 如何git clone?4. docker安装后出现Cannot connect to the Docker daemon.5. nignx - docker内nginx 80端口被占用6. 计算机 - 我学习了C语言,数据结构和一点点java基础,想自学C++,请问买什么入门书籍好?7. node.js - mongoDB使用$gte的问题8. java中关于直接插入排序遇到的问题。9. docker绑定了nginx端口 外部访问不到10. javascript - npm run build后调用api返回index.html
排行榜
