这次要从一个贴图论坛下载赛马娘tag的所有色图,预计要下载6700张图片。 查看网页结构 从网站在查询时的url可以看出网站是PHP搭建的。经过测试发现,页面的每张图片的缩略图链接,稍微修改一下就是完整的图片链接。 查看了分页逻辑的,看到JS代码是手动计算分页。每页显示42张图片,将总数除以42得到页数。可以解析每一页分页的图片链接,点击进去帖子里面。然后获取到图片地址。 使用公开的API 要处理近6700张图片,每页有42张图,就要处理160页面,解析帖子链接。然后从6700个帖子链接中获取图片地址。 这恐怕是个…