功能、效果说明
我一直在做分析小红书热门笔记,用于创作自己的笔记内容。
为了想知道什么样的笔记封面更受欢迎。
我就用python写了个批量下载热门笔记封面的工具。
效果演示
功能很简单,执行这一段代码之后,便可得到热门top100的小红书笔记封面。
注意哦,这里是指定关键词的热门笔记。
也就是说,你想要做哪一类的笔记,只需要输入对应关键词,就可得到这一类最热门笔记的封面。
下面就是代码和执行代码后获得的笔记封面。
实现思路
我在先前写过如何获取小红书关键词搜索数据采集的功能。
在那一个功能中,实现了小红书关键词搜索结果的数据采集。
在这一个功能中,我就用到了从那里采集到的数据。
实现这个功能,我们只需要提取数据集中的封面url地址,然后借助requests库的get方法,发送http请求,就能拿到图片资源。
最后,只需要将资源保存为图片文件即可。
实现代码
这里是操作数据集的代码,关键点是提取数据集中的封面url。
其他就是很简单的操作。
import csv import json import requests import os def pic_get(): csv_name = input(请输入要读取的文件 \n) file = ./ + csv_name + .csv count = 0 # 创建文件夹 os.mkdir(csv_name) with open(file, encoding=utf-8-sig) as f: for row in csv.reader(f, skipinitialspace=True): if(count > 0): # print(row) # 提取封面url url = row[5] json_str = url.replace("", ") # json.loads() ,要求json串格式中必须的双引号!!转换为字典 json_dict = json.loads(json_str) print(json_dict[url]) req = requests.get(json_dict[url]) # 写入文件 open(csv_name+/+str(count)+.jpg,wb).write(req.content) count += 1 f.close() if __name__ == __main__: pic_get()实现原理
在这段代码中我用到了几个python库。
csv、json、requests、os
用的都是很基础的功能。
csv库用来读取csv文件中的数据。
json库用来将读取到的csv文件数据进行json格式转换,方便获取图片url数据。
requests库用来发送get请求,请求得到图片资源。
os库用来创建目录,用于分类保存图片文件。
总结与拓展
这一功能可以帮助我们拿到小红书关键词搜索的封面。
它们都是对应关键词中最热门笔记的封面。如果自己想发一款受欢迎的小红书笔记。
自己发小红书时,封面如何设计,就可以参考这些受欢迎的封面。
最后,祝你也能写出爆款小红书笔记。
我 是哪个:
金九亿
95后进化不完全的前后端不分离程序猿。
我的关键词
2015-2018:社团、交友、恋爱、兼职。
2018-2019:创业、路演、校招。
2019-2022:职场、健身。
2022~未来:表达。
我的信条
坚持健身,持续学习,刻意表达。
我的目标
从现在开始,我刻意练习表达能力,为了更好地进化。
加我微信偷窥朋友圈
↓↓↓
(你扫我?还是我扫你?)