大模型小妙用:不用写正则表达式提取需要的图片、网址等内容。
比如想获取网易云音乐的专辑封面。
传统抓取要写程序、写正则提取。
现在只需Chrome中按F12,点击1,选择图片所在代码。
右键点击2,选择 Edit as HTML,复制代码。
发给大模型,写一个Prompt提取:
提取下面代码中的所有图片地址,类似xxx
提取图片上的URL,补充完整,类似xxx
提取图片上的URL title
把以上信息整理成一个csv文件,用Markdown Code输出。
待处理内容见附件
只需要给一个样例,不需要写正则,难度大幅下降。
点击图片查看原图
点击图片查看原图