高颜值恋爱动漫泡面番(热血动漫番太好看了)
高颜值恋爱动漫泡面番(热血动漫番太好看了)
2024-07-05 12:30:29  作者:炫耀慯  网址:https://m.xinb2b.cn/know/jfs110774.html

大家好,我是辣条。

高颜值恋爱动漫泡面番(热血动漫番太好看了)(1)

最近被室友安利热血动漫番《终末的女武神》和《拳愿阿修罗》,太上头了周末休息熬夜看完了。不过资源不太好找,辣条一怒爬取了资源,这下可以看个够了。室友崇拜连连,想起了我的班花,快点开学啊,阿西吧...

Python爬虫-vip动漫采集效果展示

高颜值恋爱动漫泡面番(热血动漫番太好看了)(2)

爬取目标

网站目标:樱花动漫

高颜值恋爱动漫泡面番(热血动漫番太好看了)(3)

工具使用

开发工具:pycharm

开发环境:Python3.7, Windows10

使用工具包:requests,lxml, re,tqdm

重点学习内容

正则的使用 tqdm的使用 各种音频数据的处理

项目思路解析

搜索你需要的动漫数据,根据自己需要的视频不同解析视频的方法也是不一样的(会挑选两种视频进行解析)

高颜值恋爱动漫泡面番(热血动漫番太好看了)(4)

在当前页面需要提取出对应的章节信息,获取到章节信息的a标签的跳转内容,提取出每个章节的名字,提取章节的方法我使用的xpath的方法(各位大佬可自行尝试其他的方法)

高颜值恋爱动漫泡面番(热血动漫番太好看了)(5)

headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36', 'Referer': 'imomoe.la/search.asp'}​url = 'imomoe.la/view/8024.html'response = requests.get(url, headers=headers)# print(response.content.decode('gbk'))html_data = etree.HTML(response.content.decode('gbk'))chapter_list = html_data.xpath('//div[@class="movurl"]/ul/li/a/text()')chapter_url_list = html_data.xpath('//div[@class="movurl"]/ul/li/a/@href')[0]

高颜值恋爱动漫泡面番(热血动漫番太好看了)(6)

url的数据需要自行拼接,根据新的url获取详情页面的数据

高颜值恋爱动漫泡面番(热血动漫番太好看了)(7)

按照正常思路首先应该查看播放地址是否为静态数据

高颜值恋爱动漫泡面番(热血动漫番太好看了)(8)

明显看出数据并不是静态数据,在区分是否为动态数据,通过抓包工具进行获取。

高颜值恋爱动漫泡面番(热血动漫番太好看了)(9)

也并不是动态数据,媒体数据也不知道怎么形成的。

高颜值恋爱动漫泡面番(热血动漫番太好看了)(10)

从头再来从前端页面在进行解析,找视频页面的事件。

高颜值恋爱动漫泡面番(热血动漫番太好看了)(11)

并没有发现有效数据,但是在iframe下面的Script标签有js跳转地址 ,解析的数据网址和视频的播放地址是一样的域名, 点击查看, 这不是就是我们找的视频播放地址嘛 ,终于找到了,开始实现 在当前页面通过xpath方式提取出script里的js跳转地址, 拼接出新的视频链接播放地址,发送请求,通过正则表达式提取出所有MP4播放地址。

高颜值恋爱动漫泡面番(热血动漫番太好看了)(12)

new_url = 'imomoe.la' chapter_url_listresponse = requests.get(new_url, headers=headers)html = etree.HTML(response.content.decode('gbk'))​data_url = 'imomoe.la' html.xpath('//div[@class="player"]/script[1]/@src')[0]res = requests.get(data_url, headers=headers).text# print(res)play_url_list = re.findall('\$(.*?)\$flv', res)print(play_url_list)

保存对视频数据发送请求,保存数据到mp4 ,通过tqdm工具能查看对应下载的速度以及下载的进度

for chapter, play_url in tqdm(zip(chapter_list, play_url_list)): result = requests.get(play_url, headers=headers).content f = open('终末的女武神/' chapter '.mp4', "wb") f.write(result)

​到这大功告成 但是当我把网址修改成斗破苍穹这个动漫时,却返回的数据为空

高颜值恋爱动漫泡面番(热血动漫番太好看了)(13)

高颜值恋爱动漫泡面番(热血动漫番太好看了)(14)

这个视频的加载数据的规则是不一样的加载的数据为m3u8的格式, 其他的音频的数据加载可能也不一样, 处理m3u8的数据稍稍的有丢丢复杂,它的m3u8的文件内部有嵌套了m3u8链接地址, 需要转换对应的数据接口,进行链接地址拼接, 取出ts文件进行下载,拼接成视频。

m3u8_url_list = re.findall('\$(.*?)\$bdhd', res)for m3u8_url, chapter in zip(m3u8_url_list, chapter_list): data = requests.get(m3u8_url, headers=headers) # print(data.text) new_m3u8_url = 'cdn.605-zy/' re.findall('/(.*?m3u8)', data.text)[0] # print(new_m3u8_url) ts_data = requests.get(new_m3u8_url, headers=headers) ts_url_list = re.findall('/(.*?ts)', ts_data.text) print("正在下载:", chapter) for ts_url in tqdm(ts_url_list): result = requests.get('cdn.605-zy/' ts_url).content f = open('斗破苍穹/' chapter '.mp4', "ab") f.write(result)

项目思路总结获取到想要动漫的地址提取详情页面的名字已经跳转地址获取页面的静态js文件解析视频播放地址或者m3u8文件保存对应数据简易源码分享

import requestsfrom lxml import etreeimport refrom tqdm import tqdm​​headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36', 'Referer': 'imomoe.la/search.asp'}​url = 'imomoe.la/view/8024.html'response = requests.get(url, headers=headers)# print(response.content.decode('gbk'))html_data = etree.HTML(response.content.decode('gbk'))chapter_list = html_data.xpath('//div[@class="movurl"]/ul/li/a/text()')chapter_url_list = html_data.xpath('//div[@class="movurl"]/ul/li/a/@href')[0]# print(chapter_list)# print(chapter_url_list)new_url = 'imomoe.la' chapter_url_listresponse = requests.get(new_url, headers=headers)html = etree.HTML(response.content.decode('gbk'))​data_url = 'imomoe.la' html.xpath('//div[@class="player"]/script[1]/@src')[0]res = requests.get(data_url, headers=headers).text# print(res)play_url_list = re.findall('\$(.*?)\$flv', res)print(play_url_list)​for chapter, play_url in tqdm(zip(chapter_list, play_url_list)): result = requests.get(play_url, headers=headers).content f = open('终末的女武神/' chapter '.mp4', "wb") f.write(result)

高颜值恋爱动漫泡面番(热血动漫番太好看了)(15)

高颜值恋爱动漫泡面番(热血动漫番太好看了)(16)

发现不会的或者学习python的,可以直接评论留言或者私我【非常感谢你的点赞、收藏、关注、评论,一键四连支持】

高颜值恋爱动漫泡面番(热血动漫番太好看了)(17)

最后,小编想说:我是一名python开发工程师,整理了一套最新的python系统学习教程,想要这些资料的可以关注私信小编“01”即可(免费分享哦)希望能对你有所帮助.

  • 已签收的快递不见了(已签收的快递到底去哪了)
  • 2024-07-05已签收的快递到底去哪了从师傅是一名快递员,他反映,今年4月份,把一件快递送到代收点,客户明明已经签收了,可对方向公司投诉,说是没收到快递视频:快递显示签收,顾客投诉没收到,又放回去了?从师傅在宁波慈溪送快递,从物流记录看,。
  • 南通首条高铁来了几趟(南通首条高铁来了)
  • 2024-07-05南通首条高铁来了2020年南通铁路建设收获连连7月沪苏通铁路开通南通人66分钟到上海马上,盐通高铁也将开通这是南通的首条高铁南通到北京有望缩短到6小时殷超摄来自铁路方面21日最新消息盐通铁路已通过国铁集团运营安全评估。
  • 李娜揭秘怀孕趣闻(李娜称丈夫是第3个孩子)
  • 2024-07-05李娜称丈夫是第3个孩子戳右边关注我们,每天都有最新娱乐八卦等你批阅!近期李娜参加了一档访谈节目,在节目中她对丈夫姜山的吐槽引发了很多妈妈的共鸣由于特殊时期,李娜一家四口都宅在家中,24小时都能见面,一家人相聚自然是好事,但。
  • 长江文艺出版社历史小说(长江文艺出版社打造)
  • 2024-07-05长江文艺出版社打造楚天金报讯金报讯(记者刘瑛通讯员刘冲)近日,出版界著名的“金黎组合(金丽红和黎波)”低调推出直击批判现实主义小说“生存三部曲”,分别为:书写黑白之间的《灰商》,书写真假之间的《虚症病人》,以及书写得失。
  • 边城内容梗概(边城简单介绍)
  • 2024-07-05边城简单介绍《边城》该小说以20世纪30年代川湘交界的边城小镇茶峒为背景,以兼具抒情诗和小品文的优美笔触,描绘了湘西地区特有的风土人情;借船家少女翠翠的纯爱故事,展现出了人性的善良美好由于《边城》的美学艺术,《边。
  • 王者荣耀每日充值活动什么时候来(充值活动基本不断)
  • 2024-07-05充值活动基本不断自1月14日新赛季更新以来,王者荣耀的充值活动,似乎都没怎么断过,不是每日充值就是累计充值,几乎就是两者交替着,轮番登场小酒特意去翻了一下更新公告那么先来看一波有充值活动的更新1月20日更新:每日充值。
  • 两弹元勋邓稼先他的后代现今如何(两弹元勋邓稼先)
  • 2024-07-05两弹元勋邓稼先#历史上的今天#【“两弹元勋”邓稼先:隐姓埋名28年,在生命的尽头依然心系中国核事业】他誓言无声,隐姓埋名28年,用无私的精神铸就大国之盾牌他鞠躬尽瘁,在生命最后的时刻依然心系中国核事业的发展1924。
  • 华为和苹果哪个比较好(华为VS苹果哪个更好用)
  • 2024-07-05华为VS苹果哪个更好用#华为和苹果哪个手机更好用?#两者各有各的优缺点吧,不能说是哪个比较好,华为属安卓,苹果是IOS系统各有优势,苹果每年只换代一次,华为使用群狼战术华为最近的几年市场份额一直在不断的突破,成为市场上的用。
  • 昼颜电影豆瓣评分(电影昼颜电影版)
  • 2024-07-05电影昼颜电影版婚外恋也能拍成小清新,昼颜作为2014年现象级的日剧,撩拨了每个对爱情充满期待,却又被现实多多少少压抑住澎湃感情的都市人看完电影版,心情大概像寻找萤火虫的那条清澈的小河,洗掉了几年的操劳和疑惑这部电影。
  • 南海一号古沉船有尸骨吗(沉入海底800年之久)
  • 2024-07-05沉入海底800年之久自日南障塞、徐闻、合浦船行可五月,有都元国,又船行可四月,有邑卢没国;又船行可二十余日,有谌离国;步行可十余日,有夫甘都卢国自夫甘都卢国船行可二月余,有黄支国,民俗略与珠厓相类其州广大,户口多,多异物。
  • 什么叫外放效果(关于外放效果介绍)
  • 2024-07-05关于外放效果介绍在PS中暴露效果意味着更突出地显示线条的效果您需要打开ps软件,点击上面的窗口这个按钮在下方的选择里,点击右边的新徽标将弹出一个对话框,填写名称并单击“确定”点击右边的“创建操作”按钮在弹跳出来的框里。
  • 男朋友生日送什么比较实在(男朋友生日送什么好)
  • 2024-07-05男朋友生日送什么好男朋友生日送什么好就送这些最好男朋友生日送什么礼物最有意义呢?给男朋友送生日礼物,就是每一次的表明爱意的重要机会,一定要牢牢把握哦!送男朋友什么礼物最有意义关键还是要以实际出发,看看这些礼物你都考虑了。