睡前故事python 库运用-油猴中文网

使用 GitHub 登录

登录 | 立即注册

上一主题

下一主题

油猴中文网»论坛 › 资源共享 › 教程分享 › 睡前故事python 库运用

ScriptCat，新一代的脚本管理器

脚本站，与全世界分享你的用户脚本

油猴脚本开发指南教程目录

发新帖

睡前故事python 库运用

陈公子的话

TA的每日心情

	慵懒 2025-5-17 11:57

签到天数: 555 天

[LV.9]以坛为家II

148 主题	422 回帖	1235 积分

积分: 1235

发表于 2020-12-4 13:01:46 | 显示全部楼层 | 阅读模式

处理起来更加简单

import requests
import parsel
#此函数获取故事的链接
def get_url():
res = requests.get('http://book.sbkk8.com/gushihui/taijiaogushi/')
selector = parsel.Selector(res.text)
#print(selector)
url_s = selector.css('.mulu > ul > li > a::attr(href)').getall()
#print(url_s)
for url in url_s:
url = 'http://book.sbkk8.com/' + url#到这里取出了所有正确的可访问的URL
#调用下载函数
down_story(url)
print('全部爬取完成！')
#根据URL下载故事
def down_story(url):
res = requests.get(url)
res.encoding=res.apparent_encoding#返回的进行编码
#print(res.text)
selector = parsel.Selector(res.text)
title = selector.css('#maincontent > h1::text').get()
story_list = selector.css('#content > p::text').getall()
#print(story_list)
with open (title+'.txt','w',encoding='utf-8') as f:
for i in range(len(story_list)):
f.write(story_list[i])
print('<'+title+'>'+' 爬取成功！')
if __name__ == "__main__":
get_url()

复制代码

已有1人评分	好评	贡献	理由
李恒道	+ 2	+ 1

查看全部评分总评分：好评 +2 贡献 +1

I don't hate programming but the fucking world.

回复
订阅

使用道具举报

TA的每日心情

	开心 2024-11-21 13:37

签到天数: 213 天

[LV.7]常住居民III

308 主题	4680 回帖	4413 积分

积分: 4413

发表于 2020-12-4 13:38:57 | 显示全部楼层

睡前故事有什么用?讲给妹妹听吗?

上不慕古，下不肖俗。为疏为懒，不敢为狂。为拙为愚，不敢为恶。

回复

使用道具举报

陈公子的话

TA的每日心情

	慵懒 2025-5-17 11:57

签到天数: 555 天

[LV.9]以坛为家II

148 主题	422 回帖	1235 积分

积分: 1235

发表于 2020-12-4 16:18:13 | 显示全部楼层

王一之发表于 2020-12-4 13:38
睡前故事有什么用?讲给妹妹听吗?

懂得都懂

I don't hate programming but the fucking world.

回复

使用道具举报

发新帖

发表回复

意见反馈

Archiver|手机版|小黑屋|网站地图| |Sitemap

Copyright © 2020-至今油猴中文网版权所有 All Rights Reserved.

快速回复 返回顶部 返回列表