我准备爬取https://m.lread.net的一本小说,这小说有时候 一个章节分了两页html。我如何将第二页的内容与前一页内容合并,保存到csv文件里?

#pipelines.py
import csv
class RuanyunPipeline(object):
def __init__(self):
self.filename= open('douluodalu.csv','w',newline="",encoding='utf-8')
self.writer=csv.writer(self.filename)
self.writer.writerow(['title','url_next','content'])
def process_item(self, item, spider):
if '-' not in item['url_now']:
self.writer.writerow([item['title'],item['url_now'],item['content']])
else :
self.writer.writerow([item['title'],item['url_now'],item['content']])
return item
def close_spider(self,spider):
if self.filename:
self.filename.close()Vector用法和ArrayList区别总结如下:
| 类别 | Vector | ArrayList |
| JDK的引入版本 | 1.0 | 1.2 |
| 初始化容量 | 10 | 0 |
| 容量初始化的时机 | 创建构造方法时 | 调用add方法时 |
| 容量增长 | 1倍 | 0.5倍 |
| 是否采用了线程安全 | 是 | 否 |