scrapy 2.3 序列化格式

2021-06-09 10:01 更新

为了序列化 爬取 的数据,提要导出使用 Item exporters . 开箱即用支持这些格式:

  • JSON
  • 杰森线
  • CSV
  • XML

但是您也可以通过 ​FEED_EXPORTERS​ 设置。

JSON

  • 价值 ​format​ 关键在 ​FEEDS​ 设置:json
  • 出口商:​JsonItemExporter
  • 见 this warning 如果您使用的是大型提要的JSON。

杰森线

  • 价值 ​format​ 关键在 ​FEEDS​ 设置: ​jsonlines
  • 出口商: ​JsonLinesItemExporter

CSV

  • 价值 ​format​ 关键在 ​FEEDS​ 设置: ​csv
  • 出口商: ​CsvItemExporter
  • 指定要导出的列及其顺序的步骤使用 ​FEED_EXPORT_FIELDS​ . 其他feed导出器也可以使用此选项,但对于csv很重要,因为与许多其他导出格式不同,csv使用固定头。

XML

  • 价值 ​format​ 关键在 ​FEEDS​ 设置: ​xml
  • 出口商: ​XmlItemExporter

泡菜

  • 价值 ​format​ 关键在 ​FEEDS​ 设置: ​pickle
  • 出口商: ​PickleItemExporter

元帅

  • 价值 ​format​ 关键在 ​FEEDS​ 设置: ​marshal
  • 出口商: ​MarshalItemExporter

以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号