Python scrapy爬虫

2022-07-01 Python Python, Scrapy, 爬虫, 脚本 0 评论字数统计: 63(字) 阅读时长: 1(分)

scrapy API | 开源project-github

1. demo

import scrapy

class QuotesSpider(scrapy.Spider):
    name = 'quotes'
    start_urls = [
        'http://quotes.toscrape.com/tag/humor/',
    ]

    def parse(self, response):
        for quote in response.css('div.quote'):
            yield {
                'author': quote.xpath('span/small/text()').get(),
                'text': quote.css('span.text::text').get(),
            }

本文链接： https://guoshunfa.com/2022/07/Python-scrapy爬虫/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

郭顺发JAVA开发攻城狮

专注于服务端场景的解决方案。