Python爬虫框架Scrapy:爬取校花网,程序人生

2024-06-18 1695阅读

1、创建项目

运行命令:

1

scrapy startproject p1(your_project_name)

2.自动创建目录的结果:

Python爬虫框架Scrapy:爬取校花网,程序人生

文件说明:

  • scrapy.cfg 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中)
    • items.py 设置数据存储模板,用于结构化数据,如:Django的Model
      • pipelines 数据处理行为,如:一般结构化的数据持久化
        • settings.py 配置文件,如:递归的层数、并发数,延迟下载等
          • spiders 爬虫目录,如:创建文件,编写爬虫规则

            注意:一般创建爬虫文件时,以网站域名命名

            编写爬虫

            Python爬虫框架Scrapy:爬取校花网,程序人生

            Python爬虫框架Scrapy:爬取校花网,程序人生

            备注:

            • 1.爬虫文件需要定义一个类,并继承scrapy.spiders.Spider
              • 2.必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的:

                Python爬虫框架Scrapy:爬取校花网,程序人生

                • 3.编写函数parse,这里需要注意的是,该函数名不能改变,因为Scrapy源码中默认callback函数的函数名就是parse;

                  一、Python所有方向的学习路线

                  Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  二、Python必备开发工具

                  工具都帮大家整理好了,安装就可直接上手!Python爬虫框架Scrapy:爬取校花网,程序人生

                  三、最新Python学习笔记

                  当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  四、Python视频合集

                  观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  五、实战案例

                  纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。Python爬虫框架Scrapy:爬取校花网,程序人生

                  六、面试宝典

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  简历模板Python爬虫框架Scrapy:爬取校花网,程序人生

                  小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

                  深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

                  因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

                  由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

                  如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)

                  Python爬虫框架Scrapy:爬取校花网,程序人生

                  里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频**

                  如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)

                  [外链图片转存中…(img-5Nh45Hfj-1710982015557)]

VPS购买请点击我

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

目录[+]