上一篇的推文讲了三家自主品牌车企,上汽、长安、吉利。接下来讲讲剩下的七家,东风、北汽、长城、一汽、广汽、江淮。
4.东风
从下面东风的车可以看出,大部分都是商用车,了解一下东风小康。其实现在的东风启辰,也是东风日产旗下的品牌,一款假国产车(网评)。
北汽底下的自主品牌有北汽坤宝,北京越野。当然还有北汽福田,以及福田旗下的宝沃汽车,那个来自欧洲,与BBA齐名的豪华品牌,不过现在日子也是难过。
6.长城
长城,SUV引领者。一款SUV哈弗H6,已经累计65个月SUV销量冠军,可以与秋名山车神一战啦。如今的WEY品牌也是很给力,带着自主品牌又迈上的一个台阶。
长城
哈弗
WEY
7.一汽
就在上个月,一汽与16家银行签署了战略合作协议,协议中各银行给一汽意向性授信共计10150亿元。乖乖的,这个老大哥胃口真是大,怎么有点像当初振兴东北的政策一般,会不会又打shuipiao~
红旗
奔腾
8.奇瑞
9.广汽
广汽发展的比较晚,但是现在势头很好,尤其是广汽传祺。业界都说离不开广东人的务实,思想开放。确实,看看广东各地市常年的GDP就知道了,遍地开花。
10.江淮
江淮,较上面的这些品牌,之前江淮应该是唯一一家没有合资品牌的国有车企。但是现在也与大众合资起来了新能源汽车,确实市场就摆在那里,不多学习,何来市场。
这里记录一下爬取时候遇到的几个坑:
os.makedir():
一级一级的创建目录,前提是前面的目录已存在。
os.makedirs():
可以一次创建多级目录,哪怕中间目录不存在也能正常的创建。
demjson.encode():
将Python字段的数据类型编码成JSON字符串(list→str)
demjson.decode():
解码JSON数据返回Python字段的数据类型(str→list)
urllib.parse.quote():
URL只允许一部分ASCII字符(数字字母和部分符号),其他的字符(如汉字)是不符合URL标准的。URL中使用其他字符就需要进行URL编码(基于UTF-8),将网址里的中文转码(奇瑞)。
requests.get(url=.,headers=.,verify=False)
在发送请求时把验证SSL证书关掉,设置verify为False,要不然会报错(广汽)。
温习了正则表达式re,解析库Xpath和BeautifulSoup,对于以后使用它们匹配元素操作起来更加熟练。
另外在爬取一汽解放汽车图片的时候,发现网页是由iframe组成的,暂时还没用selenium爬取。不想用selenium,感觉太麻烦,不知可有方便的方法~