爬取安居客上蕪湖房價
忘記在哪兒百度到的代碼,學(xué)習(xí)一下
import requests
from bs4 import BeautifulSoup
import time
headers={'User-Agent':'Baiduspider'}
total=[]
def get_loupan(url):
try:
res=requests.get(url,headers=headers)
soup=BeautifulSoup(res.text,'html.parser')
titles=soup.find_all('span',class_='items-name')
title=list(map(lambda x:x.text,titles))
dizhis=soup.find_all('span',class_='list-map')
dizhi=list(map(lambda x:x.text,dizhis))
diqus=soup.find_all('span',class_='list-map')
diqu=list(map(lambda x:x.text.split('\xa0')[1],diqus))
mianjis_quan=soup.find_all('a',class_='huxing')
mianji_quan=list(map(lambda x:x.text,mianjis_quan))
mianjis=soup.find_all('a',class_='huxing')
mianji=list(map(lambda x:x.text.split('\t')[-1].strip(),mianjis))
jiages=soup.find_all('a',class_='favor-pos')
jiage=list(map(lambda x:x.p.text,jiages))
for tit,dizhi,diqu,mianq,mianj,jiage in zip(title,dizhi,diqu,mianji_quan,mianji,jiage):
info={'標(biāo)題':tit,
'地址':dizhi,
'地區(qū)':diqu,
'面積(全)':mianq,
'面積':mianj,
'價格':jiage}
total.append(info)
except:
print('')
return total
if __name__ == '__main__':
for i in range(1,21):
url='https://wuh.fang.anjuke.com/loupan/all/p{}/'.format(i)
get_loupan(url)
print('第{}頁抓取完畢'.format(i))
time.sleep(1)
import pandas as pd
df=pd.DataFrame(total)
df.to_excel('安居客.xls')

作者:九命貓幺
博客出處:http://www.rzrgm.cn/yongestcat/
歡迎轉(zhuǎn)載,轉(zhuǎn)載請標(biāo)明出處。
如果你覺得本文還不錯,對你的學(xué)習(xí)帶來了些許幫助,請幫忙點(diǎn)擊右下角的推薦
博客出處:http://www.rzrgm.cn/yongestcat/
歡迎轉(zhuǎn)載,轉(zhuǎn)載請標(biāo)明出處。
如果你覺得本文還不錯,對你的學(xué)習(xí)帶來了些許幫助,請幫忙點(diǎn)擊右下角的推薦

浙公網(wǎng)安備 33010602011771號