logo
2

K12教育常规赛--北京场线下交流活动vlog

今天参加了K12教育常规赛百度北京场线下交流活动,第一次来到百度大厦到处都很新鲜,跟之前在线上群里约的朋友组好队后确定了idea,要做个历史问答小助手。
  1. 首先确定知识库来源,选择了这个https://zhonghua.5000yan.com/网站。
  2. 然后根据网站对应的地址爬取数据,代码很简单只是进行了简单的爬取,因为千帆AppBuilder会智能分片。
importrequests
frombs4importBeautifulSoup
deffind(url, list: list, i):
response=requests.get(url)
response.encoding=response.apparent_encoding
soup=BeautifulSoup(response.text, 'html.parser')
div=soup.find('section')
list.append(i)
ifdiv:
list.append(div.text)
else:
None
text = []
for i in range(922, 949):
url = 'https://zhonghua.5000yan.com/qingchao/'+ str(i) + '.html'
find(url, text, i)
defsave_list_to_txt(lst, filename):
withopen(filename, 'w') asfile:
foriteminlst:
file.write(str(item) +'\n')
save_list_to_txt(text, 'qingchao.txt')
ps:运营小姐姐很漂亮!还有小哥解疑答惑!点心很好吃!
评论
用户头像