能熟练使用office文学编程是怎样一番体验

5904被浏览1408679分享邀请回答1.5K140 条评论分享收藏感谢收起772154 条评论分享收藏感谢收起查看更多回答3026被浏览539719分享邀请回答632123 条评论分享收藏感谢收起3630 条评论分享收藏感谢收起查看更多回答19860被浏览分享邀请回答2.7K896 条评论分享收藏感谢收起36280 条评论分享收藏感谢收起查看更多回答713被浏览256387分享邀请回答142113 条评论分享收藏感谢收起/r/TESAmHnEsSTOrT379xFe (二维码自动识别)1829 条评论分享收藏感谢收起查看更多回答19860被浏览分享邀请回答#! /usr/bin/env python
from urlparse import urlsplit
from os.path import basename
import urllib2
import requests
import json
url = '/question/'
if not os.path.exists('images'):
os.mkdir("images")
page_size = 50
offset = 0
url_content = urllib2.urlopen(url).read()
answers = re.findall('h3 data-num="(.*?)"', url_content)
limits = int(answers[0])
while offset & limits:
post_url = "/node/QuestionAnswerListV2"
params = json.dumps({
'url_token': ,
'pagesize': page_size,
'offset': offset
'_xsrf': '',
'method': 'next',
'params': params
header = {
'User-Agent': "Mozilla/5.0 (X11; U Linux x86_64; rv:34.0) Gecko/ Firefox/34.0",
'Host': "",
'Referer': url
response = requests.post(post_url, data=data, headers=header)
answer_list = response.json()["msg"]
img_urls = re.findall('img .*?src="(.*?_b.*?)"', ''.join(answer_list))
for img_url in img_urls:
img_data = urllib2.urlopen(img_url).read()
file_name = basename(urlsplit(img_url)[2])
output = open('images/' + file_name, 'wb')
output.write(img_data)
output.close()
offset += page_size
5.1K625 条评论分享收藏感谢收起}

我要回帖

更多关于 如何熟练使用excel 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信