用Python爬取金融市场数据

发布时间：2019-01-18 11:17:27 所属栏目：教程来源：隠塵退士

导读：副标题#e# 一、写在前面由于在平时的工作中，需要对某信托网的信托在售和资管在售数据进行统计分析，但是一条一条的输入，显然太过耗时耗力，于是萌生了写个爬虫的想法。一门计算机语言，可以当做是在模仿人的目的或意图来进行一系列行为或动作，所以在写

获取的response如下如：

用Python爬取金融市场数据

因此可写出如下正则，从左到右分配匹配出ID、产品名称、发行机构、发行时间、产品期限、投资行业、首页收益。

# 定义第3个函数parse_content_1，用来解析并匹配第一层网页内容，此处使用正则表达式方法 
def parse_content_1(response): 
 
    # 写正则进行所需数据的匹配 
    re_1 = re.compile( 
    r'{"ROWID".*?"ID":"(.*?)","Title":"(.*?)","producttype".*?"issuers":"(.*?)","released":"(.*?) 0:00:00","PeriodTo":(.*?),"StartPrice".*?"moneyinto":"(.*?)","EstimatedRatio1":(.*?),"status":.*?"}') 
    contents = re_1.findall(response) 
    return contents

⑤ 解析第二层网页的内容并输出数据

第二层使用bs4中的select+选择器的方法来进行。除了第一层所提取的数据外，还需要发行地、收益分配方式、发行规模、最低收益、最高收益和利率等级分布情况。

网页如下，可见，我们所需要的信息隐藏在一个又一个tr标签里，而这个tr标签处于id=“procon1”下的一个table标签里(此处有个坑，就是从网页来看，table下还有个tbody标签，而实际得到的响应里并没有)。

用Python爬取金融市场数据

（编辑：网站开发网_安阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

7/14

首页

尾页

台式电脑显卡驱动安装	修复word表格两页断开
大白菜u盘装系统win10	电脑系统还原怎么设置