seng

从事BI、大数据、数据分析工作

始于: 2014-02-13

上海市 闸北区

发私信

4318

总声望

571

次被推荐

0

粉丝

他的回答
排序:

0
投票
0
投票
0
投票

爬虫的第一步,网络的结构具体指什么

定向爬虫的话需要你了解你要些什么。就是模仿你在浏览器里面的操作,一步一步读取页面。

2016-06-09 19:00 回复了该问题
0
投票

请教一下 asyncio 这个python2.7是不是用不了 ,python3才能用

asyncio是Python 3.4版本才引入的标准库.

2016-06-08 22:51 回复了该问题
0
投票

咨询一下,sas中怎么在原有的数据集中添加变量,并通过身份证计算年龄和性别?

这个在data step中很简单吧?虽然我好久没用sas了。

2016-06-08 13:42 回复了该问题
0
投票

大家好,我导入一个脚本import test 然后test文件修改了,不退出程序,有办法加载新的test吗??

可以试试这个,不过不建议。 import foo ... some code ... reload(foo)          # 重新导入 foo  

2016-06-07 14:01 回复了该问题
0
投票

数据分析的前提不是爬虫吗?不然数据源从哪里来?

数据分析有很多数据源啊, 企业内部的,网站提供的api接口,整理好的数据等等。  

2016-06-07 09:41 回复了该问题
0
投票

请问老师,python开发的爬虫脚本相比与其它语言的优势是什么?比如我一直在用C#开发

直接开发我想差不多阿, 使用爬虫的目的是获取有用的数据, 那就是如何快如何做了。 Scrapy帮我们处理了很多事情, 可以把编码降到最少,效率最高。

2016-06-07 09:38 回复了该问题
0
投票

beatifulsoup 和scrary 框架下spider一样功能?

scrary下使用XPATH多一点。

2016-06-07 09:35 回复了该问题
0
投票

请教一下,python程序在power shell下运行显示中文是是乱码,怎么破啊

你使用的 Python的版本,2.7?

2016-06-07 09:32 回复了该问题
0
投票

请教下,有的网页数据用js脚本返回的,页面源码没有数据怎么抓?

Scrapy 好像可以scrapy-splash实现,具体看这个 https://github.com/scrapy-plugins/scrapy-splash

2016-06-06 17:50 回复了该问题
0
投票

同样的scary.Field()为什么会返回不同的值? 来自大数据群的问题

这个只是用Field objects used 申明了个字段。

2016-06-06 17:28 回复了该问题
0
投票

安装生成和文件结构生成不太明白,看什么内容能填充空白?

可以从创建的spider.py开始修改,先修改start_url看看效果。

2016-06-06 17:20 回复了该问题
0
投票

为什么会需要同时安装不同版本 Python

实际上这涉及2件事,不同等的Python版本各和不同Python环境。版本目前主要是2.7和3.5,版本不兼容,存在只能支持2.7的版本。所以最好找个像pyen...

2016-06-06 08:38 回复了该问题

改版

反馈