天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

如何使用python实现迭代遍历文件夹下的文件，且把文件名记录到一个文本中？

用find命令就可以了啊

2016-06-09 19:12 回复了该问题

0

投票

请教一下，　python对多个csv文件里提取指定多个列汇总到一个新生成的csv文件，怎么做呢？

用shell脚本也容易的啊。

2016-06-09 19:02 回复了该问题

0

投票

爬虫的第一步，网络的结构具体指什么

定向爬虫的话需要你了解你要些什么。就是模仿你在浏览器里面的操作，一步一步读取页面。

2016-06-09 19:00 回复了该问题

0

投票

请教一下 asyncio 这个python2.7是不是用不了，python3才能用

asyncio是Python 3.4版本才引入的标准库.

2016-06-08 22:51 回复了该问题

0

投票

咨询一下，sas中怎么在原有的数据集中添加变量，并通过身份证计算年龄和性别？

这个在data step中很简单吧？虽然我好久没用sas了。

2016-06-08 13:42 回复了该问题

0

投票

大家好，我导入一个脚本import test 然后test文件修改了，不退出程序，有办法加载新的test吗？？

可以试试这个，不过不建议。 import foo ... some code ... reload(foo) # 重新导入 foo

2016-06-07 14:01 回复了该问题

0

投票

数据分析的前提不是爬虫吗？不然数据源从哪里来？

数据分析有很多数据源啊，企业内部的，网站提供的api接口，整理好的数据等等。

2016-06-07 09:41 回复了该问题

0

投票

请问老师，python开发的爬虫脚本相比与其它语言的优势是什么？比如我一直在用C#开发

直接开发我想差不多阿，使用爬虫的目的是获取有用的数据，那就是如何快如何做了。 Scrapy帮我们处理了很多事情，可以把编码降到最少，效率最高。

2016-06-07 09:38 回复了该问题

0

投票

beatifulsoup 和scrary 框架下spider一样功能？

scrary下使用XPATH多一点。

2016-06-07 09:35 回复了该问题

0

投票

请教一下，python程序在power shell下运行显示中文是是乱码，怎么破啊

你使用的 Python的版本，2.7？

2016-06-07 09:32 回复了该问题

0

投票

请教下，有的网页数据用js脚本返回的，页面源码没有数据怎么抓？

Scrapy 好像可以scrapy-splash实现，具体看这个 https://github.com/scrapy-plugins/scrapy-splash

2016-06-06 17:50 回复了该问题

0

投票

同样的scary.Field()为什么会返回不同的值？来自大数据群的问题

这个只是用Field objects used 申明了个字段。

2016-06-06 17:28 回复了该问题

0

投票

安装生成和文件结构生成不太明白，看什么内容能填充空白？

可以从创建的spider.py开始修改，先修改start_url看看效果。

2016-06-06 17:20 回复了该问题

0

投票

为什么会需要同时安装不同版本 Python

实际上这涉及2件事，不同等的Python版本各和不同Python环境。版本目前主要是2.7和3.5,版本不兼容，存在只能支持2.7的版本。所以最好找个像pyen...

2016-06-06 08:38 回复了该问题

0

投票

请教群里的大神：informatica workflow manager 界面创建数据源时，找不到mysql ，如何解决哦，有遇到过的吗，求大神指点，不胜感激

odbc的连接把？

2016-06-05 13:55 回复了该问题

seng

他关注的

他的粉丝

他的回答
排序:
时间 投票