存档

文章标签 ‘python’

用Python chardet库来判断文件编码

2014年9月17日 没有评论

抓取一批页面的内容时,经常会遇到编码类型不同的问题。对于简体中文站点来说,一般只有uft8、gb2312两种,如果再加上繁体文,编码类型又会增加。如果想将一批页面的结果合并在一起进行观看的话,如果编码不同,往往会造成乱码的问题。而一个个的页面去查看也相当麻烦。

上面的问题如果使用p[......]

Read more

python判断list是否为空

2014年9月16日 没有评论

判断一个 list 是否为空

传统的方式:

if len(mylist):
    # Do something with my list
else:
    # The list is empty

由于一个空 list 本身等同于 False,所[......]

Read more

Python判断图片真实类型

2014年9月15日 没有评论

仅仅根据文件后缀判断文件类型显然不准,在python有一个内置模块imghdr可以用来判断图片的真实类型。代码如下:

import imghdr
imgType = imghdr.what(imageFile)

将会输出gif,png,jpeg等图片类型 。其原理[......]

Read more

python2.7+ print格式化输出

2014年8月16日 没有评论

本文主要由Python String Format 一文翻译整理而来,在python中使用 % 进行格式化字符串由来已久,不过在python2.7+ 的版本中引入了新的格式化字符串的方法。虽然%号的方式依旧可用,不过在[PEP-3101] 中已有含蓄的警告称将完全淘汰python2.[......]

Read more

python print 格式化输出

2014年8月16日 没有评论

使用print可以输出的类型有:字符串、整数、浮点数及精度控制。

1.格式化输出整数

python print也支持参数格式化,与C言的printf似:

strHello = "the length of (%s) is %d" %('Hello W[......]

Read more

Python下载文件的方法

2014年8月1日 没有评论

通过python采集时 ,经常需要从html 中获取图片或文件的URL并下载到本地,这里列举最常用的三种模块下载的方法:urllib模块、urllib2模块、requests模块。具体代码如下:

import urllib
import urllib2
import requests[......]

Read more

AWS主机资产管理

2014年7月19日 没有评论

接触AWS主机在13年,使用的是AWS的一年免费试用(需绑定双币信用卡),在此之前确已经用过阿里云主机。当时的感觉就是AWS主机没有aliyun入手简单(语言障碍应该也是一部分因素)。在后来的工作中更多的接触到了AWS主机,通过深入了解AWS API相关的东西,发现了AWS相对于aliyun在云[......]

Read more

python基础(四)流程控制

2014年7月13日 没有评论

流程控制在任何编程语言里都是一个比较重要的部分,同其他语言一样,python下常用的流程控制语句有if……elif……else、while、for、break、continue,也有其他语言可能没有的语句 如try、with、pass、del、exec、eval 等。本篇就结合示例做一[......]

Read more

Python执行系统命令的方法

2014年7月12日 没有评论

在写python代码的时候,有时会需要调用系统命令执行。这里总结下调用系统命令的方法及各自的特点。

一、os模块函数执行

1、os.system

先看示例:

>>> import os
>>> os.system('ls')
bin[......]

Read more

python基础(四)字典Dictionary

2014年7月8日 没有评论

字典dict是由键值对组成的无序数据集合,字典也被称作关联数组或哈希表。同list列表一样,其也是一种可变容器模型;同 list列表不同的是,list是以连续的整数做为索引,dict 字典则是以关键字做为索引。

每个键与值用冒号隔开(:)每对用逗号分割,整体放在花括号中({})。键必须独一[......]

Read more