脚本语言的第一行,目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它,就这么简单。
#!/usr/bin/python : 是告诉操作系统执行这个脚本的时候,调用 /usr/bin 下的 python 解释器;
#!/usr/bin/env python(推荐): 这种用法是为了防止操作系统用户没有将 python 装在默认的 /usr/bin 路径里。当系统看到这一行的时候,首先会到 env 设置里查找 python 的安装路径,再调用对应路径下的解释器程序完成操作。
#!/usr/bin/python 相当于写死了python路径;
#!/usr/bin/env python 会去环境设置寻找 python 目录,推荐这种写法
import
urllib.request
import
re
urllib.request
原地址:
https://docs.python.org/3.5/library/urllib.request.html#module-urllib.request
urllib.request — 为打开url提供的可扩展类库源代码:Lib / urllib / request.pyurllib.request模块定义了方法和类,帮助打开url(主要是HTTP)在一个复杂的世界——基本和摘要式身份验证,重定向,cookies等等。
re模块
re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。
详细请看:http://www.runoob.com/python/python-reg-expressions.html
下面这个是脚本编码设置,现在python3+可以直接在窗口右下角设置。
# -*- coding: UTF-8 -*- 或者 #coding=utf-8 后windows 命令提示符下输出中文字符串还会出现乱码。
解决方法需要先使用 decode(“utf-8”) 转换成 utf-8 编码,然后使用 encode(“gbk”) 转换成 gbk 编码,才能在 windows 命令提示符下正常输出中文。
例如:
#!/usr/bin/python
>>> # -*- coding: UTF-8 -*- >>> s="我是中文 " >>> print s.decode("utf-8").encode("gbk")
原因是 windows 命令提示符的显示编码为 gbk 编码。
在命令提示符下使用 chcp 查询编码。
“活动代码页:936” 代表命令提示符的编码为 “gbk”
“活动代码页:65001” 代表命令提示符的编码为 “utf-8”
Print 输出
print 默认输出是换行的,如果要实现不换行需要在变量末尾加上逗号 ,
#!/usr/bin/python # -*- coding: UTF-8 -*- x="a" y="b" # 换行输出 print x print y print '---------' # 不换行输出 print x, print y, # 不换行输出 print x,y
以上实例执行结果为:
a b --------- a b a b
re.match函数
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
函数语法:
re.match(pattern, string, flags=0)
函数参数说明:
参数 | 描述 |
---|---|
pattern | 匹配的正则表达式 |
string | 要匹配的字符串。 |
flags | 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 |
字符串或串(String)是由数字、字母、下划线组成的一串字符。
加号(+)是字符串连接运算符,星号(*)是重复操作。如下实例:
实例(Python 2.0+)
以上实例输出结果:
Hello World! H llo llo World! Hello World!Hello World! Hello World!TEST