Python 是一种敏捷的、动态类型化的、极富表现力的开源编程语言,可以被自由地安装到多种平台上。Python 代码是被解释的。如果您对编辑、构建和执行循环较为熟悉,则 Python 代码对您来说更简单。但是,请不要搞错:Python 器可以是简单的脚本,也可以是大型的复杂程序。事实上,Python 解释器的最大特点是鼓励探索和简化学习过程。如果您想证明这一点,请使用 Python 编写著名的 Hello World! 程序:
- 启动 Python 解释器。在 UNIX 系统(包括 Mac OS X)中,启动解释器通常包括在命令提示行键入
python
;在 Microsoft® Windows® 系统中,启动 Python 命令 shell。 - 在 Python 提示行中,在三个大于号 (
>>>
) 标志后输入 print ‘Hello World!
‘,然后按 Enter。 - 完成:没有第三步了。清单 1 显示了此命令的输出。
清单 1. 用 Python 编写的 “Hello World” 的输出
1 2 3 4 5 6 |
rb% python Python 2.4 (#1, Mar 29 2005, 12:05:39) [GCC 3.3 20030304 (Apple Computer, Inc. build 1495)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> print 'Hello World!' Hello World! |
您可以看到,我使用的是运行于 Apple OS X 系统上的 Python V2.4。但是,不管操作系统是什么,基本原理都是一样的,而且在本例中,所用的是 Python 的哪一个实际版本也无所谓。我虽然不了解您,但是此 Hello World! 练习比我学过的 C、C++ 甚至 Java™ 语言的对应练习容易多了。这种简单性就是使用 Python 解释器的主要优点之一。开发人员可以快速试验一个想法、研究一种对象属性或不同算法,而无需编译、执行和测试任何代码。
Python 类型层次结构
从其他语言过渡到 Python 编程语言时需要学习的最重要的课程之一是,Python 中的每样东西都是对象。这一点可能并没有什么特别之处,尤其是对于熟悉面向对象的语言(如 C++、Java 或 C#)的人来说。然而,Python 的面向对象原理与其他语言不同,主要表现在两个方面:第一,Python 中的所有数据值都被封装在相关对象类中。第二,Python 程序中的所有东西都是可以从程序访问的对象,即使是您编写的代码也不例外。
大多数流行的编程语言都有多个内置的数据类型,在这一方面 Python 也一样。例如,C 编程语言具有整型和浮点类型。由于谱系相同,Java 语言和 C# 具有内置类型也不足为奇。这意味着在 C 程序中,可以编写 int i = 100
来创建和初始化整型变量。在 Java 和 C# 中,此方法也是可能的,而且使用它们的自动装箱功能,在需要时这两种语言还可以把这种简单的内置类型转换为 Integer
对象。
另一方面,Python 不包含像 int 这样的简单类型 —— 只有对象类型。如果 Python 中需要整数值,将整数赋值给相应变量(如 i = 100
)即可。在后台,Python 将创建一个整数对象,并将对新对象的引用赋值给变量。问题的关键是:Python 是一种动态类型化语言,所以无需声明变量类型。事实上在单个程序中,变量的类型是可以改变(多次)的。
一种直观演示动态类型化工作方式的简单方法是,设想单个名为 PyObject
的基类,让 Python 中的所有其他对象类型都继承它。在这一模型中,您创建的所有变量都将引用在总的类层次结构中创建的对象。如果您还让 PyObject
类记录曾创建并分配给变量的子类的实际类型或名称,则 Python 程序可正确确定程序执行过程中需要采取的步骤。
上一段描述 Python 的面向对象的模型图像是对 Python 的实际工作方式很好的模拟。除此之外,Python 还可以使用类型函数来简化对变量类型的确定。(本例还介绍如何使用带有 # 字符的内联注释。)
清单 2. 演示 Python 简单类型
1 2 3 4 5 6 |
>>> i = 100 # Create an int object whose value is 100 >>> type(i) <type 'int'> >>> f = 100.0 >>> type(f) <type 'float'> |
可以将 PyObject
类之下的所有 Python 类划分为 Python 运行时解释器可以使用的四个主要类别:
- 简单类型 —— 基本构建块,如
int
和float
。 - 容器类型 —— 保存其他对象。
- 代码类型 —— 封装 Python 程序的元素。
- 内部类型 —— 程序执行期间使用的类型。
到本系列结束时,我会把所有不同类别都介绍给大家。但是在这第一篇文章中,我重点介绍简单类型。
简单类型
Python 有五个内置的简单类型:bool
、int
、long
、float
和 complex
。这些类型是不可变的,就是说整数对象一旦创建,其值便不可更改。相反,系统将创建新的简单类型对象并将其赋值给变量。通过 Python id
函数,可以查看基本 PyObject
标识的变更方式:
清单 3. 使用 Python id
函数
1 2 3 4 5 6 |
>>> i = 100 >>> id(i) 8403284 >>> i = 101 >>> id(i) 8403296 |
此方法看似容易丢失对象,会导致内存泄漏。但是,Python 像 C# 和 Java 一样,使用了垃圾回收功能,以释放用于保存不再引用的对象的内存,如上例中用于保存 100 的整数对象。
布尔类型
Python 中最简单的内置类型是 bool
类型,该类型包括的对象仅可能为 True
或 False
:
清单 4. bool
类型
1 2 3 4 5 |
>>> b = True >>> type(b) <type 'bool'> >>> id(b) 1041552 |
因为只有两个可能值,所以布尔类型是惟一的。Python 解释器提供这仅有的(也是必需的)两个 bool
对象:True
和 False
。在任何时候,在 Python 程序需要这些对象时,变量只能相应地引用其中一个值。清单 5 显示 bb
变量如何具有同一个 id
,不管您直接赋予它 b
变量的值还是直接赋予它 True
对象。
清单 5. bb
变量的值
1 2 3 4 5 6 7 8 9 |
>>> b = True >>> id(b) 1041552 >>> bb = b >>> id(bb) 1041552 >>> bb = True >>> id(bb) 1041552 |
布尔对象名称的大小写是至关重要的,因为 true(和 false)是未定义的:
清单 6. 未定义的 true 和 false
1 2 3 4 |
>>> b = true Traceback (most recent call last): File "<stdin>", line 1, in ? NameError: name 'true' is not defined |
在这一点上,bool
类型可能看起来不是很有用。不过顾名思义,布尔表达式是依赖于名称的,如下所示:
清单 7. 布尔表达式
1 2 3 |
>>> b = 100 < 101 >>> print b True |
很多程序利用布尔表达式,Python 提供一整套布尔比较和逻辑运算,详细信息请分别参见表 1 和表 2。
表 1. Python 中的布尔比较运算符
运算符 | 描述 | 示例 |
---|---|---|
< | 小于 | i < 100 |
<= | 小于等于 | i <= 100 |
> | 大于 | i > 100 |
>= | 大于等于 | i >= 100 |
== | 相等 | i == 100 |
!= | 不相等(另外使用 <>) | i != 100 |
补充一点,表 1 中列出的运算符优先级都一样,除非将表达式置于括号中,否则按从左到右的顺序应用。
表 2. Python 中的逻辑运算符
运算符 | 描述 | 示例 |
---|---|---|
not |
逻辑非 | not b |
and |
逻辑与 | (i <= 100) and (b == True) |
or |
逻辑或 | (i < 100) or (f > 100.1) |
逻辑运算符的优先级低于单独的比较运算符,这一点意义重大,因为必须先计算比较运算符,然后才能计算逻辑运算符。逻辑运算符的实际优先级就是表 2 中罗列这些运算符的顺序。
在 Python 中,关于 or
和 and
逻辑运算符有意思的是,它们都是快捷运算符。简言之,如果给定表达式 x
or y
,则仅当 x
为 False
时才会计算 y
。同样地,如果给定表达式 x
and y
,则仅当 x
为 True
时,才会计算 y
。此功能可以增强表达式求值的性能(尤其是针对长的或复杂的表达式),然而对于习惯于从其他语言学来的不同规则的程序员而言,则容易犯错。
数值类型
Python 中其他四个简单的内置类型都是数值类型:int
、long
、float
和 complex
。在程序中,数值类型很常见,不管使用的是什么语言。Python 对算术运算提供完整支持,包括加法、减法、乘法和除法(参见表 3)。
表 3. Python 中的算术运算
运算符 | 描述 | 示例 |
---|---|---|
* | 乘 | i * 100 |
/ | 除 | i / 100 |
// | 整除 | i // 100 |
% | 取余 | f % 100 |
+ | 加 | i + 100 |
– | 减 | i - 100 |
乘法和除法运算符(表 3 中列出的前四个)具有高于加法和减法的优先级。如前所述,您可以通过使用括号分组子表达式,将其分离出来以提高优先级。
Python 与 Java 语言不同,Java 语言通常定义允许的数值类型的范围,而 Python 在这一点上更像 C,因为它的类型范围是依赖于平台的。您可以使用 int
和 long
两种类型来保存整数值,它们的不同点在于 int 是一种 32 位的整数值。因而,它被限制为只能保存从 -232 到 232 – 1 之间的值(在多数平台上)。与此相反,长整数类型的精度不受限,仅计算机内存对它有影响。要通知 Python 应该按照长类型处理整数,只需将 L附加到数字的末尾,如 100L。在 Python 中,浮点值始终是按双精度处理的;因此 Python 的 float
类型对应于 C 类语言中的双精度。
与数值类型相关的其他两个重点是常量(如上例中的 100,只是明确表达的数字)和位运算。程序员一般在十进制系统(以 10 为基数)中工作。但是,有时其他系统也相当有用,尤其是我们知道计算机是基于二进制的。Python 可以提供对八进制(以 8 为基数)和十六进制(以 16 为基数)数字的支持。要通知 Python 应该按八进制数字常量处理数字,只需将零附加在前面。将一个零加上一个 x 附加在数字的前面是告诉 Python 按十六进制数值常量处理数字,如以下代码所示:
清单 8. 通知 Python 按十六进制数值常量处理数字
1 2 3 4 5 6 |
>>> print 127 # Using decimal literal 127 >>> print 0177 # Using octal literal 127 >>> print 0x7F # Using hexadecimal literal 127 |
当您具有容易的方式来表达数值常量时,尤其是十六进制,就可以容易地构建对应于特定测试用例的标志,这是一种常见的编程技术。例如,一个 32 位的整数可以存储 32 个标志值。使用位测试,可以容易地测试标志变量上的特定标志。Python 中位运算的完整列表如表 4 所示。
表 4. Python 中的位运算
运算符 | 描述 | 示例 |
---|---|---|
~ | 按位求补 | ~b |
<< | 向左位移 | b << 1 |
>> | 向右位移 | b >> 1 |
& | 按位和 | b & 0x01 |
^ | 按位异或 | b ^ 0x01 |
| | 按位或 | b | 0x01 |
至此,您可能想知道不同数值类型在单个表达式中混合出现的时候怎么办。简单的答复是,Python 会根据需要将表达式中的所有操作数转换为最复杂的操作数的类型。复杂度的顺序是:int
、long
、float
和 complex
(非双关),下面是一个简单的示例:
清单 9. Python 将所有操作数转换为最复杂的操作数
1 2 3 4 5 6 7 8 9 10 |
>>> 1 / 3 0 >>> 1.0 / 3 0.33333333333333331 >>> 1.0 // 3 0.0 >>> 1 % 3 1 >>> 1.0 % 3 1.0 |
尽管 Python 会与您预期的一样转换操作数,但是语言并不基于运算符转换操作数,如 1/3 示例中所示,其计算结果为整数。如果要强制取得浮点结果,则必须确保操作数中至少有一个为浮点类型。
complex 类型
最后一种类型 complex
可能是大多数程序员难以识别的,因为它不是其他编程语言中常见的内置数据类型。而对于工程师和科学家来说,复数却是个司空见惯的概念。从形式上讲,复数 具有实部和虚部两个部分,都由 Python 中的 float
类型来表示。虚数 是 -1 的平方根的倍数,用 i或 j 表示 —— 取决于您被培养为科学家还是工程师。在 Python 中,复数的虚部被表示为 j:
清单 10. 复数的虚部
1 2 3 4 5 |
>>> c = 3.0 + 1.2j >>> print c (3+1.2j) >>> print c.real, c.imag 3.0 1.2 |
本例是一个实部为 3.0 和虚部为 1.2 的复数。注意,通过使用复杂对象的 real
和 imag
属性,即可访问复数的不同部分。
它们真是对象吗?
到此为止,我已经介绍了 Python 只处理对象类型,然而示例中好像并没有什么对象。最后还有一个问题,构造函数在哪里?对于简单的内置数据类型,Python 替您做了大量的工作。不过,构造函数还在那里(其名称与相关数据类型的名称相同),如果您愿意,可以直接使用它们,如下所示:
清单 11. Python 构造函数
1 2 3 4 5 |
>>> c = 3.0 + 1.2j >>> print c (3+1.2j) >>> print c.real, c.imag 3.0 1.2 |
结束语
Python 是一种无比简单又功能强大的语言。入门极其容易,尤其是对于已经具有 C 类语言的经验的程序员来说。本文简单介绍了 Python 编程语言和内置数据类型:bool
、int
、long
、float
和 complex
。如果您尚未理解,则请启动一个 Python 解释器,并尝试按照我上面讨论的方法操作。您将会很高兴,我做到的您也可以做到。