perl中的字符串操作函数chomp与chop介绍

1033 查看

chompchop都是用于去除字符串变量尾部的字符,但它们有各自的区别。

chomp函数对变量起作用,而此变量含有字符串。如果字符串结尾有换行符,chomp可以去掉它。这基本上就是它能完成的所有功能,如下例:

复制代码 代码如下:

$text="alineoftext\n      "; #也可以由<STDIN>输入
chomp($text);    #去掉换行符(\n)。

它非常有用,基本上你的每一个程序都会用到它。如你将知道,这是将字符串末尾换行符去掉的最好方法。基于 Perl 中的一条基本原则:在需要使用变量的地方,可以使用赋值表达式来代替。我们有更简单的使用 chomp 的方法。Perl 首先做赋值运算,再使用这个变量。因此使用 chomp 的最常用方法是:
复制代码 代码如下:

chomp($text=<STDIN>);    #读入,但不含换行符
$text=<STDIN>;
chomp($text);

#同上,但用两步完成


第一眼见到时,第一种组合的方法看起来复杂些。如果把上述其看成两步操作,读一行再  chomp,那写成两个语句的方法看起来自然些。如果将其看作一个操作,读入一行但不包括换行符,那写成一个语句的方法更恰当。由于绝大多数 Perl 程序员使用第一种写法,你也应该使用它。

chomp 是一个函数。作为一个函数,它有一个返回值,为移除的字符的个数。这个数字基本上没什么用:

复制代码 代码如下:

$food=<STDIN>;
$betty=chomp($food); #得到值 1

如上,在使用 chomp 时,可以使用或不使用括号()。这又是 Perl 中的一条通用规则:除非移除它们时含义会变,否则括号是可以省略的。如果结尾有两个或两个以上的换行符,chomp 仅去掉一个。如果没有,那什么也不做,返回 0。这种情况在一次读入一行时不会发生,但使用了输入分隔符(input  separator)($/)(其不为换行符(\n)),read 函数,或者将一些字符串结合起来就有可能发生。

在编写Perl程序代码的时候,也许你会有时会用chop() 函数来去掉<>输入的换行符"\n",有时候使用chomp() 函数。其实上面的用法都可以达到预期的效果,但它们也有细微的差别。
 
chop()函数,只是去除最后一个字符。
chomp()函数,就要首先判断最后一个字符是不是为"\n",它才去除。

chop函数会砍掉字符串变量的最后一个字符,并返回砍掉的字符,chop函数不管字符串里是什么都会剪短它,而chomp函数则更有选择性一些。不能chop直接量,只能chop变量。
用法:

复制代码 代码如下:

chop VARIABLE
chop LIST
chop

例子:
如果chop一列LIST变量,那么列表中的每个字符串都会被剪短:
复制代码 代码如下:

@lines=`cat myfile`;
chop @lines;

在最常见的情况下,chop可以用substr来表示:
复制代码 代码如下:

$last_char = chop($var);
$last_char = substr($var, -1, 1, ""); # 同上

再来看下面的完整的例子:
复制代码 代码如下:

#!/usr/bin/perl
$string1 = "This is test";
$retval  = chop( $string1 );
print " Choped String is : $string1\n";
print " Character removed : $retval\n";

结果:
复制代码 代码如下:

Choped String is : This is tes
Number of characters removed : t