在技术面试中经常会遇到算法题,接下来,我计划(在我的能力范围内)写一些常见面试题及其解决思路,希望可以巩固自己的知识,如果可以顺便帮助到一些朋友,就更好不过了。
第一道(也是最简单的一道)面试题便是:如何确定一个字符串中是否所有字符全部互不相同?
在开始完成这道题之前,最好先向出题者确认的一件事情是,这是字符串是纯ASCII字符串还是Unicode字符串。这决定了你后续的解题过程,这个问题可以向面试官传达出你很关注细节,且对计算机科学有一定认识。
这里假设字符集为ASCII,当然如果是Unicode,只需要扩大内存,其他解题思路上基本是一致的。
首先需要想到的是,ASCII只有一个字节,意味着如果待检测的字符串长度超过了256位,那么这个字符串中一定有重复的元素。解题的方式有很多种,下面列举几种常见的解法:
最简单的解法是将字符串中的每一个字符与剩下的字符比较,如果遇到相同的元素,则返回False
,如果直到遍历结束都没有遇到相同元素,则返回True
:
1 2 3 4 5 6 7 8 9 10 11 12 |
def is_unique_char(string): str_len = len(string) if str_len > 256: return True for pos in xrange(str_len): for index in xrange(pos+1, str_len): if string[pos] == string[index]: return False return True |
这种解法的时间复杂度为O(n*n)
,空间复杂度为O(1)
。当然很明显,这种解法的效率非常低下,有什么更好的实现呢?
第二种解法是通过构建一个布尔值的数组,索引index
表示ASCII码中值为index
的字符。将初值置为False
,如果某个元素第二次出现,则表示这个字符串出现了重复的字符,函数直接返回。这种解法的Python实现如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
def is_unique_char(string): if len(string) > 256: return True record = [False] * 256 for ch in string: ch_val = ord(ch) if record[ch_val]: return False record[ch_val] = True return True |
上面代码的时间复杂度为O(n)
,空间复杂度为O(1)
。不过,我们可以非常确定的是,n的最大值仅仅为256。
如果使用位运算,结合Python中数字的特殊实现,我们仅需要一个数字来替代record
即可实现上面的算法:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
def is_unique_char(string): if len(string) > 256: return True record = 0L for ch in string: print record ch_val = ord(ch) if (record & (1 << ch_val)) > 0: return False record |= (1 << ch_val) return True |
如果允许对字符串进行修改,则我们还有一种O(nlog(n))
的算法来解决这个问题:将字符串排序,然后遍历每一个元素并与周围元素比较(请自行尝试)。
如果考虑到Python的某些数据结构,则我们可以通过collections
里的工具来实现:
1 2 3 |
from collections import Counter is_unique_char = lambda s: True if len(s) > 256 else not bool(filter(lambda n: n > 1, Counter(s).values())) |
这些算法可能算不上最优解,不过根据题目,我们依次从比较容易的实现向比较复杂的实现再结合Python的集合类,让出题者了解了你的思考过程和对特定语言的工具集的使用。
这应该是面试中最最简单的算法题目了,接下来我打算(在我的能力范围里)再由浅入深多写点。