如何确定一个字符串中是否所有字符全部互不相同

672 查看

在技术面试中经常会遇到算法题,接下来,我计划(在我的能力范围内)写一些常见面试题及其解决思路,希望可以巩固自己的知识,如果可以顺便帮助到一些朋友,就更好不过了。

第一道(也是最简单的一道)面试题便是:如何确定一个字符串中是否所有字符全部互不相同?

在开始完成这道题之前,最好先向出题者确认的一件事情是,这是字符串是纯ASCII字符串还是Unicode字符串。这决定了你后续的解题过程,这个问题可以向面试官传达出你很关注细节,且对计算机科学有一定认识。

这里假设字符集为ASCII,当然如果是Unicode,只需要扩大内存,其他解题思路上基本是一致的。

首先需要想到的是,ASCII只有一个字节,意味着如果待检测的字符串长度超过了256位,那么这个字符串中一定有重复的元素。解题的方式有很多种,下面列举几种常见的解法:


最简单的解法是将字符串中的每一个字符与剩下的字符比较,如果遇到相同的元素,则返回False,如果直到遍历结束都没有遇到相同元素,则返回True

这种解法的时间复杂度为O(n*n),空间复杂度为O(1)。当然很明显,这种解法的效率非常低下,有什么更好的实现呢?

第二种解法是通过构建一个布尔值的数组,索引index表示ASCII码中值为index的字符。将初值置为False,如果某个元素第二次出现,则表示这个字符串出现了重复的字符,函数直接返回。这种解法的Python实现如下:

上面代码的时间复杂度为O(n),空间复杂度为O(1)。不过,我们可以非常确定的是,n的最大值仅仅为256。


如果使用位运算,结合Python中数字的特殊实现,我们仅需要一个数字来替代record即可实现上面的算法:


如果允许对字符串进行修改,则我们还有一种O(nlog(n))的算法来解决这个问题:将字符串排序,然后遍历每一个元素并与周围元素比较(请自行尝试)。


如果考虑到Python的某些数据结构,则我们可以通过collections里的工具来实现:


这些算法可能算不上最优解,不过根据题目,我们依次从比较容易的实现向比较复杂的实现再结合Python的集合类,让出题者了解了你的思考过程和对特定语言的工具集的使用。

这应该是面试中最最简单的算法题目了,接下来我打算(在我的能力范围里)再由浅入深多写点。