辗转相除法——字符串处理

2018-04-22 本文已影响0人薛东弗斯

辗转相除法

GCD:辗转相除法，求两个正整数的最大公约数。

gcd(m,n) = gcd(n,m mod n) ［a>b且 a mod b不等于0］

步骤：

1. 求余数r = m%n

2. 若r＝0，则算法结束，此时的n就为m和n的最大公约数。

3. 否则，令m = n, n = r，返回第一步。

左旋字符串

目标：rotate(s,m)

将字符串s的前m位左旋至末尾。

例：s = abcdefghijk

rotate(s,3) ＝ defghijkabc

思路：

1. 假设字符串s需要调整位置，设置指针p1指向s起点，p2指向起点+m的位置，这里p1->a, p2->d。

2. 交换p1和p2指向的元素，同时让p1++, p2++。这样的动作持续 k = (n-m) - (n%m) 次，其中n为s的长度。

为什么要这么多次呢？上例中，n=11, m =3，则k等于 (11-3) - (11%3) = 6次。经过6次第二步的操作以后s变成了defghi abc jk。式子中11%3的意思是不够m位的部分，11-3的意思是以p2为坐标，到字符串s尾巴距离多少。进入步骤3.

3. 此时s＝defghi abc jk，这时我们只需要将jk移动到abc前面即可，而前面的部分defghi不用管。所以这里只关心abcjk这一部分，设为s。此时s的长度为5，移动的目标是jk，长度m=2。p1指向尾巴，p2指向尾巴-m的位置。交换p1和p2指向的元素，同时让p1--, p2--。（例如，第一次就是k与c交换位置，然后p2指向b，p1指向j）。这样的动作持续k=(n-m) - (n%m)次。（其实这步的操作就完全和步骤2相反）。执行完步骤3后，返回步骤2.

4. 当s的头尾指针指向一个元素，或者m＝0的时候，结束递归。

java代码如下

private static void rotate(String array, int n, int m, int head, int tail, boolean flag){

int j = 0;

if (head == tail || m <= 0) return;

//right move

if (flag == true){

int p1 = head;

int p2 = head + m;

int k = (n-m) - (n % m);//移动的次数

for(int i = 0; i< k; i++, p1++, p2++){

array = swap(array,p1,p2);

}

rotate(array, n-k, n%m, p1, tail, false);//enter the left move

}

else{

int p1 = tail;

int p2 = tail - m;

int k = (n-m) - (n%m);

for(int i = 0; i

array = swap(array,p1,p2);

}

rotate(array,n-k, n%m, head, p1, true);

}

方法2

对于一个字符串s = ab. a和b是s的子字符串。假设a长度为m，那么目标就是经过了rotate(s,m)操作后，s变成ba。

思路

对于s=ab，有ba = (a'b')'

其中a'等于a的反转，例如a ＝ abc，那么a' = cba

假设s=abcdefg，那么a=abc, b= defg，则rotate(s,m) = (a'b')' = cbagfed=defgabc。

代码

字符串反转部分

public static String reverse(String s){

if(s.length()<=0 || s == null) return s;

return reverse(s.substring(1)) + s.charAt(0);

}

这里利用了递归的思想：如果我要反转s，我可以先把s的第一个元素放到最后，然后单独对剩下的s-1个元素进行反转操作。（汉诺塔问题的解决方法）

rotate(s,m)

public static String rotate(String s, int m){

String sa = s.substring(0, m);

String sb = s.substring(m);

return reverse(reverse(sa) + reverse(sb) );

}

字符串包含问题

问题描述：两个字符串S1和S2，假设S1长度大于等于S2长度，判断S2是否为S1的一个子集。例如：S1=ABCDEFGHI, S2=ACEFG，由于S2中的每个元素都出现在S1中，说明S1包含S2. 若S2=ACEFGK, 由于K不在S1中，因此S1不包含S2。

设S1长度为m，S2长度为n 方法1: Brute-Force 两个for loop，复杂度为O(m*n)

public static boolean compare(String[] s1, String[] s2){

//s1:longString[]; s2:shortString[]

int i,j;

for(i = 0; i

{

for(j = 0; j

{

if(s2[i].compareTo(s1[j])==0)

break;

}

//s2中的一个字符遍历了s1还是没找到，即没有执行break使得j达到了s1.length

if (j==s1.length) return false;

}

return true;

}

方法2: 对s1和s2先排序，例如quicksort，则复杂度为O(mlgm)+O(nlgn)+O(m+n) 首先是quicksort部分

public static int partition(String[] array,int lo, int hi){

String pivot = array[lo];

int i = lo;

int j = lo + 1;

while(j<=hi){

if(array[j].compareTo(pivot)<0){

i++;

exch(array,i,j);

}

j++;

}

exch(array,lo,i);

return i;

}

private static void exch(String[] array, int i, int j){

String temp = array[i];

array[i] = array[j];

array[j] = temp;

}

public static void quickSort(String[] array){

quickSort(array, 0, array.length-1);

}

private static void quickSort(String array[], int lo, int hi){

if(hi<=lo) return;

int i = partition(array,lo,hi);

quickSort(array,lo,i-1);

quickSort(array,i+1,hi);

}

在执行下面的代码前，要对s1和s2用quicksort重新排好序。

public static boolean compare(String[] s1, String[] s2){

int p1 = 0;

int p2 = 0;

while(p1

while(s1[p1].compareTo(s2[p2])<0 && p1

if(s1[p1].compareTo(s2[p2])!=0) break;

p2++;

}

if(p2==s2.length) return true;

else return false;

}

方法3 利用counting sort，可以将复杂度降低至线性。即O(m) + O(n) + O(m+n) = O(m+n) 计数排序的代码如下：

public static String[] countingSort(String[] array){

int[] c = new int[26];

for (int i = 0; i <26; i++)

{

c[i] = 0;

}

String[] b = new String[array.length];

//初始化辅助数组

for (int i = 0; i

{

int ind = ((int)array[i].toCharArray()[0] - (int)("a".toCharArray())[0]);

c[ind] = c[ind] + 1;

}

for (int i = 1; i<26; i++)

{

c[i] = c[i] + c[i-1];

}

for(int i = array.length-1; i>=0; i--)

{

int ind = ((int)array[i].toCharArray()[0] - (int)("a".toCharArray())[0]);

b[c[ind]-1] = array[i];

c[ind] = c[ind] - 1;

}

return b;

}

之后如同方法2，调用compare即可

方法4 用hashtable，将短的字符串的每个元素存储在一张hash table中，O(n)。然后对长字符串进行遍历，看hash(s1[i])映射到的slot是否已经有元素了。如果全部都有，则说明s1包含s2，如果有一个slot是空的，则说明s1不包含s2. 复杂度O(m)。所以总的复杂度是线性的。O(m+n)

public static boolean compare(String[] s1, String[] s2){

int[] hash = new int[26];//初始化hash

for(int i = 0; i

{

hash[i] = 0;

}

int num = 0;

for(int i = 0; i

{

int ind = ((int)s2[i].toCharArray()[0] - (int)("a".toCharArray())[0]);

if (hash[ind] == 0)

{

hash[ind] = 1;

num++;

}

for(int i = 0; i

{

int ind = ((int)s1[i].toCharArray()[0] - (int)("a".toCharArray())[0]);

if(hash[ind] == 1)

{

hash[ind] = 0;

num--;//一个字符匹配到

if(num==0) break;

}

if(num==0) return true;

else return false;

}

辗转相除法——字符串处理

猜你喜欢

热点阅读