P40-预测赢家-动态规划
2021-05-27 本文已影响0人
YonchanLew
//预测赢家
/*
* 给定一个表示分数的非负整数数组。玩家1从数组任意一端拿取一个分数,随后玩家2继续从剩余数组任意一端拿取分数,
* 然后玩家1拿,......。每次一个玩家只能拿取一个分数,分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。
* 最终获得分数总和最多的玩家获胜
* 给定一个表示分数的数组,预测玩家1是否会成为赢家。你可以假设每个玩家的玩法都会使他的分数最大化。
*
* 扩展:石子游戏
* */
public class P40 {
public static void main(String[] args) {
// int[] arr = new int[]{5,200,2,3}; //扩展知识:当数量是偶数的时候,先手是会存在必赢策略的(大于等于后手)
int[] arr = new int[]{5,200,2,3,5};
System.out.println(maxScore(arr,0, arr.length-1));
System.out.println(dp(arr));
System.out.println(dp2(arr));
}
//递归
//递归出口 只有一个元素或两个元素,返回最大的值,之后的都是通过max来判断
//p1 max(fun(l), fun(r))
//p2 max(fun(l), fun(r))
//max(p1, p2)
//l是左指针,r是右指针
/*
* 公式计算
* 假设p1取l,p2剩下l+1和r可以取,
* 假设p2取l+1,p1剩下l+2和r可以取
* 假设p2取r,p1剩下l+1和r-1可以取
* 之后p2怎么取,都是这两个公式 {l+2和r}、{l+1和r-1} (前提是l和r要重新指向)
* 但p2是聪明的,假设{l+2和r}能让p1更大时,p2就会取r,导致你只能在{l+1和r-1}中取,让你处于不利状态
* 假设p1取r,p2剩下l和r-1可以取
* 假设p2取l,p1剩下l+1和r-1可以取
* 假设p2取r-1,p1剩下l和r-2可以取
* 之后p2怎么取,都是这两个公式 {l+1和r-1}、{l和r-2} (前提是l和r要重新指向)
*
* */
public static int maxScore(int[] arr, int l, int r) {
if (l == r) { //如果只剩一个元素,只能选择它了
return arr[l];
}
//假设先手去左边元素,这个时候后手就会获取{l+1,r}的最大值
//然后判断 先手的数 - 后手的数
//因为是递归,最终公式变为 p1 - (p2 - (p1 - (p2 - p1))) //假设5个元素的就是这样,一直递归
// p1 - p2 + p1 - p2 + p1,就得到p1取左边的数时,能否比p2的值大
int left = arr[l] - maxScore(arr, l+1, r);
//右边同理
int right = arr[r] - maxScore(arr, l, r-1);
return Math.max(left, right); //结果大于0就是赢,小于0就是输
}
//更一步优化,动态规划
//上方两个maxScore调用,假如结果是left,相当于right白计算
/*
* maxScore(arr, l+1, r)存储到 二维数组[i][j]
* 往左移,i+1,往右移 j-1,叫做dp数组
* 初始化:
* if (l == r) { //如果只剩一个元素,只能选择它了
return arr[l];
}
* */
public static boolean dp(int[] arr){
int length = arr.length;
int[][] dp = new int[length][length];
//初始化
for(int i=0; i<length; i++){
dp[i][i] = arr[i];
}
//最大范围去到长度-2,因为假设一直都是取左边的数,最后剩下2个数的时候,i=length-2,已经知道结果了
for(int i=length-2; i>=0; i--){
for(int j=i+1; j<length; j++){
dp[i][j] = Math.max(arr[i] - dp[i+1][j], arr[j] - dp[i][j-1]);
/*
* 来自上方的公式
* arr[l] - maxScore(arr, l+1, r) ==> arr[i] - dp[i+1][j]
* arr[r] - maxScore(arr, l, r-1) ==> arr[j] - dp[i][j-1]
* 相当于把递归的结果保存起来
* */
}
}
//i的位置到j的位置,先手与后手的差值
return dp[0][length-1] >= 0;
}
//可以使用一维数组优化
/*
* arr[l]-maxScore(arr, l+1, r) ==> arr[i]-dp[i+1][j] ==> arr[i]-dp[j][j] ==> arr[i]-arr[j]
* arr[r]-maxScore(arr, l, r-1) ==> arr[j]-dp[i][j-1] ==> arr[j]-dp[j-1][j-1] ==> arr[j]-arr[j-1]
* */
public static boolean dp2(int[] arr){
int length = arr.length;
int[] dp = new int[length];
//初始化
for(int i=0; i<length; i++){
dp[i] = arr[i];
}
//最大范围去到长度-2,因为假设一直都是取左边的数,最后剩下2个数的时候,i=length-2,已经知道结果了
for(int i=length-2; i>=0; i--){
for(int j=i+1; j<length; j++){
dp[j] = Math.max(arr[i] - dp[j], arr[j] - dp[j-1]);
}
}
//i的位置到j的位置,先手与后手的差值
return dp[length-1] >= 0;
}
}