csci561 期末复习

2017-07-26  本文已影响0人  弹杯一笑

1.UCS DFS BFS A* search

2.Game Minimax, αβ pruning

3.CSP

4.FOL resolution proof 将结果取反,和原有条件搞出空集

5.Inference in FOL

6.CNF

7.Planing

8.Neural Network 给一个网络看输出是什么或者设计

9.Naive Bayes

10.Decision Tree

image.png image.png

11.Markov Decision Processes

Q值怎么计算:Q(E,3,2)那就是MaxQ(4,2)=U(4,2) 既是相应方向相邻格子的U(也是maxQ)

γ越大,小鸟就会越重视以往经验,越小,小鸟只重视眼前利益(R)
α学习速率(learning rate),γ折扣因子(discount factor)。根据公式可以看出,学习速率α越大,保留之前训练的效果就越少。折扣因子γ越大,

max_aQ(S', a) 所起到的作用就越大。
小鸟在对状态进行更新时,会考虑到眼前利益(R),和记忆中的利益 max_aQ(S', a) )。 image.png

12.Decision Networks

image.png

13.Choose 2 homework3 projects, each one about a different dataset

Describe how each project relates to search, knowledge representation, reasoning about uncertainty, learning
Compare and contrast the two projects, describing limitations and strengths

14.Expected Untility

image.png

a 是action ,s'是a这个动作导致的结果,e是已经发生的事情 比如 J,M

上一篇下一篇

猜你喜欢

热点阅读