2019-03-11派森学习第113天

2019-03-11  本文已影响0人  每日派森

今天第一天去了公司实习。

首先,通过和产品经理的沟通明确了一下的问题:

当前公司的问题

晚上回到学校后,和马老师沟通后,现在方案为:

1 偏向工程方面的处理

2 偏向学术方面的处理

不同的侧重,将会导致不同的处理方法。

针对1:

马老师说,如果动态出现的紧急度较低的故障,原有算法已经可以应对了。只需要对出现高紧急度的故障这种情况在进行算法方面的完善。

针对2:

需要用新的算法,可能要用到机器学习(强化学习)方面的算法。

接下来,就是先把智能派工的文章先过几遍,以及文章涉及的相关的内容看看,学一学,从这里入门。


今天继续学习了用Q-learning算法进行强化学习。

进行了一个小实验,小人寻找右侧宝藏。小人会通过强化学习,不断缩小每次找到宝藏T所需的步数。

寻找宝藏

刚开始,初始化Q-table为全0的矩阵,学习结束后,Q-table变成了:

学习结束后Q-table值

padans中:

loc——通过行标签索引行数据 

iloc——通过行号索引行数据 

ix——通过行标签或者行号索引行数据(基于loc和iloc 的混合) 

同理,索引列数据也是如此!

也就是说,

想用loc时取出某一行时需要用标签来索引

想用iloc时取出某一行时需要用数字序号来索引

想用ix时取出某一行时用标签和数字序号来索引都可以

a就是标签
上一篇 下一篇

猜你喜欢

热点阅读