2019-03-11派森学习第113天

2019-03-11 本文已影响0人每日派森

今天第一天去了公司实习。

首先，通过和产品经理的沟通明确了一下的问题：

当前公司的问题

晚上回到学校后，和马老师沟通后，现在方案为：

1 偏向工程方面的处理

2 偏向学术方面的处理

不同的侧重，将会导致不同的处理方法。

针对1：

马老师说，如果动态出现的紧急度较低的故障，原有算法已经可以应对了。只需要对出现高紧急度的故障这种情况在进行算法方面的完善。

针对2：

需要用新的算法，可能要用到机器学习（强化学习）方面的算法。

接下来，就是先把智能派工的文章先过几遍，以及文章涉及的相关的内容看看，学一学，从这里入门。

今天继续学习了用Q-learning算法进行强化学习。

进行了一个小实验，小人寻找右侧宝藏。小人会通过强化学习，不断缩小每次找到宝藏T所需的步数。

寻找宝藏

刚开始，初始化Q-table为全0的矩阵，学习结束后，Q-table变成了：

学习结束后Q-table值

padans中：

loc——通过行标签索引行数据

iloc——通过行号索引行数据

ix——通过行标签或者行号索引行数据（基于loc和iloc 的混合）

同理，索引列数据也是如此！

也就是说，

想用loc时取出某一行时需要用标签来索引

想用iloc时取出某一行时需要用数字序号来索引

想用ix时取出某一行时用标签和数字序号来索引都可以

a就是标签