cs188-note14
Non-Deterministic Search 我们将要解决带有不确定性的问题,也就要用到下面的模型,Markov decision processes,也就是MDPs. Markov Decision Processes 下面介绍几个属性: A set of states S. 也就是States A set of actions A. 也就是Actions A s...
Non-Deterministic Search 我们将要解决带有不确定性的问题,也就要用到下面的模型,Markov decision processes,也就是MDPs. Markov Decision Processes 下面介绍几个属性: A set of states S. 也就是States A set of actions A. 也就是Actions A s...
Decision Networks Nodes: Chance: 类比贝叶斯网络 Action: 我们能控制并做出选择的节点 Utility: 前两种的children,基于前两种输出一个效能 在决策网络中,我们的目标还是选择能产生maximum expected utility(MEU) 的行动: calculate the posterior probabi...
Markov Models 这段内容主要介绍了Markov Models是什么,可以视为无限长的链状Bayes Net。而该Model大多都是与事件有关,每个对象都有一个单独的随机变量,且具有无记忆特性。 Markov Models的最后一个典型假设是过渡模型是静止的。换句话说,对于所有 i 值(所有时间步),P(Wi+1 Wi) 都是相同的。 ...
任务控制 某些情况下我们需要中断正在执行的任务,比如当一个命令需要执行很长时间才能完成时(假设我们在使用 find 搜索一个非常大的目录结构)。大多数情况下,我们可以使用 Ctrl-C 来停止命令的执行。但是它的工作原理是什么呢?为什么有的时候会无法结束进程? 结束进程 您的 shell 会使用 UNIX 提供的信号机制执行进程间通信。当一个进程接收到信号时,它会停止执行、处理该信号并...
在之前的课程中,其实我们已经接触到了一些数据整理的基本技术。可以这么说,每当您使用管道运算符的时候,其实就是在进行某种形式的数据整理。 例如这样一条命令 journalctl | grep -i intel,它会找到所有包含intel(不区分大小写)的系统日志。您可能并不认为这是数据整理,但是它确实将某种形式的数据(全部系统日志)转换成了另外一种形式的数据(仅包含intel的日志)。大多数...
Shell $0 - 脚本名 $1 到 $9 - 脚本的参数。 $1 是第一个参数,依此类推。 $@ - 所有参数 $# - 参数个数 $? - 前一个命令的返回值 $$ - 当前脚本的进程识别码 !! - 完整的上一条命令,包括参数。常见应用:当你因为权限不足执行命令失败时,可以使用 sudo !!再尝试一次。 $_ - 上一条命令的最后一个参数。如果你...
Git Basics 这部分内容介绍了基本的终端操作指令和git指令,下面会列出一些个人认为有意思的指令。 git status git log git diff git checkout branch-name : 切换到存在的branch git checkout -b branch-name : 创建并切换到新branch git reset –hard ...
Task #1 - Read/Write Page Guards 我们将要实现 BasicPageGuard,它存储着 BufferPoolManager 与 Page 的指针,同时可以确保 UnpinPage 当 Page out of scope 的时候可以被调用。当然,它也可以公开一个方法以便于我们手动 unpin。 在 Page 中,有相关的 latching methods。和...
Monte Carlo Tree Search Two Ideas Evaluation by rollouts: play multiple games to termination from a state s (using a simple, fast rollout policy) and count wins and losses Selective search...
Sort 关系模型/SQL 是无序的 IN-MEMORY SORTING 如果数据 fit in 内存,我们可以用标准的搜索算法(比如快排) 否则,我们需要了解读写 disk pages 的 cost。 TOP-N HEAP SORT 如果查询有ORDER BY和LIMIT,则DBMS只需要去扫描数据一次来寻找top-N elements. 理想情况对于堆排:如果top-N e...