1. scenario 我的理解就是我们看到的棋盘layout。假如78子后是一个全新的scenario,那往后应该都是新的scenario了,为什么要到87手狗才知道?
(当然,所谓知道,hassabis说,是胜率估算突然下降,也可能之前也一致缓慢地在降)
2. 因为狗79手下的很快,代表着程序对是否scenario是全新,是模糊定义的。所以当时,近似来说,狗认为可以当做某一已知scenario来处理(或者,期望过几手后会回到一个熟悉的scenario
3. 后来的明显乱棋。应该就是Monte Carlo的fault。(?)
4,只要是monte carlo。就不可能是100%的胜率。问题是比较认和机器思维的区别,来避免(或减低)那些人看起来明显的错误。这不能(也不应该)通过设立新的rule来解决,应该狗的目的并不是要当围棋不败王。狗的目标是,AI的开发改进。同时,说不定这研究也能帮助我们了解人类的智能和学习运作的机制。