理性
RLHF · PBRL | B-Pref:生成多样非理性 preference,建立 PBRL benchmark
贡献:提出一种生成非理性(模拟人类)preference 的方法,使用多样化的 preference,评测了 PBRL 各环节算法设计(select informative queries、feedback schedule)的效果。 ......
【具体数学】理性愉悦第二章
求和因子 在第一章中,我们对于递归式 \[T_0 = 0, \\ T_n = 2 T_{n-1} + 1 \ \ (n > 0) \]使用了两边 \(+1\) 然后转化为 \(U_n\) 的方法,从而得出 \(T_n = 2^n - 1\)。 我们还可以采用另外一种方法。令两边除以 \(2^n\), ......
史蒂芬·平克 《理性》(1)
最近开始读史蒂芬·平克的《理性》,这本书指出“理性人”是需要通过训练来达到的,缺乏理性会使得人们容易在生活中做出错误的判断和决策。书中提供了大量的案例来证明“人如果只靠自己感觉来做判断是不靠谱的“。 这些案例不都是一些文字游戏,很多都是贴近生活的案=实例。作者在这本书中提供 7 套帮助提高理性能力的 ......
康威定律如何解释微服务的合理性
1、了解了康威定律是什么,再来看看他如何在半个世纪前就奠定了微服务架构的理论基础。 (1)人与人的沟通是非常复杂的,一个人的沟通精力是有限的,所以当问题太复杂需要很多人解决的时候,我们需要做拆分组织来打成对沟通效率的管理 (2)组织内人与人的沟通方式决定了他们参与的系统设计,管理者可以通过不同的拆分 ......
抛弃理性,保持随机——Leafy Treap 瞎写
线段树的标记下传与平衡树不大一样,这也就是`Leafy Treap` 出现的意义 正如其名,这里给出了一个`leafy` 化的 `FHQ_Traep` 的实现 `feature:` + 复杂度同`FHQ` + 可以简单可持久化 + 可以避免在标记维护时的讨论,减少常数 + 维护序列码量小于市面上大部 ......
理性分析不同模型的性能指标
## 性能指标 `FLOPS:`浮点运算次数。 `MADD:`表示一次乘法和一次加法,这可以粗略认为:MADD=2 * Flops,即((输出一个元素所经历的乘法次数)+(输出一个元素所经历的加法的个数)) * (输出总共的元素的个数) `MEMREAD:`网络运行时,从内存中读取的大小,即输入的特 ......
CSSE3100 合理性解析
ssignment 2 CSSE3100/7100 Reasoning about ProgramsDue: 4pm on 28 April, 2023The aim of this assignment is to consolidate your understanding of the cou ......
针对近日ChatGPT账号大批量封禁的理性分析
文 / 高扬 这两天不太平。 3月31号,不少技术圈的朋友和我闲聊说,ChatGPT账号不能注册了。 我不以为然,自己有一个号足够了,并不关注账号注册的事情。 后面又有不少朋友和我说ChatGPT账号全部不能注册了,因为老美要封锁我们。 越听越离谱,颇有狼来了之势。 作为一个程序员,这些传闻听多了, ......
【读书笔记】-《罗素谈人的理性》罗素著/石磊译
1. 从根本上说来,厌烦是一种受到挫折的欲望,那些期望发生的事件本身并不一定是令人愉快的,它们只要使厌倦无聊的牺牲者知道这一天和别一天有所不同就行。厌烦的反面,一言蔽之,不是愉快,而是兴奋。 2. 总之,可以发现,伟人们的特征之一就是平静安逸的生活,他们追求的快乐,并不是那种在外人看来兴奋激动的快乐 ......
针对近日ChatGPT账号大批量封禁的理性分析
文 / 高扬 这两天不太平。 3月31号,不少技术圈的朋友和我闲聊说,ChatGPT账号不能注册了。 我不以为然,自己有一个号足够了,并不关注账号注册的事情。 后面又有不少朋友和我说ChatGPT账号全部不能注册了,因为老美要封锁我们。 越听越离谱,颇有狼来了之势。 作为一个程序员,这些传闻听多了, ......