post_img

强化学习(一):多臂老虎机问题

AI 摘要
本文介绍强化学习基础概念和多臂老虎机问题。首先分析强化学习框架中的智能体与环境交互机制,重点阐述状态、动作、策略函数等基本要素。然后详细讨论多臂老虎机问题的数学模型和评估指标,系统讲解ϵ-贪婪算法、上置信界算法和汤普森采
post_img

向量微分

AI 摘要
本文介绍机器学习中必备的向量微分知识,重点讲解雅可比矩阵的定义与性质,推导向量微分的链式法则及常用结论,包括向量运算、内积和矩阵运算的微分规则,为应用提供理论基础。
post_img

最大似然估计与最大后验估计

AI 摘要
本文介绍最大似然估计(MLE)和最大后验估计(MAP)两种参数估计方法。MLE通过最大化数据似然函数求最优参数,基于频率学派思想;MAP则在MLE基础上引入参数先验分布,属于贝叶斯学派方法。通过对比两者数学表达式,揭示了
post_img

AFT(Attention-free Transformer)

AI 摘要
本研究提出了AFT(Attention-free Transformer),通过简化注意力机制的设计,有效降低了空间复杂度至O(Td),同时保持模型性能。分析表明AFT可视为逐通道多头注意力的变体,并结合局部注意力机制衍
post_img

特征金字塔网络(Feature Pyramid Networks,FPN)

AI 摘要
在计算机视觉领域,如何有效捕捉不同尺寸的图像特征一直是个难题。特征金字塔网络(FPN)应运而生,通过独特的自底向上和自顶向下结构,有效融合多层次信息,突破了传统卷积网络对小尺寸特征的敏感性。本文将深入剖析FPN的工作原理
post_img

Transformer

AI 摘要
在序列处理的领域,一个问题始终萦绕在人们心头:如何最大化地利用已有的信息进行预测和生成新序列?本文探讨从自回归模型到复杂的Transformer架构,揭示神经网络如何通过隐变量、门控机制和注意力机制,逐步提升它们在序列生