post_img

最大似然估计与最大后验估计

AI 摘要
本文介绍最大似然估计(MLE)和最大后验估计(MAP)两种参数估计方法。MLE通过最大化数据似然函数求最优参数,基于频率学派思想;MAP则在MLE基础上引入参数先验分布,属于贝叶斯学派方法。通过对比两者数学表达式,揭示了
post_img

AFT(Attention-free Transformer)

AI 摘要
本研究提出了AFT(Attention-free Transformer),通过简化注意力机制的设计,有效降低了空间复杂度至O(Td),同时保持模型性能。分析表明AFT可视为逐通道多头注意力的变体,并结合局部注意力机制衍
post_img

特征金字塔网络(Feature Pyramid Networks,FPN)

AI 摘要
在计算机视觉领域,如何有效捕捉不同尺寸的图像特征一直是个难题。特征金字塔网络(FPN)应运而生,通过独特的自底向上和自顶向下结构,有效融合多层次信息,突破了传统卷积网络对小尺寸特征的敏感性。本文将深入剖析FPN的工作原理
post_img

Transformer

AI 摘要
在序列处理的领域,一个问题始终萦绕在人们心头:如何最大化地利用已有的信息进行预测和生成新序列?本文探讨从自回归模型到复杂的Transformer架构,揭示神经网络如何通过隐变量、门控机制和注意力机制,逐步提升它们在序列生