机器学习 – Junity's Blog

发布于 11 天前

258 热度无~ 机器学习2123 字

AI 摘要

本文介绍强化学习基础概念和多臂老虎机问题。首先分析强化学习框架中的智能体与环境交互机制，重点阐述状态、动作、策略函数等基本要素。然后详细讨论多臂老虎机问题的数学模型和评估指标，系统讲解ϵ-贪婪算法、上置信界算法和汤普森采

发布于 2025-04-28

979 热度无~ 机器学习1211 字

AI 摘要

本文介绍机器学习中必备的向量微分知识，重点讲解雅可比矩阵的定义与性质，推导向量微分的链式法则及常用结论，包括向量运算、内积和矩阵运算的微分规则，为应用提供理论基础。

发布于 2025-04-25

1065 热度无~ 机器学习556 字

AI 摘要

本文介绍最大似然估计(MLE)和最大后验估计(MAP)两种参数估计方法。MLE通过最大化数据似然函数求最优参数，基于频率学派思想；MAP则在MLE基础上引入参数先验分布，属于贝叶斯学派方法。通过对比两者数学表达式，揭示了

发布于 2025-04-15

1285 热度无~ 机器学习695 字

AI 摘要

本研究提出了AFT（Attention-free Transformer），通过简化注意力机制的设计，有效降低了空间复杂度至O(Td)，同时保持模型性能。分析表明AFT可视为逐通道多头注意力的变体，并结合局部注意力机制衍

发布于 2024-11-12

1155 热度无~ 机器学习378 字

AI 摘要

在计算机视觉领域，如何有效捕捉不同尺寸的图像特征一直是个难题。特征金字塔网络（FPN）应运而生，通过独特的自底向上和自顶向下结构，有效融合多层次信息，突破了传统卷积网络对小尺寸特征的敏感性。本文将深入剖析FPN的工作原理

发布于 2024-11-09

701 热度无~ 机器学习3228 字

AI 摘要

在序列处理的领域，一个问题始终萦绕在人们心头：如何最大化地利用已有的信息进行预测和生成新序列？本文探讨从自回归模型到复杂的Transformer架构，揭示神经网络如何通过隐变量、门控机制和注意力机制，逐步提升它们在序列生