deephub

网易首页

应用

注册免费邮箱

deephub

1535 内容

0 关注

粉丝

优质互联网领域创作者

CV NLP和数据挖掘知识

北京

更多信息

全部

线性化注意力综述：突破Softmax二次复杂度瓶颈的高效计算方案

2024-12-31 10:43
SCOPE：面向大语言模型长序列生成的双阶段KV缓存优化框架

2024-12-30 10:06
Python环境管理的新选择：UV和Pixi，高性能Python环境管理方案

2024-12-29 10:45
高精度保形滤波器Savitzky-Golay数学原理、Python实现与工程应用

2024-12-28 10:11
多维偏好分析及其应用：基于PCA-KMeans的数据降维与模式识别方法

2024-12-27 10:28
SPAR：融合自对弈与树搜索的高性能指令优化框架

2024-12-26 09:55
TurboAttention：高效注意力机制优化方案，降低LLM计算成本70%

2024-12-25 10:29
BERT的继任者ModernBERT：融合长序列处理的新一代双向编码器

2024-12-24 10:45
10个必备Python调试技巧：从pdb到单元测试的开发效率提升指南

2024-12-23 09:38
使用PyTorch实现GPT-2直接偏好优化训练：DPO方法改进及效果对比

2024-12-22 10:11
LEC: 基于Transformer中间层隐藏状态的特征提取与内容安全分类

2024-12-21 09:25
时间序列分析中的互相关与相干性分析：前导滞后关系的理论与应用

2024-12-20 09:50
基于深度混合架构的智能量化交易系统：融合SSDA与LSTM自编码器

2024-12-19 09:53
基于Copula分布的合成数据采样：保持多维数据依赖结构的高效建模

2024-12-18 09:22
数据分布检验利器：通过Q-Q图进行可视化分布诊断、异常检测

2024-12-17 09:52
基于图神经网络的大语言模型检索增强生成框架研究

2024-12-16 10:40
Diff Transformer: 通过差分注意力机制提升大语言模型性能

2024-12-15 09:55
使用机器学习技术进行时间序列缺失数据填充：基础方法与入门案例

2024-12-14 09:21
Python量化投资实践：基于蒙特卡洛模拟的投资组合风险建模与分析

2024-12-13 09:49
时间序列预测的不确定性区间估计：基于EnbPI的方法与应用研究

2024-12-11 12:40
基于Huffman树的层次化Softmax：大规模神经网络高效概率计算方法

2024-12-10 09:34
Beta分布与汤普森采样：智能决策系统概率采样的理论基础

2024-12-09 09:57
ORCA：基于持续批处理的LLM推理性能优化技术详解

2024-12-07 09:54
深入解析图神经网络：Graph Transformer的算法基础与工程实践

2024-12-06 21:25
Hymba: 结合注意力头和SSM头的创新型语言模型方案

2024-12-05 09:44
分布式机器学习系统：设计原理、优化策略与实践经验

2024-12-04 09:38
Transformer模型变长序列优化：深度解析PyTorch上的高性能注意力

2024-12-03 09:50
图卷积网络入门：数学基础与架构设计

2024-12-02 10:04
从本地部署到企业级服务：十种主流LLM推理框架的技术介绍与对比

2024-12-01 09:54
基于特征子空间的高维异常检测：一种高效且可解释的方法

2024-11-30 20:59
置信区间与预测区间：数据科学中的不确定性量化技术深度解读

2024-11-29 17:24
一份写给数据工程师的 Polars 迁移指南

2024-11-27 09:46
Scikit-learn Pipeline完全指南:高效构建机器学习工作流

2024-11-26 10:04
IoU已经out了，试试这几个变体:GIoU、DIoU和CIoU介绍与对比分析

2024-11-24 09:51
优化注意力层提升Transformer 模型效率：改进注意力机制降低成本

2024-11-22 21:37
LLM2CLIP：使用大语言模型提升CLIP的文本处理，提高长文本理解

2024-11-21 09:53
解读双编码器和交叉编码器：信息检索中的向量表示与语义匹配

2024-11-20 09:58
使用Pytorch构建视觉语言模型（VLM）

2024-11-19 09:47
使用 PyTorch-BigGraph 构建和部署大规模图嵌入的完整教程

2024-11-18 10:08
25 个值得关注的检索增强生成 (RAG) 模型/框架

2024-11-17 10:58
利用PyTorch的三元组损失Hard Triplet Loss进行嵌入模型微调

2024-11-16 09:55
告别Print，使用IceCream进行高效的Python调试

2024-11-15 18:16
为什么卷积现在不火了：CNN研究热度降温的深层原因分析

2024-11-14 10:00
SMoA: 基于稀疏混合架构的大语言模型协同优化框架

2024-11-13 09:50
TSMamba：基于Mamba架构的高效时间序列预测基础模型

2024-11-12 09:56
基于MCMC的贝叶斯营销组合模型评估方法论：诊断、校准及选择

2024-11-11 09:59
深度学习工程实践：PyTorch Lightning与Ignite框架特性对比分析

2024-11-10 10:12
通过pin_memory优化 PyTorch 数据加载和传输:工作原理、使用场景

2024-11-09 09:46
贝叶斯统计中常见先验分布选择方法总结

2024-11-08 17:17
Tokenformer：基于参数标记化的高效可扩展Transformer架构

2024-11-07 09:41
基于LLM Graph Transformer的知识图谱构建技术研究

2024-11-06 09:51
Liquid State Machine时间序列预测:利用储备池计算实现高效建模

2024-11-05 09:44
深入理解多重共线性:基本原理、影响、检验与修正策略

2024-11-04 09:28
基于PyTorch的大语言模型微调指南：Torchtune完整教程与代码示例

2024-11-03 09:29
10种数据预处理中的数据泄露模式解析:识别与避免策略

2024-11-02 09:34
随机性、熵与随机数生成器:解析伪随机数生成器和真随机数生成器

2024-11-01 09:41
Github上的十大RAG(信息检索增强生成)框架

2024-10-31 09:26
深度学习中的学习率调度方法介绍及实践策略研究

2024-10-28 09:45
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比

2024-10-27 09:37
LLM-Mixer: 融合多尺度时间序列分解与预训练模型

2024-10-26 09:48
RAPTOR：多模型融合+层次结构 = 检索性能提升20%，结果还更稳健

2024-10-25 09:40
梯度累积的隐藏陷阱：Transformer库中梯度累积机制的缺陷与修正

2024-10-24 09:37
TimeDART：基于扩散自回归Transformer 的自监督时间序列预测方法

2024-10-23 11:35
11种经典时间序列预测方法：理论、Python实现与应用

2024-10-22 09:32
MoH：融合混合专家机制的高效多头注意力模型

2024-10-21 09:16
机器学习中空间和时间自相关的分析：从理论基础到实践应用

2024-10-20 09:24
基于因果推断的机器学习方法优化渠道效应估计

2024-10-19 09:46
lintsampler：高效从任意概率分布生成随机样本的新方法

2024-10-18 09:59
OpenFOAM和Python的流场动态模态分解：从数据提取到POD-DMD分析

2024-10-17 09:42
如果你的PyTorch优化器效果欠佳,试试这4种深度学习高级优化技术

2024-10-16 09:31
信息论、机器学习核心概念：熵、KL散度、JS散度的深度解析及应用

2024-10-15 09:43
数据准备指南：10种基础特征工程方法的实战教程

2024-10-14 09:33
三种Transformer模型中的注意力机制介绍及Pytorch实现

2024-10-13 09:51
多代理强化学习综述：原理、算法与挑战

2024-10-12 09:44
边缘检测评估方法：FOM、RMSE、PSNR和SSIM对比实验和理论研究

2024-10-11 10:04
稀疏促进动态模态分解（SPDMD）详细介绍以及应用

2024-10-10 09:47
贝叶斯线性回归：概率与预测建模的融合

2024-10-09 11:25
图像数据增强库综述：10个强大图像增强工具对比与分析

2024-10-08 09:41
FredNormer: 非平稳时间序列预测的频域正则化方法

2024-10-07 09:35
模型无关的局部解释（LIME）技术原理解析及多领域应用实践

2024-10-06 09:54
PAIRDISTILL: 用于密集检索的成对相关性蒸馏方法

2024-10-05 19:07
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法

2024-10-04 13:56
SCoRe: 通过强化学习教导大语言模型进行自我纠错

2024-10-03 11:47
VisionTS：基于时间序列的图形构建高性能时间序列预测模型

2024-10-02 19:51
Minstrel自动生成结构化提示，让AI写提示词的多代理提示生成框架

2024-09-30 09:58
在Pytorch中为不同层设置不同学习率提升性能，优化深度学习模型

2024-09-29 09:52
TimeMOE: 使用稀疏模型实现更大更好的时间序列预测

2024-09-28 09:46
8种数值变量的特征工程技术：将数值转化为预测模型的有效特征

2024-09-27 10:07
MAGICORE：基于多代理迭代的粗到细精炼框架，提升大语言模型推理

2024-09-26 10:02
PyTorch自定义学习率调度器实现指南

2024-09-25 09:50
AdEMAMix: 一种创新的神经网络优化器

2024-09-24 09:26
PyTorch 模型调试与故障排除指南

2024-09-23 09:56
使用GPU 加速 Polars：高效解决大规模数据问题

2024-09-22 12:14
GraphRAG 与 RAG 的比较分析

2024-09-21 09:46
让模型评估模型：构建双代理RAG评估系统的步骤解析

2024-09-20 16:39
机器学习模型中特征贡献度分析：预测贡献与错误贡献

2024-09-19 09:57
CAS-ViT:用于高效移动应用的卷积加法自注意力视觉Transformer

2024-09-18 09:52
概率分布深度解析：PMF、PDF和CDF的技术指南

2024-09-17 16:52
利用未标记数据的半监督学习在模型训练中的效果评估

2024-09-15 17:51
KAN专家混合模型(RMoK)在高性能时间序列预测中的应用

2024-09-13 09:37

没有更多了...

近期热门内容

近半年

2024年6月后2周大语言模型论文总结：LLM进展、微调、推理和对齐

2024-07-06 11:39
PyTorch中的多进程并行处理

2024-07-07 10:39
11个提升Python列表编码效率的高级技巧

2024-07-09 10:34
统计学入门：时间序列分析基础知识详解

2024-07-10 11:01
Lookback Lens：用注意力图检测和减轻llm的幻觉

2024-07-12 11:21

手机 / 数码

房产 / 家居

deephub