TangShusen

  • 首页

  • 标签

  • 分类

  • 归档

  • 关于

  • 内推

LLM 之 GPT 系列(GPT、GPT2、GPT3、InstructGPT)

发表于 2026-06-07 | 分类于 LLM | 评论数: | 阅读次数:


本文从初代 GPT 开始,总结 GPT 系列(GPT、GPT2、GPT3、InstructGPT/ChatGPT)的发展演变,主要包括模型结构、训练数据、核心创新等。

阅读全文 »

搜广推之延迟反馈建模

发表于 2024-03-24 | 更新于 2024-06-16 | 分类于 搜广推 | 评论数: | 阅读次数:


阅读全文 »

搜广推之多场景学习

发表于 2023-07-03 | 更新于 2023-07-14 | 分类于 搜广推 | 评论数: | 阅读次数:


阅读全文 »

搜广推之特征自动选择

发表于 2023-07-03 | 分类于 搜广推 | 评论数: | 阅读次数:

在搜广推场景下,各业务团队会生产很多特征,但很多都是冗余甚至与预测任务不相干的,这不仅带来了额外的性能开销,还可能会导致模型陷入局部最优影响模型预估效果。因此,不管是性能优化,还是效果优化,特征选择都是必不可少的。本人近期阅读了一些特征选择相关的文章(包括特征重要度学习、embedding维度搜索等),总结成本文留作日后回顾,也供大家参考。

阅读全文 »
12…4
TangShusen

TangShusen

16 日志
8 分类
23 标签
RSS
GitHub 知乎
我的项目
  • LeetCode题解
  • 《动手学深度学习》(PyTorch版)
  • 《Deep Learning with PyTorch》中文翻译
© 2018 – 2026 TangShusen tip:本博客在电脑端食用更佳~
total view times: