English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
1:18
DeepSpeed ZeRO++: A leap in speed for LLM and chat model trai
…
2023年6月22日
Microsoft
Brenda Potts
1:49:52
2026年公认最好的【LLM大模型】教程!从Transformer到deepseek架构
…
已浏览 609 次
1 个月前
bilibili
李宏毅transformer-
0:28
This scene shows Megatron deep, tragic love for Cybertron in Dark o
…
已浏览 2.7万 次
1 个月前
YouTube
Random Shortvideo PH
0:11
bytes.sphere on Instagram: "No Copyright intended. Please DM fo
…
已浏览 1.1万 次
2 个月之前
Instagram
bytes.sphere
Efficient large-scale language model training on GPU clusters using me
…
2021年10月30日
acm.org
0-210 km/h : Honda S2000 (Motorsport)
已浏览 110.4万 次
2012年5月20日
YouTube
Motorsport Magazine
How To Remove Cluster / Speedometer On A Mercedes Benz
已浏览 9.8万 次
2011年6月23日
YouTube
StarPowerMPK
56:07
Megatron LM 论文精读【论文精读】
已浏览 4240 次
2022年6月9日
YouTube
跟李沐学AI
19:33
Megatron-LM 流水并行PP代码解析 #大模型 #分布式并行 #分布式训练
已浏览 377 次
2024年6月3日
YouTube
ZOMI酱
20:04
分布式训练框架Megatron-LM代码概览 #大模型 #分布式并行 #训练
已浏览 426 次
2024年5月11日
zhihu.com
ZOMI酱
22:32
【LLM】DeepSeek最新论文:R2发布前的关键技术突破(MLA/MTP/FP
…
已浏览 4.8万 次
10 个月之前
bilibili
KrillinAI小林
1:28
【清华大学】终于把大模型讲清楚了,B站最全最易学的大模型课程,LL
…
已浏览 248 次
2025年2月28日
bilibili
人工智能Li
9:17
【2025版】这绝对是B站讲的最好的AI大模型全套教程(Deepseek+R
…
已浏览 7229 次
11 个月之前
bilibili
AI官方课堂
10:31
[LLM训练] Megatron-LM里的张量并行:Attention、FFN和Embedding全
…
已浏览 1618 次
11 个月之前
bilibili
我是小小升
10:24
LLM Cookbook 第十六期 多显卡训练与DeepSpeed
已浏览 974 次
11 个月之前
bilibili
AI匠
57:36
Jeff Dean的演讲,回顾LLM发展史,Transformer、蒸馏、MoE、思维
…
已浏览 4089 次
6 个月之前
bilibili
AI深度研究员
1:05:51
Megatron Core MoE in 2025- 架构、特性、性能优化以及在DeepseekV
…
已浏览 3369 次
9 个月之前
bilibili
NVIDIA英伟达
45:08
探索长序列并行:Megatron-Core 的 Context Parallelism 解析
已浏览 3569 次
2024年7月19日
bilibili
NVIDIA英伟达
1:33:54
LLM智能应用开发 L14:大语言模型进阶 Megatron并行化技术介绍 [202
…
已浏览 2632 次
2024年12月17日
bilibili
Par4g0N
1:22:58
Ultimate Guide To Scaling ML Models Megatron-LM | ZeRO | Dee
…
已浏览 535 次
2022年8月25日
bilibili
人工智能基地2
1:47:46
【LLM101】3.3 LLM预训练之分布式训练:数据并行、模型并行、混合精
…
已浏览 5889 次
2025年1月20日
bilibili
一万篇论文笔记
1:34:03
大语言模型基础之从零到一实现之路 L15:LLM进阶之分布式并行(基于Me
…
已浏览 2122 次
3 个月之前
bilibili
Par4g0N
10:17
Research Track 7:多模态大模型最新的一些论文
已浏览 661 次
2024年11月3日
bilibili
以往的月
34:18
Megatron-Core MoE in 2025:大规模 MoE 模型训练框架的前沿进展与最
…
已浏览 4031 次
4 个月之前
bilibili
NVIDIA英伟达
21:07
字节万级GPU集群LLM训练
已浏览 2499 次
2024年7月3日
bilibili
竹言见智
2:20
Giant Blackheads - Part II-
已浏览 2171.2万 次
2016年6月22日
YouTube
Josefa M. REINA
1:18:57
【OpenLLM Talk 013】【本期提要】:LLM作为优化器;人大LLM综述-9
…
已浏览 471 次
2023年9月18日
bilibili
OpenLLMAI
0:49
DeepSeek联合清华,携强化学习(RL)与大语言模型(LLM)强势
…
已浏览 243 次
11 个月之前
bilibili
AI前沿速递
12:47
BIG BLACKHEAD REMOVAL Part- 1
已浏览 875.3万 次
2017年7月14日
YouTube
Dr. Lalit Kasana - Skin Treatment
4:45
Steam Speed
已浏览 8907.5万 次
2014年2月3日
YouTube
Digital Light Studio
观看更多视频
更多类似内容
反馈