English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
theaisummer.com
Vision Language models: towards multi-modal deep learning | AI Summer
A review of state of the art vision-language models such as CLIP, DALLE, ALIGN and SimVL
2022年3月3日
Vision-Language Models for Vision Tasks: A Survey Vision-Language Models Tutorial
0:51
PTE January Prediction File is LIVE now! 🙌 Let's start the new year with motivation to crack your PTE exam in 2026! 🎯 Refer to VLE's PTE prediction file to practice the questions, which have the most chance of appearing in the exam! 💁♀️ Sign up and send us your email address to get the VIP access now! ✅🔓 #pte #ptepreparation #ptespeaking #ptewriting #ptetipsandtricks #ptetraining #vle #englishtest #studyinaustralia #pteaustralia #studyabroad #ptetest #ptemock #successstories #pteresult
TikTok
visionlanguageexperts
已浏览 4824 次
1 个月前
Advancing Robotics with Vision Language Action (VLA) Models
linkedin.com
2 个月之前
Qwen3.5 Plus is Here: Native Vision-Language Model on Chinese New Year | Fahd Mirza
linkedin.com
已浏览 9731 次
1 周前
热门视频
0:50
2.3K views · 61 reactions | Vision Language Models (VLMs) understand natural language prompts and perform visual question answering. ➡️ https://nvda.ws/4cTW5Ox Learn how you can build VLM-powered visual AI agents for a wide range of apps. #SIGGRAPH2024 | NVIDIA AI | Facebook
Facebook
NVIDIA AI
已浏览 2026 次
1 周前
How do LLMs work with Vision AI? | OCR, Image & Video Analysis
Microsoft Blogs
Zachary-Cavanell
2023年6月2日
Keynote: Phi-3-Vision: A highly capable and “small” language vision model
Microsoft
2024年9月3日
Vision-Language Models for Vision Tasks: A Survey Vision-Language Pretraining Methods
1:03:33
Oscar: Object-Semantics Aligned Pre-training for Vision-Language Tasks
Microsoft
2020年5月4日
0:50
35K views · 611 reactions | Vison-language pretraining is pushing AI forward in novel object captioning and image caption generation. Learn about powerful new VLP methods in this webinar and how advances permit captioning without image-text pairs on February 11 at 10 AM PT. Register now: https://aka.ms/AAaz6bh | Microsoft Research | Facebook
Facebook
Microsoft Research
已浏览 16.9万 次
1 周前
0:12
In vision-and-language pretraining (VLP), objects can be used as anchor points to make aligning semantics between image-text pairs easier. Learn how Oscar, a novel VLP framework utilizing objects, sets new state of the art on six vision-and-language tasks: https://aka.ms/AA8flix | Microsoft Research
Facebook
Microsoft Research
已浏览 2.3万 次
2020年5月15日
0:50
2.3K views · 61 reactions | Vision Language Models (VLMs) underst
…
已浏览 2026 次
1 周前
Facebook
NVIDIA AI
How do LLMs work with Vision AI? | OCR, Image & Video Analysis
2023年6月2日
Microsoft Blogs
Zachary-Cavanell
Keynote: Phi-3-Vision: A highly capable and “small” language visi
…
2024年9月3日
Microsoft
5:52
ScreenAI: A Vision-Language Model for UI and Infographics Understan
…
已浏览 3273 次
2024年4月8日
YouTube
Fahd Mirza
9:17
PaliGemma Vision Language Model for Form and Table Understanding
已浏览 859 次
2024年5月18日
YouTube
Biz AI
27:22
Vision Language Models: Leaderboards, Evaluation Benchm
…
已浏览 3838 次
2024年4月13日
YouTube
AI Anytime
A Beginner's Guide to Language Models | Built In
11 个月之前
builtin.com
30:03
MONAI Multi-Modal and M3: A Vision Language Model for Medical Appli
…
已浏览 1464 次
2024年11月7日
YouTube
Project MONAI
0:22
Microsoft researchers have created VinVL—a new object-attribute det
…
已浏览 3.6万 次
2021年1月14日
Facebook
Microsoft Research
6:35
Vision Language Models | Multi Modality, Image Captioning, Text-t
…
已浏览 1.6万 次
2024年10月9日
YouTube
Ultralytics
9:33
Google's New PaliGemma-Open Vision Language Model
已浏览 1.1万 次
2024年5月17日
YouTube
Krish Naik
6:03
Molmo: Open-Source Vision Language Models are a GAME CH
…
已浏览 6504 次
2024年10月3日
YouTube
Mervin Praison
1:20
Reinforced Cross-Modal Matching and Self-Supervised Imitation Lear
…
2018年11月27日
Microsoft
2:04:34
CogVLM: The best open source Vision Language Model
已浏览 9248 次
2023年11月25日
YouTube
Aladdin Persson
21:18
Learning to Prompt for Vision Language Models (Eng)
已浏览 1391 次
2023年8月18日
YouTube
UVLL : UNIST Vision&Learning Lab
16:08
InstructBLIP: Vision-Language Models with Instruction Tuning
已浏览 1570 次
2023年11月19日
YouTube
Data Science Gems
2:47:41
Large Vision Language Models Tutorial for BRAILS ++
已浏览 1011 次
2024年9月12日
YouTube
NHERI DesignSafe
1:00
Vision Language Models | Advantages of VLM's 🎉
已浏览 5401 次
2024年10月21日
YouTube
Ultralytics
PeVL: Pose-Enhanced Vision-Language Model for Fine-Grained
…
2024年6月22日
ieee.org
15:29
Florence-2: Foundation Model for Vision and Vision-Language Tasks
已浏览 1369 次
2023年11月21日
YouTube
Data Science Gems
5:46:04
Coding a Multimodal (Vision) Language Model from scratch in P
…
已浏览 12.4万 次
2024年8月7日
YouTube
Umar Jamil
11:20
Vision-Language Models as a Source of Rewards
已浏览 150 次
2023年12月15日
YouTube
Arxiv Papers
8:45
How to Use Vision Language Model Locally with LMDeploy
已浏览 1552 次
2024年5月31日
YouTube
Fahd Mirza
15:57
Moondream Realtime small vision language model (moondream2)
已浏览 1809 次
2024年3月26日
YouTube
Neural Falcon
27:33
Qwen2-VL: The Best Open Source Vision Model for OCR & VQA
已浏览 1.6万 次
2024年9月3日
YouTube
AI Anytime
1:00:25
Implement and Train VLMs (Vision Language Models) From Scratch -
…
已浏览 6531 次
6 个月之前
YouTube
Uygar Kurt
8:04
How can LLMs improve Vision AI? OCR, Image & Video Analysis
已浏览 2.8万 次
2023年6月1日
YouTube
Microsoft Mechanics
20:15
How to Fine-Tune LLama-3.2 Vision language Model on Custom Dataset.
已浏览 4853 次
2024年10月20日
YouTube
NextGen AI Guy
14:42
OpenVLA An Open Source Vision Language Action Model(Stanfor
…
已浏览 531 次
2024年7月9日
YouTube
mardin mardin
观看更多视频
更多类似内容
反馈