课程目录:
├── 基于LangChain和知识图谱的大模型医疗问答机器人项目
│ ├── 源代码
│ ├── 大模型实战P25LangChain之给Agent加Memory.mp4
│ ├── 大模型实战P11LangChain之Prompt和LLMChain.mp4
│ ├── 大模型实战P45问答机器人项目面试考点总结.mp4
│ ├── 大模型实战P36从用户问题中抽取命名实体词槽.mp4
│ ├── 大模型实战P37CQL词槽填充和相关问题筛选.mp4
│ ├── 大模型实战P1LangChain与知识图谱问答机器人项目.mp4
│ ├── 大模型实战P13LangChain之FewShotPrompt.mp4
│ ├── 大模型实战P41用户消息的补全和归纳总结.mp4
│ ├── 大模型实战P48快速接入百川和Claude大模型.mp4
│ ├── Neo4j实战P7-1Windows和Mac本地安装Neo4j数据库.mp4
│ ├── 大模型实战P44LangChain框架版本升级.mp4
│ ├── 大模型实战P24LangChain之多Agent协作.mp4
│ ├── 大模型实战P12LangChain之多参数与LCEL.mp4
│ ├── 大模型实战P32定义环境变量和模型获取函数.mp4
│ ├── 大模型实战P47一种解决Agent响应慢的方法.mp4
│ ├── 大模型实战P19LangChain之FAISS文档召回.mp4
│ ├── 大模型实战P28LangChain之GraphCypherQAChain.mp4
│ ├── 大模型实战P31项目LangChainAgent架构简介.mp4
│ ├── 大模型实战P40用Agent串联业务处理函数.mp4
│ ├── 大模型实战P43LangSmith监控大模型应用程序.mp4
│ ├── 大模型实战P20LangChain之文档加载和分割.mp4
│ ├── 大模型实战P30Gradio之ChatInterface对话界面.mp4
│ ├── 大模型实战P15LangChain之ConversationChain.mp4
│ ├── 大模型实战P27LangChain之输出提示词重写.mp4
│ ├── 大模型实战P8OpenAI接口实现TextEmbeddings.mp4
│ ├── 大模型实战P18LangChain之问答QAChain.mp4
│ ├── 大模型实战P9根据OpenAI句向量召回相似文本.mp4
│ ├── 大模型实战P26LangChain之命名实体识别.mp4
│ ├── 大模型实战P6OpenAI接口调用Token计算.mp4
│ ├── 大模型实战P46共性问题修复和统一答疑.mp4
│ ├── 大模型实战P39Google搜索回答非在库问题.mp4
│ ├── 大模型实战P10LangChain简介与初体验.mp4
│ ├── 大模型实战P16LangChain之Memory.mp4
│ ├── 大模型实战P17LangChain之LLMRequestsChain.mp4
│ ├── 大模型实战P2基础课和项目课的内容概述.mp4
│ ├── 大模型实战P21LangChain之文档检索问答.mp4
│ ├── 大模型实战P7OpenAI接口实现多轮对话.mp4
│ ├── Neo4j实战P7-2Windows和Mac本地安装Neo4j数据库.mp4
│ ├── 医疗问答P7CSV文件导入到Neo4j数据库.mp4
│ ├── 大模型实战P22LangChain之向量保存和加载.mp4
│ ├── 大模型实战P5OpenAI对话接口代码优化.mp4
│ ├── 大模型实战P3大语言模型通识和课前准备.mp4
│ ├── 大模型实战P42Gradio对话窗口修改和测试.mp4
│ ├── 大模型实战P29Gradio简介与初体验.mp4
│ ├── 大模型实战P14LangChain之SequentialChain.mp4
│ ├── 大模型实战P38查询Neo4j回答医疗相关问题.mp4
│ ├── 大模型实战P35Chroma召回数据回答公司相关问题.mp4
│ ├── 大模型实战P34通用大模型回答日常交际问题.mp4
│ ├── 大模型实战P33公司相关文档向量化和存储.mp4
│ ├── 大模型实战P4OpenAI对话接口简单使用方法.mp4
│ ├── 大模型实战P23LangChain之Agent和自定义Tool.mp4
├── 大模型面试笔记书籍
│ ├── 大模型论文
│ │ ├── CVPR 2024 (最佳+oral+highlight)(持续更新)
│ │ │ ├── 1 CVPR'24 获奖论文
│ │ │ │ ├── 4 最佳学生论文次优奖
│ │ │ │ │ ├── Objects as volumes: A stochastic geometry view of opaque solids.pdf
│ │ │ │ │ ├── Comparing the Decision-Making Mechanisms by Transformers and CNNs.pdf
│ │ │ │ ├── 2 最佳学生论文奖
│ │ │ │ │ ├── BIOCLIP:A Vision Foundation Model for the Tree of Life.pdf
│ │ │ │ │ ├── Mip-Splatting:Alias-free 3D Gaussian Splatting.pdf
│ │ │ │ ├── 3 最佳论文次优奖
│ │ │ │ │ ├── pixelSplat. 3D Gaussian Splats from lmage Pairs for Scalable Generalizable 3D Reconstruction.pdf
│ │ │ │ ├── 1 最佳论文奖
│ │ │ │ │ ├── Rich Human Feedback for Text-to-Image Generation.pdf
│ │ │ │ │ ├── Generative Image Dynamics.pdf
│ │ │ ├── 3 CVPR'24 oral论文(更新完毕)
│ │ │ │ ├── 18 多模态学习
│ │ │ │ │ ├── Describing Differences in Image Sets with Natural Language.pdf
│ │ │ │ │ ├── NoiseCLR:A Contrastive Learning Approach for Unsupervised Discovery of Interpretable Directions in Diffusion Models.pdf
│ │ │ │ │ ├── MetaCloak.pdf
│ │ │ │ │ ├── InternVL:Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks.pdf
│ │ │ │ ├── 1 低层次视觉
│ │ │ │ │ ├── Specularity Factorization for Low-Light Enhancement.pdf
│ │ │ │ │ ├── FMA-Net:Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring.pdf
│ │ │ │ │ ├── Bilateral Event Mining and Complementary for Event Stream Super-Resolution.pdf
│ │ │ │ │ ├── FlowIE:Efficient Image Enhancement via Rectified Flow.pdf
│ │ │ │ │ ├── Towards Robust Event-guided Low-Light Image Enhancement.pdf
│ │ │ │ ├── 11三维视觉
│ │ │ │ │ ├── A Subspace-Constrained Tyler’s Estimator and its Applications to Structure from Motion.pdf
│ │ │ │ ├── 16 低层次视觉与遥感
│ │ │ │ │ ├── DART:Implicit Doppler Tomography for Radar Novel View Synthesis.pdf
│ │ │ │ │ ├── LDP: Language-driven Dual-Pixel Image Defocus Deblurring Network.pdf
│ │ │ │ ├── 14 多视角三维技术和传感器 2
│ │ │ │ │ ├── Learning to Produce Semi-dense Correspondences for Visual Localization.pdf
│ │ │ │ ├── 15 低样本学习、自监督学习和半监督学习
│ │ │ │ │ ├── CroSel.pdf
│ │ │ │ │ ├── LTGC:Long-tail Recognition via Leveraging LLMs-driven Generated Content.pdf
│ │ │ │ │ ├── Improving Semantic Correspondence with Viewpoint-Guided Spherical Maps.pdf
│ │ │ │ ├── 6 多视角三维技术和传感器
│ │ │ │ │ ├── Seeing the World through Your Eyes.pdf
│ │ │ │ │ ├── Tri-Perspective View Decomposition for Geometry-Aware Depth Completion.pdf
│ │ │ │ │ ├── Steerers:A Framework for Rotation Equivariant Keypoint Descriptors.pdf
│ │ │ │ │ ├── Point Transformer V3:Simpler Faster Stronger.pdf
│ │ │ │ │ ├── Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences.pdf
│ │ │ │ ├── 5 深度学习架构与技术
│ │ │ │ │ ├── Neural Lineage.pdf
│ │ │ │ │ ├── Learning Structure-from-Motion with Graph Attention Networks.pdf
│ │ │ │ │ ├── Neural Redshift:Random Networks are not Random Functions.pdf
│ │ │ │ │ ├── In Search of a Data Transformation That Accelerates Neural Field Training.pdf
│ │ │ │ │ ├── Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks.pdf
│ │ │ │ ├── 7 单视角三维技术
│ │ │ │ │ ├── WALT3D:Generating Realistic Training Data from Time-Lapse Imagery for Reconstructing Dynamic Objects Under Occlusion.pdf
│ │ │ │ │ ├── EscherNet:A Generative Model for Scalable View Synthesis.pdf
│ │ │ │ │ ├── Rethinking Inductive Biases for Surface Normal Estimation.pdf
│ │ │ │ ├── 10 自主导航和自我中心视觉
│ │ │ │ │ ├── SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection.pdf
│ │ │ │ │ ├── EgoGen:An Egocentric Synthetic Data Generator.pdf
│ │ │ │ │ ├── UnO:Unsupervised Occupancy Fields for Perception and Forecasting.pdf
│ │ │ │ ├── 3 人类行为和特征
│ │ │ │ │ ├── Stratified Avatar Generation from Sparse Observations.pdf
│ │ │ │ │ ├── Semantic Human Mesh Reconstruction with Textures.pdf
│ │ │ │ │ ├── URHand:Universal Relightable Hands.pdf
│ │ │ │ │ ├── MultiPly:Reconstruction of Multiple People from Monocular Video in the Wild.pdf
│ │ │ │ │ ├── Relightable Gaussian Codec Avatars.pdf
│ │ │ │ ├── 2 视觉与图形
│ │ │ │ │ ├── Eclipse:Disambiguating Illumination and Materials using Unintended Shadows.pdf
│ │ │ │ │ ├── Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation.pdf
│ │ │ │ │ ├── DiffusionLight:Light Probes for Free by Painting a Chrome Ball.pdf
│ │ │ │ ├── 9 医学与物理视觉
│ │ │ │ │ ├── Transcriptomics-guided Slide Representation Learning in Computational Pathology.pdf
│ │ │ │ ├── 17 图像与视频合成 2
│ │ │ │ │ ├── MonoHair:High-Fidelity Hair Modeling from a Monocular Video.pdf
│ │ │ │ │ ├── Alchemist:Parametric Control of Material Properties with Diffusion Models.pdf
│ │ │ │ │ ├── Visual Anagrams:Generating Multi-View Optical Illusions with Diffusion Models.pdf
│ │ │ │ ├── 8 视觉、语言与推理
│ │ │ │ │ ├── Visual Program Distillation:Distilling Tools and Programmatic Reasoning into Vision-Language Models.pdf
│ │ │ │ │ ├── LISA:Reasoning Segmentation via Large Language Model.pdf
│ │ │ │ │ ├── Eyes Wide Shut Exploring the Visual Shortcomings of Multimodal LLMs.pdf
│ │ │ │ ├── 12 动作和运动分析
│ │ │ │ │ ├── An N-Point Linear Solver for Line and Motion Estimation with Event Cameras.pdf
│ │ │ │ │ ├── FineParser:A Fine-grained Spatio-temporal Action Parser for Human-centric Action Quality Assessment.pdf
│ │ │ │ │ ├── Modeling Multimodal Social Interactions:New Challenges and Baselines with Densely Aligned Representations.pdf
│ │ │ │ │ ├── RoHM:Robust Human Motion Reconstruction via Diffusio.pdf
│ │ │ │ ├── 4 图像与视频合成
│ │ │ │ │ ├── Ranni:Taming Text-to-Image Diffusion for Accurate Instruction Following.pdf
│ │ │ │ │ ├── Attention Calibration for Disentangled Text-to-Image Personalization.pdf
│ │ │ │ │ ├── FreeU:Free Lunch in Diffusion U-Net.pdf
│ │ │ │ │ ├── Instruct-Imagen: Image Generation with Multi-modal Instruction.pdf
│ │ │ │ │ ├── Style Aligned Image Generation via Shared Attention.pdf
│ │ │ │ ├── 13 数据集和评估
│ │ │ │ │ ├── 360+x:A Panoptic Multi-modal Scene Understanding Dataset.pdf
│ │ │ │ │ ├── Deep Generative Model based Rate-Distortion for Image Downscaling Assessment.pdf
│ │ │ │ │ ├── Ego-Exo4D:Understanding Skilled Human Activity from First- and Third-Person Perspectives.pdf
│ │ │ ├── 4 CVPR'24 highlight论文(更新中)
│ │ │ ├── 2 CVPR'24 最佳论文提名(更新完毕)
│ │ │ │ ├── 2 开源代码
│ │ │ │ ├── 1 提名论文
│ │ ├── 50篇大型语言模型提示工程必读
│ │ ├── ICLR 2024(更新中)
│ │ ├── 20篇llm必读
│ │ ├── ICLR 2024
│ │ │ ├── 【时间检验奖】Auto-Encoding Variational Bayes.pdf
│ │ ├── AAAI 2024 111篇
│ │ ├── 大模型MoE必读论文
│ │ │ ├── 【直播课原文】Pushing Mixture of Experts to the Limit Extremely Parameter Efficient MoE for Instruction Tuning.pdf
│ │ ├── LISA:大模型微调40篇
│ │ │ ├── 在大型视觉语言模型中评估物体幻觉.pdf
│ │ │ ├── MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口.pdf
│ │ │ ├── SPHINX:多模态大型语言模型的权重、任务和视觉嵌入的联合混合.pdf
│ │ │ ├── 利用显式推理链和可视化问题生成推进大型多模态模型.pdf
│ │ │ ├── 睁大眼睛?探索多模态LLMs的视觉缺陷.pdf
│ │ │ ├── LLaMA-VID:在大型语言模型中,一个图像值 2 个令牌.pdf
│ │ │ ├── LST:用于参数和内存高效迁移学习的梯形图侧调.pdf
│ │ │ ├── VL-PET:通过粒度控制进行视觉和语言参数高效调整.pdf
│ │ │ ├── mPLUG-Owl2:通过模态协作彻底改变多模态大型语言模型.pdf
│ │ │ ├── CaMML:适用于大型模型的情境感知多模态学习器.pdf
│ │ │ ├── Ziya-Visual:通过多任务指令调优的双语大型视觉语言模型.pdf
│ │ │ ├── Qwen-VL:用于理解、定位、文本阅读等的多功能视觉语言模型.pdf
│ │ │ ├── Lyrics-通过语义感知视觉对象促进细粒度语言-视觉对齐和理解.pdf
│ │ │ ├── MMBench:你的多模态模型是一个全能的玩家吗?.pdf
│ │ │ ├── OtterHD:高分辨率多模态模型.pdf
│ │ │ ├── 通过视觉指令调整改进基线.pdf
│ │ │ ├── 可视化指令调优.pdf
│ │ │ ├── 对比视觉-语言对齐使教学成为学习者的高效.pdf
│ │ │ ├── MiniGPT-4:使用高级大型语言模型增强视觉语言理解.pdf
│ │ │ ├── SVIT:扩展可视化指令调优.pdf
│ │ │ ├── InfMLLM:可视化语言任务的统一框架.pdf
│ │ │ ├── ReForm-Eval:通过统一重新制定面向任务的基准来评估大型视觉语言模型.pdf
│ │ │ ├── InstructBLIP:通过指令调整实现通用视觉语言模型.pdf
│ │ │ ├── Compacter:高效的低秩超复杂适配器层.pdf
│ │ │ ├── Shikra:释放多模态LLM的参照对话魔力.pdf
│ │ │ ├── Genixer:将多模态大型语言模型赋能为强大的数据生成器提供支持.pdf
│ │ │ ├── 眼见为实:提示 GPT-4V 进行更好的视觉指令调整.pdf
│ │ │ ├── SEED-Bench:对多模态LLMs进行生成式理解的基准测试.pdf
│ │ │ ├── UniPT:具有高效参数和存储器的迁移学习通用并行调优.pdf
│ │ │ ├── LISA: Layerwise Importance Sampling for Memory-efficient Large Language Model Fine-Tuning.pdf
│ │ │ ├── GlitchBench:大型多模态模型可以检测视频游戏故障吗?.pdf
│ │ │ ├── Video-LLaVA:通过投影前的对齐来学习统一的视觉表示.pdf
│ │ │ ├── 视觉语言预训练模型的近似提示调整.pdf
│ │ │ ├── VL-ADAPTER:用于视觉和语言任务的参数高效迁移学习.pdf
│ │ │ ├── ShareGPT4V:使用更好的字幕改进大型多模态模型.pdf
│ │ │ ├── 关于多模态语言模型的性能.pdf
│ │ │ ├── Visual Instruction Tuning with Polite Flamingo.pdf
│ │ │ ├── MM-Vet:评估大型多模态模型的集成能力.pdf
│ │ │ ├── HyperPELT:针对语言和视觉与语言任务的统一参数高效语言模型调优.pdf
│ │ │ ├── DoRA- Weight-Decomposed Low-Rank Adaptation.pdf
│ │ ├── ECCV24 收录论文83篇(更新中)
│ │ │ ├── 推荐工作
│ │ ├── Code Llama论文(5月最新+内含24篇)
│ │ │ ├── 2 LLaMA 1、2 论文&源码
│ │ │ │ ├── 源码:llama-main.zip
│ │ │ │ ├── LLaMA: Open and Efficient Foundation Language Models.pdf
│ │ │ │ ├── Llama 2:Open Foundation and Fine-Tuned Chat Models.pdf
│ │ │ ├── 3 Code Llama 其他相关论文
│ │ │ ├── 1 Code Llama 论文&源码
│ │ │ │ ├── 源码:codellama-main.zip
│ │ │ │ ├── 论文:Code Llama:Open Foundation Models for Code.pdf
│ │ ├── ICML 2024 67篇
│ │ │ ├── ICML'23
│ │ │ │ ├── 看不见的概括,逻辑推理和学位课程.pdf
│ │ │ │ ├── 适应零和不完全信息博弈中的博弈树.pdf
│ │ │ │ ├── 大型语言模型的水印.pdf
│ │ │ │ ├── 像素递归神经网络.pdf
│ │ │ │ ├── 混淆梯度给人一种虚假的安全感:规避对抗性示例的防御.pdf
│ │ │ │ ├── D-Adaptation 的无学习率学习.pdf
│ │ │ │ ├── 异质性治疗效果的因果等渗校准.pdf
│ │ │ │ ├── 通过影响函数理解黑盒预测.pdf
│ │ │ │ ├── Beyond Hawkes:时空点过程的神经多事件预测.pdf
│ │ │ │ ├── 用于统一通用逼近的 Leaky-ReLU 神经网络的最小宽度.pdf
│ │ │ │ ├── 通过噪声到噪声映射从噪声 3D 点云中学习有符号距离函数.pdf
│ │ │ │ ├── 用于子集选择的可解释行列式选择模型.pdf
│ │ │ │ ├── 正交解耦高斯过程的球形诱导特征.pdf
│ │ │ ├── ICML'24 最佳论文+时间检验奖
│ │ │ ├── ICML'24 oral(更新中)
│ │ ├── 100篇大模型必读论文
│ │ │ ├── 01必读.jpg
│ │ ├── EMNLP 19篇
│ │ │ ├── 自然语言生成的主动学习.pdf
│ │ │ ├── 通过概念化来解释嵌入空间.pdf
│ │ │ ├── IMTLab:用于构建、评估和诊断交互式机器翻译系统的开源平台.pdf
│ │ │ ├── 驾驭灰色地带:不确定性和过度自信的表达如何影响语言模型.pdf
│ │ │ ├── RAPL:一种用于少样本文档级关系提取的关系感知原型学习方法.pdf
│ │ │ ├── 重新审视机器翻译的跨语言分类.pdf
│ │ │ ├── 视觉、机器人技术及其他领域的语言基础.pdf
│ │ │ ├── 通过对NLP领域学术写作的对比分析来解决语言偏见.pdf
│ │ │ ├── 了解模型压缩对大型语言模型中社会偏见的影响.pdf
│ │ │ ├── 凝聚力:生成文本连贯性的增量与整体评估的新基准.pdf
│ │ │ ├── 用语言模型进行推理就是用世界模型进行规划.pdf
│ │ │ ├── 使用大型语言模型进行可解释的心理健康分析.pdf
│ │ │ ├── TopWORDS-Poetry:基于贝叶斯推理的中国古典诗歌同步文本分割和单词发现.pdf
│ │ │ ├── 学习用于多模态失语症类型检测的共同语音手势.pdf
│ │ │ ├── 具有 Wasserstein 独立性的公平文本分类.pdf
│ │ │ ├── ROBBIE:大型生成语言模型的鲁棒偏差评估.pdf
│ │ │ ├── 大型语言模型可以自我改进.pdf
│ │ │ ├── SODA:具有社会常识语境化的百万级对话提炼.pdf
│ │ │ ├── 混合倒挂索引是用于密集检索的鲁棒加速器.pdf
│ │ ├── CVPR 2024 (持续更新)
│ │ │ ├── 1 CVPR'24 获奖论文
│ │ │ │ ├── 4 最佳学生论文次优奖
│ │ │ │ │ ├── Objects as volumes: A stochastic geometry view of opaque solids.pdf
│ │ │ │ │ ├── Comparing the Decision-Making Mechanisms by Transformers and CNNs.pdf
│ │ │ │ ├── 3 最佳论文次优奖
│ │ │ │ │ ├── pixelSplat. 3D Gaussian Splats from lmage Pairs for Scalable Generalizable 3D Reconstruction.pdf
│ │ │ │ ├── 2 最佳学生论文奖
│ │ │ │ │ ├── Mip-Splatting:Alias-free 3D Gaussian Splatting.pdf
│ │ │ │ │ ├── BIOCLIP:A Vision Foundation Model for the Tree of Life.pdf
│ │ │ │ ├── 1 最佳论文奖
│ │ │ │ │ ├── Generative Image Dynamics.pdf
│ │ │ │ │ ├── Rich Human Feedback for Text-to-Image Generation.pdf
│ │ │ ├── 3 CVPR'24 oral论文(更新完毕)
│ │ │ │ ├── 10 自主导航和自我中心视觉
│ │ │ │ │ ├── EgoGen:An Egocentric Synthetic Data Generator.pdf
│ │ │ │ │ ├── SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection.pdf
│ │ │ │ │ ├── UnO:Unsupervised Occupancy Fields for Perception and Forecasting.pdf
│ │ │ │ ├── 15 低样本学习、自监督学习和半监督学习
│ │ │ │ │ ├── Improving Semantic Correspondence with Viewpoint-Guided Spherical Maps.pdf
│ │ │ │ │ ├── CroSel.pdf
│ │ │ │ │ ├── LTGC:Long-tail Recognition via Leveraging LLMs-driven Generated Content.pdf
│ │ │ │ ├── 13 数据集和评估
│ │ │ │ │ ├── 360+x:A Panoptic Multi-modal Scene Understanding Dataset.pdf
│ │ │ │ │ ├── Deep Generative Model based Rate-Distortion for Image Downscaling Assessment.pdf
│ │ │ │ │ ├── Ego-Exo4D:Understanding Skilled Human Activity from First- and Third-Person Perspectives.pdf
│ │ │ │ ├── 12 动作和运动分析
│ │ │ │ │ ├── An N-Point Linear Solver for Line and Motion Estimation with Event Cameras.pdf
│ │ │ │ │ ├── Modeling Multimodal Social Interactions:New Challenges and Baselines with Densely Aligned Representations.pdf
│ │ │ │ │ ├── FineParser:A Fine-grained Spatio-temporal Action Parser for Human-centric Action Quality Assessment.pdf
│ │ │ │ │ ├── RoHM:Robust Human Motion Reconstruction via Diffusio.pdf
│ │ │ │ ├── 5 深度学习架构与技术
│ │ │ │ │ ├── Learning Structure-from-Motion with Graph Attention Networks.pdf
│ │ │ │ │ ├── Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks.pdf
│ │ │ │ │ ├── In Search of a Data Transformation That Accelerates Neural Field Training.pdf
│ │ │ │ │ ├── Neural Lineage.pdf
│ │ │ │ │ ├── Neural Redshift:Random Networks are not Random Functions.pdf
│ │ │ │ ├── 7 单视角三维技术
│ │ │ │ │ ├── WALT3D:Generating Realistic Training Data from Time-Lapse Imagery for Reconstructing Dynamic Objects Under Occlusion.pdf
│ │ │ │ │ ├── EscherNet:A Generative Model for Scalable View Synthesis.pdf
│ │ │ │ │ ├── Rethinking Inductive Biases for Surface Normal Estimation.pdf
│ │ │ │ ├── 17 图像与视频合成 2
│ │ │ │ │ ├── Visual Anagrams:Generating Multi-View Optical Illusions with Diffusion Models.pdf
│ │ │ │ │ ├── Alchemist:Parametric Control of Material Properties with Diffusion Models.pdf
│ │ │ │ │ ├── MonoHair:High-Fidelity Hair Modeling from a Monocular Video.pdf
│ │ │ │ ├── 1 低层次视觉
│ │ │ │ │ ├── Towards Robust Event-guided Low-Light Image Enhancement.pdf
│ │ │ │ │ ├── Bilateral Event Mining and Complementary for Event Stream Super-Resolution.pdf
│ │ │ │ │ ├── Specularity Factorization for Low-Light Enhancement.pdf
│ │ │ │ │ ├── FMA-Net:Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring.pdf
│ │ │ │ │ ├── FlowIE:Efficient Image Enhancement via Rectified Flow.pdf
│ │ │ │ ├── 4 图像与视频合成
│ │ │ │ │ ├── FreeU:Free Lunch in Diffusion U-Net.pdf
│ │ │ │ │ ├── Attention Calibration for Disentangled Text-to-Image Personalization.pdf
│ │ │ │ │ ├── Instruct-Imagen: Image Generation with Multi-modal Instruction.pdf
│ │ │ │ │ ├── Ranni:Taming Text-to-Image Diffusion for Accurate Instruction Following.pdf
│ │ │ │ │ ├── Style Aligned Image Generation via Shared Attention.pdf
│ │ │ │ ├── 18 多模态学习
│ │ │ │ │ ├── NoiseCLR:A Contrastive Learning Approach for Unsupervised Discovery of Interpretable Directions in Diffusion Models.pdf
│ │ │ │ │ ├── InternVL:Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks.pdf
│ │ │ │ │ ├── MetaCloak.pdf
│ │ │ │ │ ├── Describing Differences in Image Sets with Natural Language.pdf
│ │ │ │ ├── 6 多视角三维技术和传感器
│ │ │ │ │ ├── Point Transformer V3:Simpler Faster Stronger.pdf
│ │ │ │ │ ├── Steerers:A Framework for Rotation Equivariant Keypoint Descriptors.pdf
│ │ │ │ │ ├── Tri-Perspective View Decomposition for Geometry-Aware Depth Completion.pdf
│ │ │ │ │ ├── Seeing the World through Your Eyes.pdf
│ │ │ │ │ ├── Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences.pdf
│ │ │ │ ├── 14 多视角三维技术和传感器 2
│ │ │ │ │ ├── Learning to Produce Semi-dense Correspondences for Visual Localization.pdf
│ │ │ │ ├── 3 人类行为和特征
│ │ │ │ │ ├── Semantic Human Mesh Reconstruction with Textures.pdf
│ │ │ │ │ ├── Stratified Avatar Generation from Sparse Observations.pdf
│ │ │ │ │ ├── MultiPly:Reconstruction of Multiple People from Monocular Video in the Wild.pdf
│ │ │ │ │ ├── Relightable Gaussian Codec Avatars.pdf
│ │ │ │ │ ├── URHand:Universal Relightable Hands.pdf
│ │ │ │ ├── 16 低层次视觉与遥感
│ │ │ │ │ ├── DART:Implicit Doppler Tomography for Radar Novel View Synthesis.pdf
│ │ │ │ │ ├── LDP: Language-driven Dual-Pixel Image Defocus Deblurring Network.pdf
│ │ │ │ ├── 8 视觉、语言与推理
│ │ │ │ │ ├── Eyes Wide Shut Exploring the Visual Shortcomings of Multimodal LLMs.pdf
│ │ │ │ │ ├── Visual Program Distillation:Distilling Tools and Programmatic Reasoning into Vision-Language Models.pdf
│ │ │ │ │ ├── LISA:Reasoning Segmentation via Large Language Model.pdf
│ │ │ │ ├── 9 医学与物理视觉
│ │ │ │ │ ├── Transcriptomics-guided Slide Representation Learning in Computational Pathology.pdf
│ │ │ │ ├── 11三维视觉
│ │ │ │ │ ├── A Subspace-Constrained Tyler’s Estimator and its Applications to Structure from Motion.pdf
│ │ │ │ ├── 2 视觉与图形
│ │ │ │ │ ├── Eclipse:Disambiguating Illumination and Materials using Unintended Shadows.pdf
│ │ │ │ │ ├── Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation.pdf
│ │ │ │ │ ├── DiffusionLight:Light Probes for Free by Painting a Chrome Ball.pdf
│ │ │ ├── 4 CVPR'24 highlight论文(更新中)
│ │ │ ├── 2 CVPR'24 最佳论文提名(更新完毕)
│ │ │ │ ├── 2 开源代码
│ │ │ │ ├── 1 提名论文
│ ├── 小黄搞AI大模型面试目录
│ │ ├── 小黄搞AI_大模型面试100问(PDF更新至90).pdf
│ │ ├── 小黄搞AI_大模型面试100问(PDF更新至74).pdf
│ │ ├── 小黄搞AI_大模型面试100问(PDF更新至107).pdf
│ ├── 大模型书籍
│ │ ├── Mastering Transformers_ Build state-of-the-art models from -- .pdf
│ │ ├── 预训练语言模型 2021 (邵浩 刘一烽) .pdf
│ │ ├── BERT基础教程:Transformer大模型实战 (苏达哈尔桑·拉维昌迪兰) .azw3
│ │ ├── 自然语言处理:基于预训练模型的方法_2021.pdf
│ │ ├── 精通Transformer:从零开始构建最先进的NLP模型_2023.epub
│ │ ├── Mastering NLP from Foundations to LLMs_ Apply advanced.pdf
│ │ ├── Building LLM Apps Create Intelligent Apps and Agents with Large Language Models_2024 .pdf
│ │ ├── 大规模语言模型:从理论到实践_2023.pdf
│ │ ├── 大语言模型_2024.pdf
│ │ ├── HuggingFace自然语言处理详解:基于BERT中文模型的任务实战.epub
│ │ ├── 大语言模型:基础与前沿_2024.epub
│ │ ├── 面向开发者的 LLM 入门课.pdf
│ │ ├── Transformer, BERT, and GPT:Including ChatGPT and Prompt Engineering_2024.pdf
│ │ ├── 大语言模型:基础与前沿_2024.pdf
│ │ ├── Transformers for Natural Language Processing Build, train, and fine-tune deep neural network architectures for NLP with... (--).pdf
│ │ ├── 扩散模型从原理到实战.epub
│ │ ├── Natural Language Processing with Transformers Building Language Applications with Hugging Face.pdf
│ │ ├── 中国人工智能系列白皮书——大模型技术(2023 版).pdf
│ │ ├── Transformers in Action (MEAP v7) _2024 .pdf
│ │ ├── Transformers生成式AI实用指南(提前发售 GPT双语) _2023 .epub
│ │ ├── 自然语言处理:原理、方法与应用.zip
│ │ ├── HuggingFace自然语言处理详解:基于BERT中文模型的任务实战.pdf
│ │ ├── Mastering Large Language Models Advanced techniques, applications, cutting-edge methods, and top LLMs_2024 .pdf
│ │ ├── 自然语言处理导论 2023 张奇.pdf
│ │ ├── Modern Generative AI with ChatGPT and OpenAI Models.pdf
│ │ ├── Generative AI with LangChain_ Build large language model.pdf
│ │ ├── BERT基础教程:Transformer大模型实战_2023.zip
│ │ ├── 精通Transformer:从零开始构建最先进的NLP模型_2023.pdf
│ │ ├── Getting Started with Google BERT_ Build and train .pdf
│ │ ├── 自然语言处理:原理、方法与应用 2023 (王志立 雷鹏斌 吴宇凡) .epub
│ │ ├── LLM Prompt Engineering For Developers The Art and Science of Unlocking LLMs True Potential_2024 .epub
│ │ ├── Mastering Large Language Models Advanced techniques, applications, cutting-edge methods, and top LLMs_2024 .epub
│ │ ├── Transformer自然语言处理实战:使用Hugging-Face-Transformers库构建NLP应用_2024.pdf
│ ├── 面试八股文
│ │ ├── 大模型校招面试题.pdf
│ │ ├── LLMs大模型面试问题和答案(97).pdf
│ │ ├── 大模型常见面试题及解答1.pdf
│ │ ├── 大模型 LLM 最全八股和答案.pdf
│ │ ├── AI大模型面试题(102).pdf
│ │ ├── 大模型岗位面试全纪录.pdf
│ │ ├── 大模型常考面试题总结(含答案).pdf
│ │ ├── 大模型常见面试题及解答2.pdf
│ │ ├── 大模型LLMS.pdf
│ │ ├── 从零开始大模型开发与微调基于PyTorch与ChatGLM.pdf
│ │ ├── 大模型常见面试题3.pdf
│ │ ├── 大模型落地应用案例集.pdf
│ ├── 大模型面试题
│ │ ├── 大模型(LLMs)参数高效微调(PEFT)面
│ │ │ ├── 适配器微调(Adapter-tuning)篇.pdf
│ │ │ ├── LoRA篇.pdf
│ │ │ ├── 参数高效微调篇PRFT.pdf
│ │ │ ├── 提示学习(Prompting)篇.pdf
│ │ ├── 大模型(LLMs)langchain面
│ │ │ ├── 基于LLM+向量库的文档对话经验面.pdf
│ │ │ ├── 大模型(LLMs)langchain面.pdf
│ │ ├── 31-LLM-Interview-Plus
│ │ │ ├── 大模型(LLMs)推理加速篇.pdf
│ │ │ ├── 大模型(LLMs)Tokenizer篇.pdf
│ │ │ ├── 多模态常见面试题.pdf
│ │ │ ├── 大模型校招面试题.pdf
│ │ │ ├── 大模型(LLMs)面试题答案Plus.pdf
│ │ │ ├── 大模型(LLMs)蒸馏面.pdf
│ │ │ ├── 大模型(LLMs)幻觉面.pdf
│ │ │ ├── 大模型(LLMs)分布式训练面.pdf
│ │ │ ├── 大模型(LLMs)显存问题面.pdf
│ │ │ ├── 大模型 RAG 检索增强生成面.pdf
│ │ │ ├── 大模型(LLMs)增量预训练篇.pdf
│ │ ├── 大模型(LLMs)强化学习—— PPO 面.pdf
│ │ ├── 大模型(LLMs)基础面.pdf
│ │ ├── 大模型(LLMs)强化学习——RLHF及其变种面.pdf
│ │ ├── 大模型(LLMs)训练集面.pdf
│ │ ├── 大模型(LLMs)进阶面.pdf
│ │ ├── 大模型(LLMs)评测面.pdf
│ │ ├── 大模型(LLMs)agent 面.pdf
│ │ ├── 大模型(LLMs)推理面.pdf
│ │ ├── 大模型(LLMs)幻觉面.pdf
│ │ ├── 大模型(LLMs)微调面.pdf