��-PyTorch - 程序员宅基地

LLM-分布式训练工具01-DeepSpeed：ZeRO系列【将显存优化进行到底】

目前训练超大规模语言模型主要有两条技术路线：TPU + XLA + TensorFlow/JAX 和 GPU + PyTorch + Megatron-LM + DeepSpeed。前者由Google主导，由于TPU和自家云平台GCP深度绑定，对于非Googler来说，只可远观而不可...

大模型-微调技术：PEFT库

标签：人工智能深度学习机器学习

随着ChatGPT等LLM大模型的发展，目前业界已经发现只有当模型的参数量达到10B规模以上时-才能出现一些在小模型上无法得到的涌现能力-比如in_context learing和chain of thougt。深度学习似乎朝着模型越来越大的方向...

一切皆是映射：递归神经网络(RNN)和时间序列数据

标签：计算科学神经计算深度学习

一切皆是映射：递归神经网络(RNN)和时间序列数据 1. 背景介绍 1.1 时间序列数据的重要性在当今的数据驱动世界中,时间序列数据无处不在。从股票价格和天气预报,到语音识别和自然语言处理,时间序列数据都扮演着关键...

【LLM】金融场景的大模型Lora微调实战

标签：大模型金融垂直领域模型微调

金融行业需要垂直领域LLM，因为存在金融安全和数据大多数存储在本地，在风控、精度、实时性有要求（1）500亿参数的BloombergGPT BloombergGPT金融大模型也是用transformer架构，用decoder路线，构建目前规模最大的...

AI人工智能深度学习算法：循环神经网络的理解与使用

标签：计算科学神经计算深度学习

AI人工智能深度学习算法：循环神经网络的理解与使用 1.背景介绍 1.1 深度学习的兴起随着大数据时代的到来,海量的数据为机器学习算法提供了源源不断的燃料。与此同时,计算能力的飞速提升,尤其是GPU的广泛应用,为训练...

[NLP]LLaMA与LLamMA2解读

标签：自然语言处理 llama 人工智能

LLaMA是一个系列模型，模型参数量从7B到65B。在大部分的任务上，LLaMA-13B强于GPT-3(175B)。LLaMA-65B的性能，可以和最好的LM相媲美，如Chinchilla-70B 和 PaLM-540B。

pytorch框架yolov3算法训练自己数据集 win7~win10

标签：深度学习神经网络 pytorch

目录 1. 环境搭建 2. 数据集构建 1. xml文件生成需要Labelimg软件 2. VOC2007 数据集格式 3. 创建*.names file, 4. 更新data/coco.data,其中保存的是很多配置信息 5.... 6.... 3.... 4.... 5.... 6.... 7....

一看就懂的CE-NET详解

标签：神经网络计算机视觉深度学习

针对问题 ... 文章贡献提出了一个DAC模块和一个RMP模块来捕获更多的高级特征并保留更多的空间信息。在医学图像分割中，我们将所提出的数模转换模块和最小均方误差模块与编解码结构相结合。将该方法应用于不同的任务...

Yolo-FastestV2 训练自己的数据集

标签： pytorch 深度学习目标检测

根据原作者源码及说明实践后总结操作环境 Ubuntu 18.02 +cuda 11.1 +pytorch 1.9.0 ...配置环境 ...conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia 下载源码：

When to Use a GAN vs. a VAE? A Guide for Beginners

标签：自然语言处理人工智能语言模型

什么是生成对抗网络(GAN)和变分自编码器(VAE)，它们又有什么区别呢？在深度学习中，什么时候用GAN，什么时候用VAE？这都是个老生常谈的问题，但很少有系统性的文章总结出这些关系和选择建议，本文就是为了解决这个...

CodeWhisperer：强大的AI代码助手，大大提高编程效率

标签：人工智能

亚马逊云科技在2023年4月18日宣布，实时 AI 编程助手 Amazon CodeWhisperer 正式可用，同时推出的还有供所有开发人员免费使用的个人版（CodeWhisperer Individual）。CodeWhisperer 经过数十亿行代码的训练，可以...

DMM-Net：可微分的视频对象分割掩码匹配网络

标签：可微分视频对象分割 DMM-Net网络视频对象匹配掩码提议 PyTorch代码

139290DMM-Net：可微分的视频对象分割掩码匹配网络0Xiaohui Zeng 1, 2 � Renjie Liao 1, 2, 3* Li Gu 1 Yuwen Xiong 1, 2, 30Sanja Fidler 1, 2, 4 Raquel Urtasun 1, 2, 3, 50多伦多...

Dropout和BN：从理论到实践

标签：列车模式测试模式方差移位 Dropout和BN 实践指南

2682列车模式=1=0（1）测试模式= 1=0（1）��=��−��2019- 02-22�� 中文（简体）��...

递归视觉注意力解决视觉对话中的视觉共指问题

标签：递归视觉注意力视觉对话视觉共指深度神经网络视觉-语言任务

��...

LLMs：《Optimizing your LLM in production在生产环境中优化您的LLM》翻译与解读—LLM在实际应用中面临的...

标签：自然语言处理大语言模型生产环境

LLMs：《Optimizing your LLM in production在生产环境中优化您的LLM》翻译与解读—LLM在实际应用中面临的两大挑战(内存需求+对更长上下文输入需求)+提升LLM部署效率的三大技术(低精度量化+更高效的自注意力算法...

多模态-2020-VIT：用于大规模图像识别的Transformer（2020）

标签： transformer 深度学习人工智能

虽然Transformer架构已经成为自然语言处理任务的事实标准，但其在计算机视觉中的应用仍然有限。在视觉中，注意力要么与卷积网络结合使用，要么用于替换卷积网络的某些组件，同时保持其整体结构。...

pytorch任课（第三章）

import torch #torch.where a = torch.rand(4, 4) b = torch.rand(4, 4) print(a) print(b) tensor([[0.4295, 0.4639, 0.1673, 0.8253], [0.6463, 0.0885, 0.6070, 0.9644], [0.3394, 0.3260, 0.6519, 0.7562],...

知识回顾：Pytorch实现Least Squares GAN

相比于CNN,RNN等网络，GAN最难理解的点是其损失函数的含义以及定义，由于GAN由鉴别器和生成器两部分组成，在实现的时候我们需要定义两个损失：鉴别器损失生成器损失对于鉴别器D，我们要遵循一个思路便是真的为...

ICNN实现入侵检测的思路与源码（CIC-IDS-2017）

标签： python pytorch 卷积神经网络

基于ICNN实现入侵检测，可用于现实网络

自然语言处理：系统性地阐述了自然语言处理的任务定义、方法、工具及挑战。

标签：自然语言处理人工智能语言模型

1970年代中期，美国科学家提出了一个重要的问题：如何建造出具有自我意识的机器？这是一个极其重大的技术课题，在当时，这被认为是对人类技术发展前景的深刻考验。很快，随着这项工作的推进，自然语言处理也成为了...

NLP之DistilBERT：DistilBERT的简介、安装和使用方法、案例应用之详细攻略

标签：大语言模型自然语言处理 DistilBERT

NLP之DistilBERT：DistilBERT的简介、安装和使用方法、案例应用之详细攻略目录相关论文 DistilBERT的简介 ...DistilBERT的安装和使用方法 ...《DistilBERT, a distilled version of BERT: smaller, faster, ...

ChatGLM-6B 安装试用

标签： chatGLM-6B

vim cli_demo.py 修改模型下载的路径。在生成答案的过程中，GPU显存使用在一直上涨。他没有回答鱼香肉丝相关的做法。其余文件从 huggingface 下载。解方程的答案是错的，模型不擅长数学问题。加载完模型后 GPU 使用...

堆叠降噪自编码器python代码（基于TensorFlow1.0），已跑通

标签：深度学习

实现堆叠降噪自编码器功能，以tensorflow中的mnist数据集为例，python2.7

【Pytorch】使用torchvision下载mnist数据集速度过慢而报错的解决方案

标签： python 深度学习卷积神经网络

今天跟着莫烦学pytorch，搭建的第一个CNN网络用于mnist手写数字体识别。首先需要用torchvision下载mnist数据集。 train_data = torchvision.datasets.MNIST( root='./mnist/', train=True, # this is training ...

RuntimeError: grad can be implicitly created only for scalar outputs

标签： pytorch 深度学习 python

记录一下将Grad CAM用来解释自己搭建并训练好的模型遇到并解决的错误。

神经辐射场（NeRF）中-相机参数与坐标系变换

标签：数码相机

为了唯一地描述每一个空间点的坐标，以及相机的位置和朝向，我们需要先定义一个世界坐标系。一个坐标系其实就是由原点的位置与XYZ轴的方向决定。接着，为了建立3D空间点到相机平面的映射关系以及多个相机之间的相对...

看源码逐行学习ChatGLM2-6B大模型，项目中的modeling_chatglm.py文件

标签： agi 人工智能

【代码】看注解逐行学习ChatGLM2-6B模型，项目中的modeling_chatglm.py文件。

【保姆级教程】光速安装gpu版本pytorch

以上9点就是安装gpu版本pytorch全程，接下来一一详细解释 1.如何查看显卡版本？点这个英伟达设置，顶部帮助→系统信息找不到英伟达图标，也可以点右键我的电脑→管理→设备管理器→显示适配器，也能看到显卡型号...

centerpoint环境配置

标签： python 人工智能深度学习

ubuntu20.04+python3.7+cuda10.2+pytorch1.10.1+cmake3.22+spconv2.1.21 Basic Installation # basic python libraries conda create --name centerpoint python=3.7 conda activate centerpoint conda install ...

[GCT论文详解]Graph Convolutional Transformer学习电子健康记录EHR的图结构+github页面合集

标签： neo4j

电子健康记录 (EHR) 的有效建模正迅速成为学术界和工业界的一个重要话题。最近的一项研究表明，使用电子病历数据的图形结构（例如诊断和治疗之间的关系）可提高预测任务（如心力衰竭预测）的性能。...

”��-PyTorch“ 的搜索结果