�� NLP - 程序员宅基地

NLP01 : 形式语言和自动机

标签： c++

形式语言和自动机

多模态AnyGPT——整合图像、语音和文本多模态大规模语言模型算法原理与实践

标签：语言模型人工智能自然语言处理

AnyGPT的核心在于使用离散表示法，可以在不改变现有大规模语言模型的框架和训练方法的情况下毫不费力地纳入新的模态。AnyGPT 的核心在于使用离散表示法，可以在不改变现有大规模语言模型的框架和学习方法的情况下...

论文笔记 - 对话系统中的 OOD （Out of Domain出域）问题

标签： python 人工智能算法

人工智能与机器学习工程师最近看了下 2021年关于 OOD 的...处理 OOD 问题一般分为有监督和无监督两类方法。有监督方法相对更直接，收集好 OOD 数据，在 IND 和OOD 上训练一个二分类器，或者直接学习一个K+1 的分类器。

原创零基础入门NLP之新闻文本分类_Task6

标签：人工智能深度学习 python

了解了解Transformer的原理和基于预训练语言模型（Bert）的词表示学会Bert的使用，具体包括pretrain和finetune Transformer原理 Transformer是在"Attention is All You Need"中提出的，模型的编码部分是一组编码器...

Transformer推理性能优化技术很重要的一个就是K V cache，能否通俗分析，可以结合代码?

标签：人工智能 transformer AIGC

KV cache对应的优化方法，总结成下表：由上表可以看出，KV cache是个值得投入精力去研究的一个重要方向，算法上有着许多未知的方法可以去探索，工程上相对滞后，至少在主流推理框架上对部分方向的优化策略相对保守...

第087讲 http协议深度剖析④-http响应详解(文件下载)

下载头必须有的不然浏览器不认的。 Notice 注意代码里边的注释 &lt;?php $file_name="b.png"; //1、打开文件 if(!file_exists($file_name)){ echo "文件不存在"......

迭代潜在注意力的视觉语言架构P ERCEIVER-VL的高效处理多模态输入

标签：视觉语言框架多模态输入处理迭代潜在交叉注意力低复杂度和高效率视频文本基准评估

4410××2×PERCEIVER-VL：具有迭代潜在注意力的[***] Jie Lei Mohit Bansal酒店，伊斯坦布尔{terran，jmincho，jielei，mbansal}@ cs.unc.edu摘要我们提出了P ERCEIVER-VL，一个视觉和语言框架，有效地处理高维多...

在课堂中使用 ChatGPT 的 80 个方式（上）

标签： chatgpt

chatGPT 于 2022 年 11 月崭露头角。它已经开始颠覆高等教育等行业和企业，类似于印刷机和互联网。在核心上，chatGPT 利用人工智能来撰写涵盖众多主题的查询响应。在教育领域，阵营分为那些希望禁止 chatGPT 的人，...

使用拼音代替中文做nlp之拼音文本互转

标签：人工智能

使用拼音代替中文进行NLP（自然语言处理）任务的拼音文本互转有以下好处：减小词汇空间：中文词汇庞大，使用拼音代替可以将词汇空间减小到拼音字符的数量级，简化了问题规模。简化算法：使用拼音代替中文可以简化...

基于递归神经网络的跌倒检测系统

标签：神经网络人工智能深度学习

在分析跌倒检测要求的基础上，针对RNN的特点，设计了序列化的传感器数据、RNN训练与检测输入表示方法，给出了用于跌倒检测的RNN训练算法以及基于RNN的跌倒检测算法，将跌倒检测转换为输入序列的分类问题；...

提升场景文本检测器性能的视觉语言预训练方法

标签：语言预训练场景文本检测跨模态交互图像编码器预训练模型

156810用于提升场景文本检测器的视觉语言预训练0宋思博 1 � 万建强 1 � 杨志波 1 唐军 1 程文青 2 白翔 2 姚聪 101 阿里巴巴达摩院 2 华中科技大学0{ sibosongzju,hustwjq,yangzhibo450,...

deeplearning.ai - 自然语言处理与词嵌入

序列模型吴恩达 Andrew Ng Natural Language Processing &amp; Word Embeddings Introduction to Word Embeddings Word Representation 词汇表征 1-hot representation ...相关词的泛化能力...

复旦邱锡鹏教授：语言模型即服务的五类应用手段，你了解多少

标签：语言模型深度学习自然语言处理

2022年10月15日“小红书REDtech青年技术沙龙”活动中，我们非常荣幸地邀请到了上海复旦大学计算机学院邱锡鹏教授，邱教授分享了《语言模型即服务与黑箱优化》报告，详细讲解了语言模型越来越大的背景下对于新应用...

点云数据的自适应图卷积方法

标签：自适应图卷积点云分析三维点云卷积卷积算法点云分类

4965231422331442 ��2Ƹ��Ƹ3314��Ƹ4点云分析的自适应图卷积方法周浩然1冯一丹2方明生1魏明强2 * 秦静3卢彤1 *1南京大学2南京航空航天3香港理工大学摘要由二维网格状区域推广而来的三维点云的卷积算法...

计算机视觉论文-2021-07-23

标签：计算机视觉机器学习人工智能

本专栏是计算机视觉方向论文收集积累，时间：2021年7月23日，来源：paper digest ... 直达笔记地址：机器学习手推笔记（GitHub地址） 1, TITLE:A Public Ground-Truth Dataset for Handwritten Circuit Diagram ...

语法特征概况对语言模型的语义检测的重要性

标签：语言学家语法特征语言模型语义变化形态句法变化

0不要解雇语言学家：语法特征概况帮助语言模型检测语义变化0Mario Giulianelli �0阿姆斯特丹大学[email protected] Kutuzov �0奥斯陆大学[email protected]赫尔辛基大学Lidia ...

生物医学知识探测的对比方法及其性能评估

标签：自监督对比探测方法探测技术进一步发展

0重连再探：一种对预训练语言模型进行生物医学知识探测的对比方法0Zaiqiao Meng �� Fangyu Liu �� Ehsan Shareghi ��0Yixuan Su � Charlotte Collins � Nigel Collier �0�剑桥大学语言...

[细读经典]Megatron论文和代码详细分析(1)

标签：人工智能

作为一款支持multi-nodemulti-GPU的可以直接用来训练GPT3等世界上超大规模的自然语言模型的开源代码，Megatron值得被深入分析。Xianchao-Wu/Megatron-LMgithub.com/Xianchao-Wu/Megatron-LM正在上传…重新上传取消...

NLP提升物流组织员工敬业度的新方法

标签：计算机工程系博士绿色可持续物流变革

International Journal of Information Management Data Insights 1（2021）100011i-Pulse：一种基于NLP的物流组织员工敬业度新方法Rachit Garga，b，Arvind W Kiwelekara，Laxman D Netaka，Akshay Ghodakeb计算机...