科普丨什么是语言?什么是自然语言?-程序员宅基地

一、什么是语言?


语言(英文名:Language)是人类最重要的交际工具,是人们进行沟通交流的主要表达方式。人们借助语言保存和传递人类文明的成果。语言是民族的重要特征之一。一般来说,各个民族都有自己的语言。汉语法语俄语西班牙语阿拉伯语英语是世界上的主要语言,也是联合国的工作语言。汉语是世界上使用人口最多的语言,世界语英语是世界上使用最广泛的语言。据德国出版的《语言学语言交际工具问题手册》说,现在世界上查明的有5651种语言。在这些语言中,约有1400多种还没有被人们承认是独立的语言,或者是正在衰亡的语言。

语言是人们交流思想的媒介,它必然会对政治、经济和社会、科技乃至文化本身产生影响。语言这种文化现象是不断发展的,其现今的空间分布也是过去发展的结果。根据其语音语法词汇等方面特征的共同之处与起源关系,把世界上的语言分成语系。每个语系包括有数量不等的语种,这些语系语种地域上都有一定的分布区,很多文化特征都与此有密切的关系。语言是指生物同类之间由于沟通需要而制定的具有统一编码解码标准的声音(图像)讯号

语言又是符号系统,语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息,但这只是一些固定的程式,不能随机变化。


表达方式


语言就广义而言,是一套共同采用的沟通符号、表达方式与处理规则,符号会以视觉、声音或者触觉方式来传递。严格来说,语言是指人类沟通所使用的语言-自然语言。一般人都必须通过学习才能获得语言能力,语言的目的是交流观念、意见、思想等。语言学就是从人类研究语言分类与规则而发展出来的。研究语言的专家被称呼为语言学家。当人类发现了某些动物能够以某种方式沟通,就诞生了动物语言的概念。到了电脑的诞生,人类需要给予电脑指令。这种“单向沟通”就成了电脑语言


性质


编辑


语言是人与人之间的一种交流方式,人们彼此的交往离不开语言。尽管通过图片动作表情等可 以传递人们的思想,但是语言是其中最重要的,也是最方便的媒介。然而世 界各地的人们所用的语言各不相同,彼此间直接交谈是困难的,甚至是不可能的。即使是同一种语言,还有不同的方言,其差别程度也不相同。有的方言可以基本上相互理解,有的差别极大,好像是另一种语言,北京人听不懂广东话就是一个很好的例子。

不仅在不同的地区,有不同的语言和方言,就是在同一地区,不同的社会阶层,不同年龄的人之间都会有特殊的词汇来表达其独特的感情,使另一 阶层或不同年龄的人难以理解。如美国的黑人,他们虽然也使用英语,但是他们说的英语也有自己的特点,甚至被称为黑人英语。

在一种语言环境中掌握某种语言后,虽然也可以学会另一种或几种其他语言或方言,可是原语言或方言的口音很难完全改变,总会留下一定程度的原来所操语言的口音。熟悉语言的人往往就能从这些细微的差别中区分出说话人的家乡所在地及其身分和职业特征。

语言是文化的一个重要组成部分,甚至可以说没有语言也就不可能有文化,只有通过语言才能把文化一代代传下去。语言是保持生活方式的一个重要手段,几乎每个文化集团都有自己独特的语言。

语言是在特定的环境中,为了生活的需要而产生的,所以特定的环境必然会在语言上打上特定的烙印。另外,语言是人们交流思想的媒介,因此,它必然会对政治经济社会科技,乃至文化本身产生影响。语言这种文化现象是不断发展的,其现今的空间分布也是过去扩散、变化和发展的结果,所以,只有摆在时空的环境里才能全面地、深入地了解其与自然环境及人文环境的关系。


定义

语言的定义:以语音为物质外壳,由词汇和语法构成并能表达人类思想的符号系统。


特性

语言的特性有:创造性、结构性、意义性、指代性和社会性与个体性。


结构

语言的结构:音位语素、词、短语句子、全文。


种类

语言的种类:对话语言、独白语言、书面语言、内部语言

就大脑来说,语言分“脑语”和“嘴语”,脑语就是我们时时在大脑里产生称作“思考”或“思想”或“思维”的东西,脑语被嘴表达出来就叫“嘴语”。脑语和嘴语并不是一个东西,第一、脑语和嘴语在表达时失真;第二、嘴语不是脑语的唯一表达方式,因为脑语还可以通过肌肉群来表达:就是我们的行为。语言是一个人能力的重要表述部分。

语言分为“第一语言”和“第二语言”。

一个人从小通过和同一语言集团其它成员(如父母、亲属、周围的人们)的接触,自然学到并熟练运用于交际和思维过程中的语言。本族语言或母语一般说都是个人的第一语言,也是主要语言。

人出生后,首先掌握和使用的语言,叫第一语言。第二语言专指本国内非本族语。在全世界里,第二语言往往是和第一语言同时被使用的。


用途

语言的功能主要分为社会功能和思维功能两方面,其中社会功能包括信息传递功能和人际互动功能。

语言是思维工具和交际工具,它同思维有密切的联系,是思维的载体和物质外壳以及表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是人类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。语言具有稳固性和民族性

语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息但是这都只是一些固定的程式, 不能随机变化。只有人类才会把无意义的语音按照各种方式组合起来,成为有意义的语素,再把为数众多的语素按照各种方式组合成话语,用无穷变化的形式来表示变化无穷的意义。

人类创造了语言之后又创造了文字。文字是语言的视觉形式。文字突破了口语所受空间和时间的限制,能够发挥更大的作用。


文字

对于文字的发明,古人更加认为是一件了不起的大事。《淮南子》里说:“昔者仓颉作书而天雨粟,鬼夜哭。”最能表示文字的神力的是符号,这是跟口语里的咒语相当的东西。一般的文字也都沾上迷信的色彩,有字的纸不能乱扔,要放在有——“敬惜字纸”标签的容器里,积聚起来烧掉。文字里边当然也有避讳,嘴里不能说的名字,纸上也不能写;必得要写就得借用同音字,或者缺一笔。语言虽然可以作文字的基础,但语言毕竟不等于文字,尽管各国科学界和宗教界做出很大努力,然而世界上还有一半的语言没有相应的文字。


特征

符号性和系统性

首先,语言是社会约定俗成的表达观念的符号,符号的本质是社会的。它在某种程度上要逃避社会上某一些小集体,小圈子的意识。这是语言最主要的特征。语言是一种社会契约,一个社会接受一种表达手段而排斥另一种表达手段其实都是社会上的集体意识的习惯。或者可以说,没有好坏之分,关键是使用那一种表达方式。

语言符号是一种包含着两面性的实体。一方面语言是表示事物的名称的,所以任何语言都是概念的映像,即具有所指性;另外,语言要依托声音,这种媒介来表达所指,所以说语言也是声音的映像,声音是语言的另一个侧面,也就是说语言具有能指性。

任意性和线条性

所谓的任意性是指语言符号和文字能指所指之间是一种任意的连接关系(是不可论证的),即使有的可以论证,但是在普遍意义上来讲,还是不可论证的关系。这就是世界上的语言为什么各式各样的原因之一。

所谓的线条性是指语言的能指是依托声音来完成的,所以他只能在一维的声音的空间里传播,而不能突破声音的范围和能力,所以说在分析语言的时候语言使能在横向上依照词语出现的先后顺序来完成,这也造就了语言使用和表达的局限,但是语言的声音性,决定了语言的线性是不可消除的必然结果。

不变性和可变性

语言是一个处在不断地运动变化发展之中的体系,这个体系中的各个要素既有一定的稳定性,也有一定的变动性,稳定性是语言系统的已存在的前提,也是语言自身被大规模研习使用的必备条件,而变动性不仅仅是作为一个系统,语言内部的不断衍生、发展的规律所致,而且也是语言的传承性的表现。任何事物都是不断的运动变化发展的,新事物不断地产生,旧事物不断地消亡。语言也是这样,语言系统的变化虽然不是很明显,速度并不是很快,但是受到使用的推动以及社会、文化等等很多因素的影响,语言本身在不断的向着经济、简练、实用、包容力、表现力强的趋势发展。

语言内部的各个组成部分都有着不同方式、不同形态的变化,而且变化的多少快慢也是不一样的,但是在以往的研究中,我们逐渐掌握了越来越多的规律来解释、预测语言的变化。这不但体现了人们对于语言学的关注、探索取得了很多的成就同时也昭示了语言学的变化性还是有据可依,有律可循的。

传承性和交际性

语言从某种意义上来看,是人类文化得以传承和储存的有效载体。因此,它在自身的发展当中,逐步体现出很强的传承性和交际性。

所谓传承性,是指语言以自己的风格特色吸引或者促使人们在生活生产中自觉不自觉地通过语言这个工具直接或者间接影响着相关的人群,或者波及其他更广泛的区域。达到传承的效果。另外,语言在人类社会发展当中,不仅在人与人之间,古代人与现代人之间,中国人与外国人之间储存了文明的精华信息,承担文明发展的桥梁,同时,也由于语言本身的强大交际性功能,更显示出独特的交际功能,在丰富的交际中应对各种变化,产生更加有表达力的语言,产生更多的基于生活生产实际的意义。

表征 

语言表征】就是语言材料所负载的信息在头脑中存在的方式。语言的表征具有层次性。


加工

语言加工】就是对输入的语言信息进行编码、转换、存储、提取的过程。语言的加工可分为自动加工和受控制加工、系列加工和平行加工、模块化加工和交互作用式加工。


生理机制

1、语言的发音机制:呼吸器官喉头声带,口腔、鼻腔和咽腔。

2、语言活动的中枢机制:布洛卡区威尔尼克区角回

(1)布洛卡区病变引起的失语症通常称为运动性失语症或表达性失语症。

(2)威尔尼克区病变会引起接受性失语症,这是一种语言失认症。切断或损伤威尔尼克区与布洛卡区联系起来的神经纤维束-弓形束,也将产生同样的效果。

(3)角回实现口语和书面语言的转换。角回损伤将会引起语义性失语症。

3、语言在大脑两半球的一侧优势与语言活动。(割裂脑的研究),研究证实语言活动主要是大脑左半球的功能,但大脑右半球在语言理解中也有重要作用。


语音知觉

1、语音的物理性质:音高、音强、音长与音色。

2、音位是在一种语言中能够区别意义的最小的语音单位。音位分元音辅音。研究音位的区别特征有助于解释人对语音的感知。影响语音知觉的各种因素有:语音类似性,语音强度,噪音掩蔽,语境,句法、语义的作用。

3、影响词汇理解的因素:单词的部位信息、正字法规则字母长度或笔画数量、字形结构、字词的使用频率、语音的作用、语境的作用、语义的作用。

4、影响句子理解的因素:句子的类型、词序、语境、句法分析和语义分析。

5、影响话语理解的因素:推理、语境、图示作用。


语言起源

大致可以分为神授说和人创说,劳动创造说。


二、什么是自然语言?


自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人造语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。 自然语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的,也是各国人表达的方法其中之一。


简介


自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种由人蓄意为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人造语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。


发展


随着计算机和互联网的广泛应用,计算机可处理的自然语言文本数量空前增长,面向海量信息的文本挖掘、信息提取、跨语言信息处理、人机交互等应用需求急速增长,自然语言处理研究必将对我们的生活产生深远的影响。

自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的。随着计算机和互联网的广泛应用,,也随之衍生出了一系列的产品。相对而言,截止到2012年,国外在该领域的研究投入和成果都相对领先于国内,尤其汉语天然就相对于其他语种更为复杂,更为难以分析。

特点

自然语言处理发展的4个特点:

1. 基于句法—语义规则的理性主义方法受到质疑,随着语料库建设和语料库语言学的崛起,大规模真实文本的处理成为自然语言处理的主要战略目标;

2. 自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识;

3. 统计数学方法越来越受到重视;

4. 自然语言处理中越来越重视词汇的作用,出现了强烈的“词汇主义”的倾向。 

VB

在Visual Basic中 自然语言是指人类语言。是描述算法的一种方法。

缺陷

与自然语言相对的是逻辑语言。自然语言是人脑与人脑的交际工具 ,逻辑语言是人脑与电脑的交际工具。认知科学认为,思维和认知是知识的逻辑运算,任何计算化的自然语言分析都主要依赖逻辑语言对这种分析的表述。研究心智表现及其运算的认知科学理论追求的是心智研究的物质体现,这最终将导致语言学研究进入自然科学研究。自然语言的高度形式化描写对计算机程序的机械模仿至关重要,但理解力模仿不同于机械模仿,它们之间的区别非常类似自然语言中形式操作与意义操作之间的不同。机械模仿涉及的是形式性质,而理解力模仿涉及的却是准语义性质。现阶段计算机以机械模仿为主并通过逻辑语言与人类的自然语言对话。

现代逻辑作为分析自然语言的工具,认为自然语言的缺陷有:(1)表达式的层次结构不够清晰;(2)个体化认知模式体现不够明确;(3)量词管辖的范围不太确切;(4)句子成分的语序不固定;(5)语形和语义不对应。

从自然语言的视角衡量逻辑语言,其不足有:(1)初始词项的种类不够多样;(2)量词的种类比较贫乏;(3)存在量词的辖域在公式系列中不能动态的延伸;(4)由于语境的缺失而使语言传达信息的效率不高。


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/R1uNW1W/article/details/79683747

智能推荐

C#连接OPC C#上位机链接PLC程序源码 1.该程序是通讯方式是CSharp通过OPC方式连接PLC_c#opc通信-程序员宅基地

文章浏览阅读565次。本文主要介绍如何使用C#通过OPC方式连接PLC,并提供了相应的程序和学习资料,以便读者学习和使用。OPC服务器是一种软件,可以将PLC的数据转换为标准的OPC格式,允许其他软件通过标准接口读取或控制PLC的数据。此外,本文还提供了一些学习资料,包括OPC和PLC的基础知识,C#编程语言的教程和实例代码。这些资料可以帮助读者更好地理解和应用本文介绍的程序。1.该程序是通讯方式是CSharp通过OPC方式连接PLC,用这种方式连PLC不用考虑什么种类PLC,只要OPC服务器里有的PLC都可以连。_c#opc通信

Hyper-V内的虚拟机复制粘贴_win10 hyper-v ubuntu18.04 文件拷贝-程序员宅基地

文章浏览阅读1.6w次,点赞3次,收藏10次。实践环境物理机:Windows10教育版,操作系统版本 17763.914虚拟机:Ubuntu18.04.3桌面版在Hyper-V中的刚安装好Ubuntu虚拟机之后,会发现鼠标滑动很不顺畅,也不能向虚拟机中拖拽文件或者复制内容。在VMware中,可以通过安装VMware tools来使物理机和虚拟机之间达到更好的交互。在Hyper-V中,也有这样的工具。这款工具可以完成更好的鼠标交互,我的..._win10 hyper-v ubuntu18.04 文件拷贝

java静态变量初始化多线程,持续更新中_类初始化一个静态属性 为线程池-程序员宅基地

文章浏览阅读156次。前言互联网时代,瞬息万变。一个小小的走错,就有可能落后于别人。我们没办法去预测任何行业、任何职业未来十年会怎么样,因为未来谁都不能确定。只能说只要有互联网存在,程序员依然是个高薪热门行业。只要跟随着时代的脚步,学习新的知识。程序员是不可能会消失的,或者说不可能会没钱赚的。我们经常可以听到很多人说,程序员是一个吃青春饭的行当。因为大多数人认为这是一个需要高强度脑力劳动的工种,而30岁、40岁,甚至50岁的程序员身体机能逐渐弱化,家庭琐事缠身,已经不能再进行这样高强度的工作了。那么,这样的说法是对的么?_类初始化一个静态属性 为线程池

idea 配置maven,其实不用单独下载Maven的。以及设置新项目配置,省略每次创建新项目都要配置一次Maven_安装idea后是不是不需要安装maven了?-程序员宅基地

文章浏览阅读1w次,点赞13次,收藏43次。说来也是惭愧,一直以来,在装环境的时候都会从官网下载Maven。然后再在idea里配置Maven。以为从官网下载的Maven是必须的步骤,直到今天才得知,idea有捆绑的 Maven 我们只需要搞一个配置文件就行了无需再官网下载Maven包以后再在新电脑装环境的时候,只需要下载idea ,网上找一个Maven的配置文件 放到 默认的 包下面就可以了!也省得每次创建项目都要重新配一次Maven了。如果不想每次新建项目都要重新配置Maven,一种方法就是使用默认的配置,另一种方法就是配置 .._安装idea后是不是不需要安装maven了?

奶爸奶妈必看给宝宝摄影大全-程序员宅基地

文章浏览阅读45次。家是我们一生中最重要的地方,小时候,我们在这里哭、在这里笑、在这里学习走路,在这里有我们最真实的时光,用相机把它记下吧。  很多家庭在拍摄孩子时有一个看法,认为儿童摄影团购必须是在风景秀丽的户外,即便是室内那也是像大酒店一样...

构建Docker镜像指南,含实战案例_rocker/r-base镜像-程序员宅基地

文章浏览阅读429次。Dockerfile介绍Dockerfile是构建镜像的指令文件,由一组指令组成,文件中每条指令对应linux中一条命令,在执行构建Docker镜像时,将读取Dockerfile中的指令,根据指令来操作生成指定Docker镜像。Dockerfile结构:主要由基础镜像信息、维护者信息、镜像操作指令、容器启动时执行指令。每行支持一条指令,每条指令可以携带多个参数。注释可以使用#开头。指令说明FROM 镜像 : 指定新的镜像所基于的镜像MAINTAINER 名字 : 说明新镜像的维护(制作)人,留下_rocker/r-base镜像

随便推点

毕设基于微信小程序的小区管理系统的设计ssm毕业设计_ssm基于微信小程序的公寓生活管理系统-程序员宅基地

文章浏览阅读223次。该系统将提供便捷的信息发布、物业报修、社区互动等功能,为小区居民提供更加便利、高效的服务。引言: 随着城市化进程的加速,小区管理成为一个日益重要的任务。因此,设计一个基于微信小程序的小区管理系统成为了一项具有挑战性和重要性的毕设课题。本文将介绍该小区管理系统的设计思路和功能,以期为小区提供更便捷、高效的管理手段。四、总结与展望: 通过本次毕设项目,我们实现了一个基于微信小程序的小区管理系统,为小区居民提供了更加便捷、高效的服务。通过该系统的设计与实现,能够提高小区管理水平,提供更好的居住环境和服务。_ssm基于微信小程序的公寓生活管理系统

如何正确的使用Ubuntu以及安装常用的渗透工具集.-程序员宅基地

文章浏览阅读635次。文章来源i春秋入坑Ubuntu半年多了记得一开始学的时候基本一星期重装三四次=-= 尴尬了 觉得自己差不多可以的时候 就吧Windows10干掉了 c盘装Ubuntu 专心学习. 这里主要来说一下使用Ubuntu的正确姿势Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的开源GNU/Linux操作系统,Ubuntu 是基于DebianGNU/Linux,支..._ubuntu安装攻击工具包

JNI参数传递引用_jni引用byte[]-程序员宅基地

文章浏览阅读335次。需求:C++中将BYTE型数组传递给Java中,考虑到内存释放问题,未采用通过返回值进行数据传递。public class demoClass{public native boolean getData(byte[] tempData);}JNIEXPORT jboolean JNICALL Java_com_core_getData(JNIEnv *env, jobject thisObj, jbyteArray tempData){ //resultsize为s..._jni引用byte[]

三维重建工具——pclpy教程之点云分割_pclpy.pcl.pointcloud.pointxyzi转为numpy-程序员宅基地

文章浏览阅读2.1k次,点赞5次,收藏30次。本教程代码开源:GitHub 欢迎star文章目录一、平面模型分割1. 代码2. 说明3. 运行二、圆柱模型分割1. 代码2. 说明3. 运行三、欧几里得聚类提取1. 代码2. 说明3. 运行四、区域生长分割1. 代码2. 说明3. 运行五、基于最小切割的分割1. 代码2. 说明3. 运行六、使用 ProgressiveMorphologicalFilter 分割地面1. 代码2. 说明3. 运行一、平面模型分割在本教程中,我们将学习如何对一组点进行简单的平面分割,即找到支持平面模型的点云中的所有._pclpy.pcl.pointcloud.pointxyzi转为numpy

以NFS启动方式构建arm-linux仿真运行环境-程序员宅基地

文章浏览阅读141次。一 其实在 skyeye 上移植 arm-linux 并非难事,网上也有不少资料, 只是大都遗漏细节, 以致细微之处卡壳,所以本文力求详实清析, 希望能对大家有点用处。本文旨在将 arm-linux 在 skyeye 上搭建起来,并在 arm-linux 上能成功 mount NFS 为目标, 最终我们能在 arm-linux 里运行我们自己的应用程序. 二 安装 Sky..._nfs启动 arm

攻防世界 Pwn 进阶 第二页_pwn snprintf-程序员宅基地

文章浏览阅读598次,点赞2次,收藏5次。00为了形成一个体系,想将前面学过的一些东西都拉来放在一起总结总结,方便学习,方便记忆。攻防世界 Pwn 新手攻防世界 Pwn 进阶 第一页01 4-ReeHY-main-100超详细的wp1超详细的wp203 format2栈迁移的两种作用之一:栈溢出太小,进行栈迁移从而能够写入更多shellcode,进行更多操作。栈迁移一篇搞定有个陌生的函数。C 库函数 void *memcpy(void *str1, const void *str2, size_t n) 从存储区 str2 _pwn snprintf

推荐文章

热门文章

相关标签