python调用 java 的 ansj_seg 分词工具_使用python调用java的分词-程序员宅基地

技术标签: python  调用  错误  ansj_seg  自然语言处理  not found  

出现错误:

   jpype._jexception.RuntimeExceptionPyRaisable: java.lang.RuntimeException: Class org.ansj.splitWord.analysis.ToAnalysis not found。

         python调用 java 的 ansj_seg 分词工具的时候

        开始时候参考的是   python 调用 java 的 ansj_seg 分词工具

                          github链接:python引用jar包,找不到类

        代码为(class那里将冒号:改为分号;就可以了):

# -*- coding:utf-8 -*-
# -*- created by: mo -*-
import jpype
import os


# jvmPath = '/usr/lib/java/jdk1.8.0_161/jre/lib/amd64/server/libjvm.so'
jvmPath = 'D:/software/Java/Java8/jre/bin/server/jvm.dll'
# jvmPath = 'D:/software/Java/Java8/jre/bin/server/libjvm.so'
print (jvmPath)

jars_dir_ansj_seg = 'D:/software/IDEA/tools/maven_soft/org/ansj/ansj_seg/5.1.6'
jars_dir_nlp_lang = 'D:/software/IDEA/tools/maven_soft/org/nlpcn/nlp-lang/1.7.7'
jars_dir_tree_split = 'D:/software/IDEA/tools/maven_soft/org/ansj/tree_split/1.5'
jars = [os.path.join(jars_dir_ansj_seg, 'ansj_seg-5.1.6.jar'), os.path.join(jars_dir_nlp_lang, 'nlp-lang-1.7.7.jar'), os.path.join(jars_dir_tree_split, 'tree_split-1.5.jar')]
jvm_cp = "-Djava.class.path={}".format(';'.join(jars))
jpype.startJVM(jvmPath, "-ea", jvm_cp)
SegModel = jpype.JClass('org.ansj.splitWord.analysis.ToAnalysis')
jd = SegModel()
print(jd.parseStr("怎么这么麻烦"))

jpype.shutdownJVM()

结果:

D:/software/Java/Java8/jre/bin/server/jvm.dll
���� 20, 2018 8:59:15 ���� org.ansj.util.MyStaticValue warn
����: not find library.properties in classpath use it by default !
���� 20, 2018 8:59:15 ���� org.ansj.dic.impl.File2Stream info
��Ϣ: path to stream library/ambiguity.dic
���� 20, 2018 8:59:15 ���� org.ansj.library.AmbiguityLibrary error
����: Init ambiguity library error :org.ansj.exception.LibraryException:  path :library/ambiguity.dic file:D:\workspace\python\django_server\nlp_app\segment\library\ambiguity.dic not found or can not to read, path: library/ambiguity.dic
���� 20, 2018 8:59:15 ���� org.ansj.dic.impl.File2Stream info
��Ϣ: path to stream library/default.dic
���� 20, 2018 8:59:15 ���� org.ansj.library.DicLibrary error
����: Init dic library error :org.ansj.exception.LibraryException:  path :library/default.dic file:D:\workspace\python\django_server\nlp_app\segment\library\default.dic not found or can not to read, path: library/default.dic
���� 20, 2018 8:59:15 ���� org.ansj.library.DATDictionary info
��Ϣ: init core library ok use time : 544
���� 20, 2018 8:59:15 ���� org.ansj.library.NgramLibrary info
��Ϣ: init ngram ok use time :276
怎么/r,这么/r,麻烦/an
JVM activity report     :
    classes loaded       : 26
JVM has been shutdown 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/rensihui/article/details/82780916

智能推荐

如何使用SonarQube Scanner扫描器对代码进行扫描-程序员宅基地

文章浏览阅读3.2k次。2019独角兽企业重金招聘Python工程师标准>>> ..._代码扫描工具对转测前代码进行扫描

SQL常用语法( WITH 语句)-程序员宅基地

文章浏览阅读1.3w次,点赞6次,收藏46次。WITH语句

解决MySQL登录出现错误码10061_2008服务器登陆错误10061-程序员宅基地

文章浏览阅读2.5k次,点赞3次,收藏5次。原因: 没有启动MySQL服务解决方案:以管理员身份打开cmd命令行窗口,使用cd命令将目录切换为你MySQL的bin目录下,输入 net start mysql 启动MySQL服务即可解决此问题!!!电脑中搜索服务找到MySQL服务,启动它!管理员身份命令行窗口打开Windows快捷键: Win + X + A如果找不到MySQL服务,需要安装MySQL服务。解决的方法是用管理员的方式打开mysql安装目录bin。执行mysqld.exe -install,安装后就可以启动服务了!..._2008服务器登陆错误10061

STM32移植工程教程 包括解决Keil 一些常见的错误等等_s32ds 移植 keil startup error-程序员宅基地

文章浏览阅读2.9k次,点赞6次,收藏55次。然后打开Keil 在左边的能看到即说明添加成功 出现如图则说明添加成功编译一下,把多余的头文件删去 有6个错误 我们一般从第一个错误开始看 这里的错误 是TIM定时器的结构体没定义,但其实这些在工程里面的库函数这些都已经包含了这时候,找到stm32f10x_conf.h打开,可以看到stm32f10x_tim.h被注释掉了,这就是导致编译错误的原因,只需要删掉注释 重新编译一下即可 重新编译一下 错误就没有了有时候 会遇到引脚冲突,解决方法一修改文件里面的宏定义 更换为别的引脚解决方法二使用重定义功能_s32ds 移植 keil startup error

networkx学习与使用——(6)图划分与介数计算_边介数计算方法-程序员宅基地

文章浏览阅读6.8k次,点赞7次,收藏33次。networkx学习与使用——(5)图划分与介数计算摘要图划分例子生成介数定义及计算定义networkx计算边介数通过networkx的最短路算法实现使用networkx的内置函数计算结果分析参考摘要图划分按照一定规则将一个连通图划分成几个连通分量,看上去有点像聚类的感觉。从网络的角度,会根据一些重要的节点或边来进行划分,这里介绍划分图的指标——边介数。图划分图划分一般有两种方法,“删边法"和"聚集法”。删边法通过删除某条"重要"的边进行划分。聚集法通过将最"接近"的节点聚集起来构成不同的区域。这里_边介数计算方法

Python3读取Excel表格数据时报错:ImportError: Missing optional dependency ‘xlrd‘. Install xlrd >= 1.0.0 for Exc_install xlrd >= 1.0.0 for excel support-程序员宅基地

文章浏览阅读388次。ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use_install xlrd >= 1.0.0 for excel support

随便推点

Win10的WLAN网络共享给以太网(Ubuntu)_wifi共享给以太网-程序员宅基地

文章浏览阅读3.5k次。Win10的WLAN网络共享给Ubuntu实验室有一台比较老的机子,没有无线网卡,而且正好最长的一根网线水晶头坏掉了,装上Ubuntu上发现上不了网,正好看到旁边的笔记本(装的Win10),于是就萌生了使用WLAN将网络共享过来的想法。在网上查了些资料也遇到了一些坑,这里给大家分享一下。1、右键 打开“网络和Internet”设置2、打开 网络和共享中心3、点击 更改适配器设置4、在WLAN连接的情况下,右键选择属性 点开共享勾选允许其他网络用户通过此计算机的Internet连接来连接,_wifi共享给以太网

国网站直接SHOPPING经验之总结, 和美国代购说拜拜~~新加 如何注册PAYPAL~~~~-程序员宅基地

文章浏览阅读5.6w次。 不披马甲没几年 发表于 2009-06-15 23:03[引用]非常感谢众多JMS对本贴的支持和关心~~~ 也感谢 棍子鱼 管理员, 将原先的COPY发给偶, 使本贴重生~~~~申明!!! 本贴无任何商业目的, 不组织团购, 不参与代购!!! 血拼的同时大家也要按时偿还信用卡, 坚决不做卡奴!!!互联网的初衷是什么?? 就是资源共享~~~在经济危机的年代,

int数组、char数组理解,int8_t、int16_t、int32_t、int64_t、uint8_t、size_t、ssize_t区别_int16_t数组-程序员宅基地

文章浏览阅读2.9k次。这是根据需要决定的。用 char 时,数组每个元素的 字长与存储单元 是1个byte,(16进制2位,2进制8位), 用int时,数组每个元素的 字长与存储单元 是4个byte,(16进制8位,2进制32位)。现存放 16进制2位数,例如 0x3f, 0x06 之类,用 char 型足够了。若改用 int 型 当然也可以,只是浪费了 存储空间,因数位多,运算,读写 也要多费时间。..._int16_t数组

1024 程序员节|用代码,改变世界_编程改变世界-程序员宅基地

文章浏览阅读583次。1024程序员节_编程改变世界

JavaWeb快速入门--Tomcat-程序员宅基地

文章浏览阅读593次,点赞29次,收藏9次。Tomcat 服务器是一个开源的轻量级Web应用服务器,在中小型系统和并发量小的场合下被普遍使用,是开发和调试Servlet、JSP 程序的首选。web服务器软件:首先,我们知道JavaWeb是一个典型的浏览器/服务器(B/S)架构,一般情况下,我们在进行Web开发时,不止要搭建Web的开发环境,还需要对服务器端进行响应的配置。服务器:安装了服务器软件的计算机服务器软件:用来接收和处理用户的请求,并做出响应的软件。

R 与 RStudio:安装和入门使用-程序员宅基地

文章浏览阅读181次。R 与 RStudio:安装和入门使用R 是一种强大的编程语言和环境,广泛用于数据分析和统计建模。RStudio 是一个用于 R 的集成开发环境(IDE),提供了方便的代码编写、调试和可视化工具。本文将向您介绍如何安装 R 和 RStudio,并提供一些入门使用 R 语言的示例代码。

推荐文章

热门文章

相关标签