欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

中文*获取与处理流程

程序员文章站 2022-03-20 16:57:03
一、获取 http://dumps.wikimedia.org/ enwiki(英文)zhwiki(中文) 指导文档: https://www.cs.bgu.ac.il/~elhadad/nlp12/jwpl/wikification.html 二、处理 参考:https://dkpro.githu ......

一、获取

    

enwiki(英文)zhwiki(中文)

指导文档:

二、处理

参考:https://dkpro.github.io/dkpro-jwpl/howtogetjwpl/

cmd问题不太好解决(主要是看不懂改不了) 选择了eclipse

配置问题包括:

jdk 环境设置(系统及eclipse)

vm环境设置(eclips.ini)https://dkpro.github.io/dkpro-jwpl/developersetup/

数据结构设置(文件位置)

 

仔细阅读官方文档  各文件位置也很重要

 中文*获取与处理流程

 

 

他在运行。。。。。

等待ing(3小时吧)

结束

中文*获取与处理流程

 

 

三、创建相应的数据库

 

1创建数据库命令(数据库名db_name可以自行设定):注意要保证创建的数据库的编码是utf-8

create database wiki2019 default character set utf8 default collate utf8_general_ci;

 

 后面按大家的来,没什么问题不写了

参考(感谢):

https://www.cnblogs.com/cherishfx/p/5280259.html