中文*获取与处理流程
程序员文章站
2022-07-04 08:54:44
一、获取 http://dumps.wikimedia.org/ enwiki(英文)zhwiki(中文) 指导文档: https://www.cs.bgu.ac.il/~elhadad/nlp12/jwpl/wikification.html 二、处理 参考:https://dkpro.githu ......
一、获取
enwiki(英文)zhwiki(中文)
指导文档:
二、处理
参考:https://dkpro.github.io/dkpro-jwpl/howtogetjwpl/
cmd问题不太好解决(主要是看不懂改不了) 选择了eclipse
配置问题包括:
jdk 环境设置(系统及eclipse)
vm环境设置(eclips.ini)https://dkpro.github.io/dkpro-jwpl/developersetup/
数据结构设置(文件位置)
仔细阅读官方文档 各文件位置也很重要
他在运行。。。。。
等待ing(3小时吧)
结束
三、创建相应的数据库
1创建数据库命令(数据库名db_name可以自行设定):注意要保证创建的数据库的编码是utf-8
create database wiki2019 default character set utf8 default collate utf8_general_ci;
后面按大家的来,没什么问题不写了
参考(感谢):
https://www.cnblogs.com/cherishfx/p/5280259.html
上一篇: 微软调整Win10:磁盘清理工具将不再显示下载文件夹
下一篇: 百度云人脸识别API人脸对比