博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.
阅读量:7120 次
发布时间:2019-06-28

本文共 1219 字,大约阅读时间需要 4 分钟。

paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.
mmseg默认词库只能是文件格式...不好维护..要是不个词库放的个数据库里面走好维护兰..
要实现2个目标..:
1.禁用默认词库,仅仅使用自定义词库
2.词库从数据库读取,而不使用默认的文件方式,方便维护..
作者Attilax  艾龙,  EMAIL:1466519819@qq.com 
来源:attilax的专栏
地址:http://blog.csdn.net/attilax
Dictionary.getInstance("")来的禁用默认词库,无效果...
查看Dictionary.loadDic 源码...看来无法通过dic = Dictionary.getInstance("");的方式来禁用它的默认词库...
只好扩展Dictionary了..new 了一个class,继承了Dictionary,重写loadDic方法...change 孪一瓦方法的..visiablity...这个方法虽然能行,要overwrite一瓦方法了.麻烦.半路儿上放弃...
换个丝路,不个哪加载的词库在给他卸除孪走ok兰吗.haha...
dic = Dictionary.getInstance();
 
//delete default words
Map<Character, CharNode> dict=dic.getDict();
Set set=dict.keySet();
Iterator<Character> it = set.iterator();  
while (it.hasNext()) {  
Character key = it.next();  
//  String val=String.valueOf( dict.get(key));
 CharNode cn=dict.get(key);
 cn.ktWordTails=new   KeyTree();  
}  
这样,走 禁用孪默认词库兰...完成孪1半儿兰..
词库从数据库读取到list,如何不个这个List动态加载到mmseg呢??
List<String> li=new ArrayList<String>();
li.add("上学好");
li.add("卖衣裳");
for(String word:li)
{
if(word.trim().length()==0 || word.length()<2)
continue;
String line=word;
CharNode cn = dict.get(line.charAt(0));
if(cn == null) {
cn = new CharNode();
dict.put(line.charAt(0), cn);
}else
cn.addWordTail(dic.tail(line));
}
扎实ok兰..哈
你可能感兴趣的文章
shell打印正三角形
查看>>
Mariadb /MySQL max_allowed_packet设置及问题
查看>>
常用工具——Rsync
查看>>
SylixOS 驱动程序加载
查看>>
插入排序
查看>>
4 python 中 关于数值及运算
查看>>
织梦轻量级mvc框架笔记
查看>>
cocos2dx 3.10 网狐土豪金版PC+手机端棋牌平台搭建
查看>>
减小VirtualBox虚拟硬盘文件的大小
查看>>
Hadoop概述
查看>>
Linux系统日志详解
查看>>
Linux笔记(shell特殊符号,sort排序,wc统计,uniq去重,tee,tr,split)
查看>>
11.15PMP试题每日一题
查看>>
华为模拟器如何实现不同Vlan不同网段之间的互通
查看>>
PHP 实现Session入库/存入redis
查看>>
kubernetes集群搭建
查看>>
Spring MVC 入门指南(二):@RequestMapping用法详解
查看>>
motion加树莓派打造实时监控
查看>>
详解MySQL基准测试和sysbench工具
查看>>
使用Spring Session和Redis解决分布式Session跨域共享问题
查看>>