1、下载Jar、配置文件及训练库
http://hanlp.linrunsoft.com/services.html
2、修改配置文件中的根目录,到训练库的根目录
3、写一些代码
public static void tag(String sentence) throws Exception { List<Term> terms = StandardTokenizer.segment(sentense); System.out.println(terms); //terms = NLPTokenizer.segment(sentense); //System.out.pr1intln(terms); //terms = IndexTokenizer.segment(sentense); //System.out.println(terms); //terms = SpeedTokenizer.segment(sentense); //System.out.println(terms); //terms = new NShortSegment().seg(sentense); //System.out.println(terms); //terms = new DijkstraSegment().seg(sentense); //System.out.println(terms); }
4、输入
zh.txt
别让别人告诉你你成不了才,即使是我也不行。 如果你有梦想的话,就要去捍卫它。 那些一事无成的人想告诉你你也成不了大器。 如果你有理想的话,就要去努力实现。 就这样。
5、输出
zhout.txt
[别/d, 让/v, 别人/rr, 告诉/v, 你/rr, 你/rr, 成不了/l, 才/d, ,/w, 即使/c, 是/vshi, 我/rr, 也/d, 不行/a, 。/w, 如果/c, 你/rr, 有/vyou, 梦想/n, 的/ude1, 话/n, ,/w, 就要/d, 去/vf, 捍卫/v, 它/rr, 。/w, 那些/rz, 一事无成/vl, 的/ude1, 人/n, 想/v, 告诉/v, 你/rr, 你/rr, 也/d, 成不了/l, 大/a, 器/ng, 。/w, 如果/c, 你/rr, 有/vyou, 理想/n, 的话/udh, ,/w, 就要/d, 去/vf, 努力/ad, 实现/v, 。/w, 就/d, 这样/rzv, 。/w]