robbe:PHP开源高性能中文分词扩展

一、robbe php开源高性能中文分词扩展

robbe是建立在friso中文分词上的一个高性能php中文分词扩展。了解friso

1.目前最高版本:friso 0.1,【源码无需修改即可在各平台下编译运行】

2.mmseg四种过滤算法,分词准确率达到了98.41%。

3.详细功能,请访问friso官方首页:friso

二、分词速度

测试环境:2.8GHZ/2G/Ubuntu

简单模式:3.1M/秒

复杂模式:1.4M/秒

(因为php中的大量字符串的复制,性能比friso有点下降)。

三、使用方法

1.下载:

(1).在friso下载下载最新的friso附件。

(2).在robbe下载下载最新的robbe附件。

2.安装:

(1). winNT系统: 复制friso-{version}/lib/win32/下的friso.dll和robbe-{version}/lib/win32/下的php_robbe.dll到php的ext扩展目录下。

(2). linux系统: 同上(或者自己make去安装,先安装friso,在安装robbe)。

(3). php.ini配置:
[javascript]
//1.加入扩展:

extension=php_robbe.dll //win
extension=php_robbe.so //linux

//2.加入robbe php配置:

[robbe]
;configuration file for robbe.
robbe.ini_file = friso.ini文件的绝对地址。
[/javascript]

3.php测试:

(1).运行phpinfo.php

看到:如下的配置信息表示配置成功了:

[ruby]
robbe

Robbe Support enabled
Version 0.1
Contact Method chenxin,qq:1187582057
Bug Report chenxin619315@gmail.com
Learn More http://code.google.com/p/robbe
C Edition http://code.google.com/p/friso
Java Edition http://code.google.com/p/jcseg

Directive Local Value Master Value
robbe.ini_file friso.ini地址 friso.ini地址
[/ruby]

(2).运行robbe_php下的两个php文件,你懂得。

robbe函数集合和使用实例

您的赞助将会支持作者创作及本站运维

评论

共1条
  1. 黑夜精灵 2013-05-16 20:39

    robbe好像是刚出来没多久,我也用了一下,感觉挺好用的。比scws和phpAnalysis什么的分词精度和速度都要好。

发表评论


TOP