| |
|
|
|
爱博汉语分词系统
最新版本:3.0.0
|
|
爱博汉语分词系统(ACWPS)介绍
爱博汉语分词系统(ACWPS),是一套可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的自然语言处理系统(NLP)。
爱博汉语分词系统是全球领先的中文智能聊天机器人小A的一个重要组件,基于中科院计算所的分词算法开发,能够快速准确的完成中分分词的任务。中文分词系统除了提供独立的服务器运行外,还可基于COM、DLL等技术调用,方便ASP等平台开发。
本系统支持Windows和Linux平台。 |
|
爱博汉语分词系统(Abot Chinese Word Parsing System)简介
爱博汉语分词系统基本特性
- 爱博汉语分词系统Web服务器支持标准的HTTP协议,可以跨平台调用,支持分布式运算;
- 爱博汉语分词系统COM组件提供COM和DLL接口(Windows环境) 以及共享库.so(Linux)形式,可支持所有支持COM接口调用的编程语言及脚本语言。
如:PHP、JSP、ASP、ASP.net、C/C++ 、VC6.0 、VC.net、BC、C#、VB6.0 、VB.net、Delphi、Java等。
- 爱博汉语分词系统支持自定义词语的功能,用户可根据自己需要定义添加汉语词组。
- 可根据需要自行定义影响检索结果的不必要的特殊字符,如:“%,*,&,的,啊,http,www”等。
- 爱博汉语分词系统同时具有英文单词的分词识别功能。
- 爱博汉语分词系统具有强大的词性标注的词性查询功能。可以将一句话中每个词语在这句话中的意思标注出来;可以通过词语查询接口,查询一个词语的所有可能出现的词性。
爱博汉语分词系统扩展性能
- 软件系统采用ANSI标准C++开发,可广泛应用于Linux和Win32等操作系统平台。
- 爱博汉语分词系统采用高效特殊的算法引擎结构,每秒钟拆分可达数万字中文文本(具体根据计算机性能而定。),在对搜索关键词进行拆分情况下,其响应时问均在数毫秒之内,为搜索提供强劲动力。
- 采用特殊的词组拆分识别算法,可有效消除汉语词组中汉语歧义,并可识别各个行业内的特殊用语、专用词汇、公司名、地名等,并具有汉语成语、汉语短语识别功能。
- ACWPS含盖了IT、化工、金融、贸易、纺织、电子、制造、冶金等各行各业以及日常生活用语中的汉语词组。
- 可自行定义干扰字、无意义字、敏感词过滤列表。如:啊、唉、个、了等无意义的以及煸动、反动、黄色和侵害他人的汉字、词组及英文。
软件使用说明
- 使用ACWPS Web Server

· ACWPS Web Server支持标准的HTTP 1.0和1.1协议;
· 可以通过GET和POST请求调用,进行分词操作;
· 通过“查看说明”按钮可以查看HTTP调用的API;
· 点击这里查看HTTP API说明文档。
- 基于COM组件开发软件
· COM接口最适合ASP、VB等脚本语言环境调用,以及各种应用程序;
· COM组件在安装ACWPS的时候自动注册到操作系统中,无需另行注册;
· 点击这里查看COM API说明文档。
- 基于DLL接口开发
· DLL接口方法和参数与COM基本一致,但不需要想操作系统注册可直接使用;
· DLL组件在安装ACWPS的时候保存在安装目录中;
· 点击这里查看DLL API说明文档。
- 其他未尽问题,请与客服联系。
爱博汉语分词系统常见问题(FAQ)
在线演示爱博汉语分词系统
下载爱博汉语分词系统
注册购买爱博汉语分词系统
| 功能选项 |
共享版 |
COM版 |
组件A版 |
组件B版 |
服务器A版 |
服务器B版 |
| 支持COM调用 |
√ |
√ |
√ |
|
√ |
|
| 支持DLL调用 |
× |
× |
√ |
√ |
√ |
√ |
| 支持HTTP调用 |
× |
× |
× |
× |
√ |
√ |
| 分词长度和使用次数限制 |
有 |
无 |
无 |
无 |
无 |
无 |
| 自定义词性标签 |
× |
√ |
√ |
√ |
√ |
√ |
| 自定义用户词典 |
× |
√ |
√ |
√ |
√ |
√ |
| 词性查询接口 |
× |
√ |
√ |
√ |
√ |
√ |
| 设定HTTP线程池和端口 |
× |
× |
× |
× |
√ |
√ |
| 操作系统环境 |
Windows |
Windows |
Windows |
Linux |
Windows |
Linux |
| 价格 |
免费 |
¥268.00 |
¥690.00 |
¥990.00 |
¥1290.00 |
¥1490.00 |
查看COM API接口
- 爱博汉语分词系统价格体系见上表,您可以根据需要选择。
通过代理商购买
你可以通过以下代理商购买
-
-
-
软件购买说明
1.请点击上面的购买链接,在购买留言中填写您的机器码(注册码),按照网页提示操作即可,您可以选择一种合适的付款方式。
2.本站会在您的款到后24小时内将注册邮件发送到您的邮箱中。如果款到超过24小时仍未收到注册邮件,请发邮件至本站邮箱查询。
3.收取注册邮件后,请检查邮件附件(licence.cer文件),按邮件中的提示操作,您的软件即注册成为正式版。
如何查看机器码(注册码)
我们的软件系统或说明文档中有明显的查看机器码的接口,请用复制粘贴的方法填写并发送给我们。
注意:每台电脑的机器码都不相同,请务必提供要使用本软件的那一台电脑的机器码。
直接向我们购买
如果直接向我们购买,请将机器码通过 Email/MSN/QQ/电话 等方式,发送给我们;同时将相关的费用存入我们的银行帐号。
我们在收到机器码和授权费用后,一个工作日内予以响应,并提供持续的免费售后服务,以及终身免费升级。
试用版与注册版的区别
试用版每次分词限制在100个汉字或者200个英文字母以内,无使用时间的限制。
- 任何疑问请Email:
。
应用平台及系统要求
| |
爱博汉语分词系统(ACWPS 版本 ) |
| 处理器(CPU) |
P Ⅱ 400 MHz 以上处理器 |
| 操作系统 |
本系统可以安装在以下任一系统上:
- Microsoft Windows 2000 Pro/Server/AS
- Microsoft Windows XP Pro/Home
- Microsoft Windows 2003 系列
- RedHat Linux AS3 或更高版本
|
| 内存 |
- 大于64 兆字节(MB)
- 更多的内存将可获得更高的性能。
|
| 硬盘 |
磁盘空间需求:大于1000 MB |
什么是汉语分词技术?
- 汉语分词技术是一种将连续的汉语文本序列按一定规则拆分为具有独立语义的词组的过程。汉语分词是当前分词技术中的一种,分词技术从语言文本结构上来讲大致有两类:一类以英文为代表的西方语言文本,其文本中的词组以空格做为自然间隔,从语义准确性及技术复杂度来讲都比较简单。另一类是以汉语为代表的东亚语言文本,由于文本是由连续文字组成,缺乏有效的间隔,虽有句、段分隔,但在进行机器语言学习、文本语义理解分析过程中都需以词组为最小单位。因此东亚文本语言实现分词技术相对西方文本语言来讲, 更加的复杂和困难。
- 汉语分词技术是语言文本处理技术的基础,其广范应用于互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自动摘要、自动分类及信息加工处理等各个领域。
中文分词 http://www.aboter.com/dev/ACWPS.html
Abot®商标属于本系统开发者所拥用;Windows®是美国Microsoft公司的注册商标。 |
|
|