Hanlp 配置
Releases · hankcs/HanLP
你使用的是 HanLP 1.x (如 portable-1.8.4)
HanLP 1.x 使用 hanlp.properties
文件进行配置。
步骤:
-
在
src/main/resources
下创建hanlp.properties
文件 -
写入以下内容:
- https://file.hankcs.com/hanlp/data-for-1.7.5.zip
wget https://file.hankcs.com/hanlp/data-for-1.7.5.zip .
下载时间比较慢,耐心等待。
解压后,将 data
文件夹放到正确位置
根据 hanlp.properties
中的 root
配置,将 data
文件夹放在指定目录。
例如,如果 hanlp.properties
中是 root=.
,那么你的项目结构应该是:
HanLP 官网
<!--hanlp 依赖-->
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.8.4</version>
</dependency>
hanlp:portable-1.8.4
是 HanLP 的 “便携版”(Portable Edition),它的特点是:
- 核心代码和模型数据打包在一起:与需要额外下载大型数据包的“标准版”不同,
portable
版本将常用的核心功能和模型数据直接打包在 JAR 文件内。 - 开箱即用:因此,你不需要再单独下载和配置
data
目录。只要引入这个依赖,就可以直接进行分词、词性标注、命名实体识别等基本操作。
总结:
使用 <version>portable-1.8.4</version>
这个版本,不需要你手动下载 data
文件。JAR 包本身已经包含了运行所需的核心数据。
注意:
- “便携版”的模型是精简过的,其精度和功能(例如支持的实体类型、自定义词典功能等)可能不如完整版。
- 如果你需要更高级的功能或更高的精度,可以考虑使用完整版(如
hanlp-1.8.4
),但那时就必须按照官方文档下载并配置庞大的data
文件。