点击返回网站首页

 

Transformer的常用Tokenizer系列 - Java实现

这个sdk里包含了用于自然语言处理的tokenizer(分词器)。 切词输出的token序列,兼容huggingface(一个python实现的知名NLP库)。 java实现的Tokenizer有助于在java环境部署NLP模型。

包含的tokenizer如下:

Python transformer 常用tokenizer:

运行例子

SDK代码下载地址:

Github链接

Gitee链接

点击返回网站首页