当前位置: 首页 > news >正文

网站生成手机站网站建设电子商务

网站生成手机站,网站建设电子商务,比较好看的网页设计,图片外链生成工具在线TextSplitterspring-ai有一个文本分割器接口,TextSplitterspring-ai本身仅提供了一个TokenTextSplitter,按照token个数进行切分但是这样的切分策略很容易在段落或句子中间断开,造成语义的割裂,很难保持语义完整性SentenceSplitter…

TextSplitter

spring-ai有一个文本分割器接口,TextSplitter

spring-ai本身仅提供了一个TokenTextSplitter,按照token个数进行切分

但是这样的切分策略很容易在段落或句子中间断开,造成语义的割裂,很难保持语义完整性

SentenceSplitter

spring-ai-alibaba为了解决这个问题,提供了一个SentenceSplitter

不过该切分器是使用opennlp的SentenceModel进行句子切分,底层是一个训练好的拆分句子的模型,像是一个黑盒,并不容易理解

RecursiveCharacterTextSplitter

最近,spring-ai-alibaba新增了一个RecursiveCharacterTextSplitter,迭代字符文本分割器

该分割器的逻辑也很容易理解,就是维护一个分隔符列表,首先使用第一个分隔符进行分割,如果文本大小不满足要求,就继续用下一个分隔符进行分割,直到分隔符用完,就按设置的文本大小进行分割

相比于英文中,句号和小数点共用,中文有自己专用的句号,使用句号进行分割不容易失误,更适合中文环境下使用

默认分隔符列表是{ "\n\n", "\n", "。", "!", "?", ";", ",", " " },代表双换行符、单换行符、中文句号、中文叹号、中文问号、中文分号、中文逗号、空格

代码调用

        List<Document> documents = ...RecursiveCharacterTextSplitter splitter = new RecursiveCharacterTextSplitter();documents = splitter.split(documents);

调用方法很简单,new 一个 RecursiveCharacterTextSplitter,然后调用split方法即可

默认文本块大小为1024,支持自定义分隔符列表

ps:该类目前还未发布到中央仓库,使用需自行编译打包,或等待新版本(>1.0,0,2)

http://www.dtcms.com/a/464356.html

相关文章:

  • 做微信用什么网站建筑网络工程教程
  • 网站 备案 几天做网站多少分辨率好
  • 做好网站建设静态化下载网站模板怎么使用
  • 新闻资讯网站备案网站推广公司 wordpress
  • 免费建站的站点网站wordpress 页面目录
  • 手表网站十大品牌深圳建筑工程招投标中心
  • 网站影响seo的标签小米路由可以做网站吗
  • 手机网站建设信息谁给我一个企业邮箱认证
  • 站长工具seo查询网站导航的建设模板
  • 网站怎么做微信登录界面江苏建发建设项目咨询有限公司网站
  • 中国五码一级做爰网站上海网站建设最好的公司
  • 个人手机版网站建设宁远做网站
  • 网站建设辶金手指排名十三基金网站建设
  • 建设品牌网站公司做网站用什么牌子电脑
  • 网站图片怎么做才有吸引力搜索引擎排名优化技术
  • 自动优化网站建设咨询wordpress众筹插件
  • 宜昌哪里有做网站的wordpress电脑安装教程视频
  • 做网站公司上海网上营销的好处
  • 招投标网站官网高清做 视频在线观看网站
  • 私人做的不错的网站上海网站怎么备案号
  • 个人做二次元网站怎么赚钱wordpress 取消自适应
  • 濮阳做网站百度建立网站需要花多少钱
  • 涉密项目单位网站建设流程网站建设后台程序用什么语言
  • 酒店网站建设趋势简单网站开发项目实例
  • 贵州城乡建设厅考试网站福州全网营销推广公司
  • 电子商务网站的目的网络空间安全考研院校
  • 花店网站建设网络营销的基本内容有哪些
  • 做网站的公司 苏迪建设农产品网站总结ppt模板
  • 北京赵公口网站建设wordpress转换中文版
  • 百度如何建网站网站建设人员的组织