当前位置: 首页 > news >正文

python 取出字串中的所有词

import os
def fun(data, block, dic, user_dic):
    n = len(data)
    for i in range(n):
        for size in range(block, 1, -1):  # 从最长的块开始,直到长度为2
            if i + size <= n:
                same_word = data[i:i+size]
                if same_word in dic:
                    user_dic.add(same_word)
                    

if __name__ == "__main__":
    ss = set(['天安门','我爱','天安'])
    block = max(len(word) for word in ss)
    a = '我爱北京天安门,天安门上太阳升'
    user_dic = set()
    fun(a, block, ss, user_dic)
    print(user_dic)

相关文章:

  • C++:迭代器失效问题
  • 东田数码科技前端面经
  • 利用 Python 爬虫按关键字搜索 1688 商品详情:实战指南
  • (leetcode)力扣100 1.两数之和(两种方法:O(nlogn)/O(n))
  • Go 语言中的 `select` 语句详解
  • 30、不是说字符串是不可变的吗,string s=“abc“;s=“123“不就是变了吗?
  • 【C++】C++11新特性(一)
  • nextjs整合快速整合市面上各种AI进行prompt连调测试
  • 【Java二分查找】
  • Linux(Centos版本)中安装Docker
  • 在CentOS 8上在线安装Docker
  • 1到12月和1到31日英文表达
  • R中实现数值求导的包numDeriv
  • Web服务器技术选型指南:主流方案、核心对比与策略选择
  • 有效的字母异位词
  • 在线教育系统开发常见问题及解决方案:源码部署到运营维护
  • HarmonyOS NEXT:多设备的自由流转
  • 使用cmd来创建数据库和数据库表-简洁步骤
  • 乐企数电发票分布式发票号码生成重复的问题修复思路分享
  • 光敏材料与智能传感技术的能源系统创新研究
  • 全红婵/陈芋汐夺得跳水世界杯总决赛女子双人10米台冠军
  • 2025财政观察①长三角罚没收入增速放缓,24城仍在上涨
  • Meta一季度净利增长三成:上调全年资本支出,受关税影响亚洲出口电商广告支出减少
  • 人民日报钟声:国际社会应共同维护科学溯源的正确方向
  • 武汉楼市新政:二孩、三孩家庭购买新房可分别享受6万元、12万元购房补贴
  • 两部门调度部署“五一”假期安全防范工作,要求抓好旅游安全