当前位置: 首页 > news >正文

第1个小脚本:英语单语按字母个数进行升序排序

单词来源于coca单词库
效果如下:
2个字母的单词
3个字母的单词
4个字母的单词
5个字母的单词

n个字母的单词
在这里插入图片描述

def sort_words_by_length_and_alphabet(text):
    # 将输入文本按空格分割为单词列表
    words = text.split()

    # 去除标点符号
    import string
    words = [word.translate(str.maketrans('', '', string.punctuation)) for word in words]

    # 去掉重复的单词
    unique_words = set(words)
    #将所有单词转换为小写字母
    unique_words = [word.lower() for word in unique_words]

    # 按照每个单词的长度和字母顺序进行排序
    sorted_words = sorted(unique_words, key=lambda word: (len(word), word))

    # 返回排序后的单词列表
    return sorted_words


# 示例用法
if __name__ == "__main__":
    # 读取文件内容
    with open('COCA_20000.txt', 'r', encoding='utf-8') as file:
        text = file.read()

    # 提取单词并排序
    sorted_words = sort_words_by_length_and_alphabet(text)
    print("按单词长度和字母顺序升序排序的结果:", sorted_words)

    # 保存到文件
    with open('sorted_words.txt', 'w', encoding='utf-8') as file:
        for word in sorted_words:
            file.write(word + '\n')
    print("已保存到文件 sorted_words.txt")

相关文章:

  • Spark Core(2)
  • Java学习打卡-Day25-注解和反射、Class类
  • 除了 `task_type=“SEQ_CLS“`(序列分类),还有CAUSAL_LM,QUESTION_ANS
  • 分布式系统-脑裂,redis的解决方案
  • 2025年蓝桥杯B组题解
  • 深度剖析:架构评估的常用方法与应用
  • 当Browser Use遇见A2A:浏览器自动化与智能体协作的“冰与火之歌“
  • WindowsPE文件格式入门06.手写最小PE
  • 向上取整,向下取整和四舍五入
  • 安卓AssetManager【一】- 资源的查找过程
  • 【Java学习】Spring AI集成指南
  • 深入理解 v-if 指令及其使用方法
  • C++在Linux上生成动态库并调用接口测试
  • 七、Qt框架编写的多线程应用程序
  • JDK的卸载与安装
  • 【JavaScript——页面渲染】课程列表(蓝桥杯真题-2457)【合集】
  • 《从零搭建Vue3项目实战》(AI辅助搭建Vue3+ElemntPlus后台管理项目)零基础入门系列第十二篇(完结篇):数据统计功能实现
  • Java高性能并发利器-VarHandle
  • 【sgSpliter】自定义组件:可调整宽度、高度、折叠的分割线
  • 【技术派部署篇】云服务器部署技术派
  • 哪些网站做外贸/seo数据监控平台
  • ksweb搭建wordpress/单页网站seo优化
  • wordpress的上传大小/seo引擎优化教程
  • 佛山网站建设企业/国内最开放的浏览器
  • 公安局 网站备案/线上推广网络公司
  • 做网站要几个部门组成/四川聚顺成网络科技有限公司