VC++和python从哪一年开始支持split(字符串)非单个字符
相关文章:为什么.net过了20几年才支持SPLIT(字符串)分割方式,一直只能用单个字符
Python 是由荷兰人吉多・范罗苏姆(Guido van Rossum)于 1989 年发明的1。
1989 年圣诞节期间,吉多・范罗苏姆为了打发时间,决心开发一个新的脚本解释程序,作为 ABC 语言的一种继承2。1991 年 2 月,第一个 Python 解释器诞生,它是用 C 语言实现的,可以调用 C 语言的库函数2
以下是 C++ 和 Python 对字符串分割功能的支持历史:
C++ 的字符串分割支持
C++ 标准库在早期(如 C++98/03)并未提供类似 Split
的内置函数,开发者需手动实现或使用第三方库(如 Boost)。以下是关键时间节点:
-
Boost 库(2002 年左右)
Boost.StringAlgorithms 库提供了split
函数,支持按字符串分割:cpp#include <boost/algorithm/string.hpp> std::vector<std::string> results; boost::split(results, "a,b,c", boost::is_any_of(","));
-
C++11(2011 年)
标准库引入了std::regex
,可通过正则表达式实现字符串分割,但语法较复杂:cpp#include <regex> std::string s = "a,b,c"; std::regex re(","); std::sregex_token_iterator iter(s.begin(), s.end(), re, -1); std::sregex_token_iterator end; std::vector<std::string> tokens(iter, end);
-
C++20(2020 年)
引入了std::ranges
和std::views::split
,支持更简洁的字符串分割:cpp#include <ranges> #include <string> #include <vector>std::string s = "hello world"; auto words = s | std::views::split(' '); std::vector<std::string> tokens; for (auto&& word : words) {tokens.emplace_back(word.begin(), word.end()); }
Python 的字符串分割支持
Python 从早期版本就提供了 split()
方法,并且始终支持按字符串分割:
-
Python 1.0(1994 年)
已包含split()
方法,但仅支持按单个字符分割:python"a,b,c".split(',') # ['a', 'b', 'c']
-
Python 2.0(2000 年)
增强了split()
方法,支持按字符串分割:"ab-cd".split("-") # ['ab', 'cd']
-
Python 3.0(2008 年)
继续保留并改进了split()
方法,用法与现代版本一致:python"hello world".split(" ") # ['hello', 'world']
对比总结
语言 | 首次支持按字符串分割 | 关键版本 |
---|---|---|
Python | 2000 年(Python 2.0) | 原生支持,语法简洁 |
C++ | 2002 年(Boost 库) | 标准库直到 C++20(2020年)才提供简洁 API |
VB.NET | 2021 年(.NET 6) | 通过重载支持,历史兼容性问题 |
为什么 Python 能更早支持?
- 动态语言优势:Python 作为动态语言,无需担心类型转换问题,设计更灵活。
- 简洁优先:Python 强调 “用一种明显的方式解决问题”,字符串分割是高频需求。
- 后发优势:Python 1.0 发布于 1994 年,比 .NET(2002 年)早 8 年,有更多时间优化 API。
而 .NET 和 C++ 受限于静态类型系统、向后兼容性要求,以及多语言生态的复杂性,改进过程更为谨慎
关于 Python 早期版本对字符串分割的支持,需要先澄清一个关键点:Python 从诞生起就支持按单个字符分割字符串,但早期版本(如 Python 1.0)的 split()
方法默认仅按单个字符(如空格、逗号)拆分,而不支持直接按字符串(如多个字符组成的分隔符,如 "--")拆分。直到 Python 2.0(2000 年) 才明确支持按字符串作为分隔符。
2000 年之前(Python 1.x 时代)如何拆分字符串?
在 Python 2.0 之前(1994-2000 年),若需要按字符串分隔符(如 "--")拆分数据,开发者需要通过以下替代方法实现:
1. 使用循环手动拆分(低效但直接)
通过遍历字符串,逐个字符检查是否匹配分隔符的每个字符,遇到完整匹配时分割字符串。
示例:拆分 "abc--123" 为 ["abc", "123"] python
s = "abc--123"
delimiter = "--"
result = []
start = 0while True:# 查找分隔符位置pos = s.find(delimiter, start)if pos == -1:# 无剩余分隔符,添加剩余部分result.append(s[start:])breakelse:# 添加分隔符前的部分result.append(s[start:pos])# 跳过分隔符,继续查找start = pos + len(delimiter)print(result) # ['abc', '123']
2. 使用字符串替换(适用于简单场景)
将分隔符替换为单个字符(如逗号),再按单个字符拆分。
示例:先将 "--" 替换为 ",",再拆分 python
s = "abc--123"
temp = s.replace("--", ",") # 替换为单个分隔符
result = temp.split(",") # 按单个字符拆分
print(result) # ['abc', '123']
局限性:若原字符串包含其他需要保留的单个分隔符(如 ","),此方法会导致混淆。
3. 使用正则表达式(Python 1.5+ 引入 re 模块)
Python 1.5(1997 年)正式引入 re
模块,可通过正则表达式实现灵活拆分。
示例:用正则表达式匹配 "--" 分隔符
import res = "abc--123"
result = re.split("--", s)
print(result) # ['abc', '123']
优势:正则表达式支持复杂分隔符模式(如 "--" 或 "..."),且效率高于手动循环。
注意:早期 Python 的正则表达式语法与现代略有差异,但基本功能已可用。
为什么 Python 早期不支持按字符串拆分?
-
设计取舍:
Python 1.x 设计目标是 “简洁易用”,早期split()
方法定位为简单的单字符拆分工具,复杂场景推荐使用正则表达式(符合 “每个问题应有一个最优解” 的设计哲学)。 -
向后兼容性:
若早期版本直接支持字符串分隔符,可能导致旧代码(依赖单字符拆分逻辑)意外出错。Python 2.0 作为重大版本更新,才敢引入此功能。 -
历史背景:
2000 年之前,字符串处理需求以简单场景为主(如按空格、逗号拆分),复杂分隔符场景较少,开发者更习惯用正则表达式处理复杂情况。
总结:2000 年前的开发习惯
- 简单拆分:直接用
split('单字符')
(如split(',')
)。 - 复杂拆分:优先使用正则表达式(
re.split()
),或手动编写拆分逻辑。 - Python 2.0(2000 年)的改进:让
split()
直接支持字符串分隔符(如split("--")
),简化了常见场景的代码量,但并未完全替代正则表达式的灵活性。
这一演变体现了 Python 社区对 “简洁” 与 “兼容性” 的平衡 —— 早期通过正则表达式覆盖复杂需求,后期通过版本更新逐步增强原生功能。