Java字符串处理
Java字符串处理全解析:String、StringBuilder与StringBuffer
一、String类基础
1. String的本质
- 不可变对象:Java中的String对象一旦创建就不能修改
- 底层实现:基于
private final char value[]
字符数组 - 字符串池:JVM维护的特殊存储区域,用于存储字符串字面量
2. 创建String对象的两种方式
// 方式1:字面量创建(直接存入字符串池)
String s1 = "Hello";// 方式2:new创建(堆内存新建对象)
String s2 = new String("Hello");
3. 字符串比较
String a = "Java";
String b = "Java";
String c = new String("Java");System.out.println(a == b); // true(指向字符串池同一对象)
System.out.println(a == c); // false(不同对象)
System.out.println(a.equals(c)); // true(内容相同)
4. 常用方法
方法 | 说明 | 示例 |
---|---|---|
length() | 获取长度 | "abc".length() → 3 |
charAt() | 获取指定位置字符 | "abc".charAt(1) → ‘b’ |
substring() | 截取子串 | "Hello".substring(1,3) → “el” |
indexOf() | 查找字符位置 | "Java".indexOf('a') → 1 |
toLowerCase() | 转小写 | "Java".toLowerCase() → “java” |
toUpperCase() | 转大写 | "Java".toUpperCase() → “JAVA” |
trim() | 去除首尾空格 | " Java ".trim() → “Java” |
split() | 分割字符串 | "a,b,c".split(",") → [“a”,“b”,“c”] |
replace() | 替换字符 | "Java".replace('a','o') → “Jovo” |
二、StringBuilder与StringBuffer
1. 可变字符串类比较
特性 | String | StringBuilder | StringBuffer |
---|---|---|---|
可变性 | 不可变 | 可变 | 可变 |
线程安全 | 是 | 否 | 是 |
性能 | 低 | 高 | 中等 |
使用场景 | 少量操作 | 单线程大量操作 | 多线程大量操作 |
2. StringBuilder核心方法
StringBuilder sb = new StringBuilder();// 链式调用
sb.append("Java").append(" is").append(" awesome!");
System.out.println(sb); // "Java is awesome!"sb.insert(5, "really "); // 插入
sb.delete(5, 12); // 删除
sb.replace(0, 4, "Kotlin"); // 替换
sb.reverse(); // 反转
3. StringBuffer线程安全示例
class BufferThread extends Thread {private StringBuffer buffer;public BufferThread(StringBuffer buffer) {this.buffer = buffer;}@Overridepublic void run() {for(int i=0; i<100; i++){buffer.append(i);}}
}public class ThreadSafeDemo {public static void main(String[] args) throws InterruptedException {StringBuffer buffer = new StringBuffer();Thread t1 = new BufferThread(buffer);Thread t2 = new BufferThread(buffer);t1.start();t2.start();t1.join();t2.join();System.out.println("最终长度: " + buffer.length()); // 正确输出200}
}
三、性能对比实验
1. 字符串拼接测试
public class PerformanceTest {static final int LOOP_COUNT = 100000;public static void stringTest() {long start = System.currentTimeMillis();String s = "";for(int i=0; i<LOOP_COUNT; i++){s += "a";}System.out.println("String耗时: " + (System.currentTimeMillis()-start) + "ms");}public static void builderTest() {long start = System.currentTimeMillis();StringBuilder sb = new StringBuilder();for(int i=0; i<LOOP_COUNT; i++){sb.append("a");}System.out.println("StringBuilder耗时: " + (System.currentTimeMillis()-start) + "ms");}public static void bufferTest() {long start = System.currentTimeMillis();StringBuffer sb = new StringBuffer();for(int i=0; i<LOOP_COUNT; i++){sb.append("a");}System.out.println("StringBuffer耗时: " + (System.currentTimeMillis()-start) + "ms");}public static void main(String[] args) {stringTest(); // 约4500msbuilderTest(); // 约5msbufferTest(); // 约10ms}
}
2. 内存占用分析
// 使用jvisualvm观察内存变化
public class MemoryDemo {public static void main(String[] args) throws InterruptedException {System.out.println("开始测试...");Thread.sleep(10000); // 等待连接VisualVM// String会产生大量中间对象String s = "";for(int i=0; i<100000; i++){s += i;}// StringBuilder只创建一个对象StringBuilder sb = new StringBuilder();for(int i=0; i<100000; i++){sb.append(i);}Thread.sleep(10000); // 观察内存变化}
}
四、字符串最佳实践
1. 选择策略
- String:少量操作、字符串常量、作为方法参数
- StringBuilder:单线程环境下大量字符串操作
- StringBuffer:多线程环境下大量字符串操作
2. 优化技巧
// 不好的写法
String result = "";
for(String str : stringList) {result += str; // 每次循环创建新String对象
}// 好的写法
StringBuilder builder = new StringBuilder();
for(String str : stringList) {builder.append(str);
}
String result = builder.toString();
3. 字符串常量池优化
// 推荐写法(利用字符串池)
String s1 = "Hello";
String s2 = "Hello"; // 复用s1对象// 不推荐写法(创建多余对象)
String s3 = new String("Hello"); // 强制创建新对象
五、扩展知识
1. 字符串压缩(Java 9+)
Java 9后String底层改用byte[]
存储,并添加了编码标志字段:
// 查看字符串编码方式
String str = "你好Java";
Field field = String.class.getDeclaredField("coder");
field.setAccessible(true);
byte coder = (byte) field.get(str);
System.out.println(coder); // 0表示Latin-1,1表示UTF-16
2. 字符串拼接底层优化
// Java编译器会自动优化为StringBuilder
String s = "a" + "b" + "c";
// 编译后等价于:
String s = new StringBuilder().append("a").append("b").append("c").toString();
3. 正则表达式应用
// 验证邮箱格式
String email = "test@example.com";
String regex = "^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$";
boolean isValid = email.matches(regex);// 提取数字
String text = "订单123金额456";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(text);
while(matcher.find()) {System.out.println("找到数字: " + matcher.group());
}
4. 字符串格式化
// 传统方式
String info1 = String.format("姓名: %s, 年龄: %d", "张三", 25);// Java 15+文本块
String json = """{"name": "%s","age": %d}""".formatted("李四", 30);
六、高级应用案例
1. 实现一个简单的模板引擎
public class TemplateEngine {private final String template;public TemplateEngine(String template) {this.template = template;}public String render(Map<String, Object> params) {StringBuilder result = new StringBuilder(template);for(Map.Entry<String, Object> entry : params.entrySet()) {String key = "${" + entry.getKey() + "}";String value = entry.getValue().toString();int index;while((index = result.indexOf(key)) != -1) {result.replace(index, index + key.length(), value);}}return result.toString();}public static void main(String[] args) {String template = "欢迎您,${user}!今天是${day}。";Map<String, Object> params = new HashMap<>();params.put("user", "王五");params.put("day", "2023-05-20");TemplateEngine engine = new TemplateEngine(template);System.out.println(engine.render(params));}
}
2. 字符串相似度比较
public class StringSimilarity {// 计算Levenshtein距离public static int levenshteinDistance(String a, String b) {int[][] dp = new int[a.length()+1][b.length()+1];for(int i=0; i<=a.length(); i++) dp[i][0] = i;for(int j=0; j<=b.length(); j++) dp[0][j] = j;for(int i=1; i<=a.length(); i++) {for(int j=1; j<=b.length(); j++) {int cost = (a.charAt(i-1) == b.charAt(j-1)) ? 0 : 1;dp[i][j] = Math.min(Math.min(dp[i-1][j]+1, dp[i][j-1]+1),dp[i-1][j-1]+cost);}}return dp[a.length()][b.length()];}// 计算相似度百分比public static double similarity(String a, String b) {int maxLen = Math.max(a.length(), b.length());if(maxLen == 0) return 1.0;return (1 - (double)levenshteinDistance(a,b)/maxLen) * 100;}public static void main(String[] args) {String s1 = "kitten";String s2 = "sitting";System.out.printf("相似度: %.2f%%", similarity(s1, s2));}
}
七、常见面试题解析
1. String为什么设计为不可变?
- 安全性:作为参数传递时不会被意外修改
- 线程安全:无需同步即可在多线程中使用
- 缓存哈希:String常用作HashMap的key,hashCode可缓存
- 字符串池:实现字符串常量池的基础
2. String s = new String(“xyz”)创建了几个对象?
- 如果"xyz"不在字符串池中:2个(字符串池中1个,堆中1个)
- 如果"xyz"已在字符串池中:1个(只在堆中创建新对象)
3. 如何高效拼接字符串数组?
// 使用StringJoiner(Java 8+)
StringJoiner sj = new StringJoiner(", ", "[", "]");
for(String str : array) {sj.add(str);
}
String result = sj.toString();// 或者直接使用String.join()
String result = String.join(", ", array);
4. 如何实现字符串反转?
// 方法1:使用StringBuilder
new StringBuilder(str).reverse().toString();// 方法2:字符数组交换
char[] chars = str.toCharArray();
for(int i=0, j=chars.length-1; i<j; i++,j--) {char temp = chars[i];chars[i] = chars[j];chars[j] = temp;
}
new String(chars);
八、总结与最佳实践
1. 关键点回顾
- String是不可变对象,适合少量操作和作为常量
- StringBuilder是可变、非线程安全的字符串操作类
- StringBuffer是线程安全版本的StringBuilder
- 大量字符串操作时应避免直接使用String
2. 性能优化建议
- 预分配StringBuilder容量:
new StringBuilder(initialCapacity)
- 避免在循环中使用
+
拼接字符串 - 使用
String.join()
替代手动拼接分隔字符串 - 考虑使用
CharSequence
接口作为方法参数类型
通过深入理解Java字符串处理机制,开发者可以编写出更高效、更健壮的字符串处理代码,这对日常开发中的文本处理、数据格式化和系统间通信等场景至关重要。