在java中,有多种方式可以一行一行地读取文本。以下是几种常用的方法:
1. 使用 bufferedreader + filereader
string str = "a\n" + "b\n" + "c";
// 方法1:从字符串读取
try (bufferedreader reader = new bufferedreader(new stringreader(str))) {
string line;
while ((line = reader.readline()) != null) {
system.out.println(line);
}
} catch (ioexception e) {
e.printstacktrace();
}
// 方法2:从文件读取
try (bufferedreader reader = new bufferedreader(new filereader("filename.txt"))) {
string line;
while ((line = reader.readline()) != null) {
system.out.println(line);
}
} catch (ioexception e) {
e.printstacktrace();
}
2. 使用 scanner
string str = "a\n" + "b\n" + "c";
// 从字符串读取
try (scanner scanner = new scanner(str)) {
while (scanner.hasnextline()) {
string line = scanner.nextline();
system.out.println(line);
}
}
// 从文件读取
try (scanner scanner = new scanner(new file("filename.txt"))) {
while (scanner.hasnextline()) {
string line = scanner.nextline();
system.out.println(line);
}
} catch (filenotfoundexception e) {
e.printstacktrace();
}
3. 使用 files.lines() (java 8+)
string str = "a\n" + "b\n" + "c";
// 从字符串读取(需要先写入临时文件)
try {
path tempfile = files.createtempfile("temp", ".txt");
files.write(tempfile, str.getbytes());
files.lines(tempfile).foreach(system.out::println);
// 清理临时文件
files.deleteifexists(tempfile);
} catch (ioexception e) {
e.printstacktrace();
}
// 从文件读取
try {
files.lines(paths.get("filename.txt")).foreach(system.out::println);
} catch (ioexception e) {
e.printstacktrace();
}
4. 使用 string 的 split() 方法(适用于字符串)
string str = "a\n" + "b\n" + "c";
string[] lines = str.split("\n");
for (string line : lines) {
system.out.println(line);
}
//处理空行
string[] lines = str.split("\\r?\\n|\\r");
list<string> nonemptylines = arrays.stream(lines)
.filter(line -> !line.trim().isempty())
.collect(collectors.tolist());
5. 使用 lines() 方法 (java 11+)
string str = "a\n" + "b\n" + "c"; // 从字符串读取 str.lines().foreach(system.out::println);
推荐方案
- 对于字符串:使用
str.lines()(java 11+) 或split("\n") - 对于文件:使用
files.lines()(java 8+) 或bufferedreader - 需要更多控制:使用
scanner
最简洁的方式是使用 java 11 的 lines() 方法:
string str = "a\n" + "b\n" + "c"; str.lines().foreach(system.out::println);
输出结果:
a
b
c
在 java 8 环境下,split("\n") 和 bufferedreader 各有优缺点,具体选择取决于使用场景:
性能对比
1.split("\n")- 适用于小文本
string str = "a\n" + "b\n" + "c";
string[] lines = str.split("\n");
for (string line : lines) {
system.out.println(line);
}
优点:
- 代码简洁,一行搞定
- 适合已知内容较小的字符串
- 可以直接得到数组,方便后续处理
缺点:
- 一次性加载所有内容到内存,大文本会占用大量内存
- 需要处理尾部的空行问题
2.bufferedreader- 适用于大文本或文件
string str = "a\n" + "b\n" + "c";
try (bufferedreader reader = new bufferedreader(new stringreader(str))) {
string line;
while ((line = reader.readline()) != null) {
system.out.println(line);
}
} catch (ioexception e) {
e.printstacktrace();
}
优点:
- 内存效率高,逐行读取,适合大文件
- 自动处理不同操作系统的换行符(
\n,\r\n,\r) - 统一的接口处理字符串和文件
缺点:
- 代码相对冗长
- 需要处理异常
推荐选择
场景 1:小文本,内容已知且不大
// 使用 split("\n")
string[] lines = str.split("\n");
arrays.stream(lines).foreach(system.out::println);
场景 2:大文本或需要处理文件
// 使用 bufferedreader
try (bufferedreader reader = new bufferedreader(new stringreader(str))) {
reader.lines().foreach(system.out::println); // java 8 stream api
} catch (ioexception e) {
e.printstacktrace();
}
场景 3:java 8 更优雅的写法
// 结合 bufferedreader 和 stream api
try (bufferedreader reader = new bufferedreader(new stringreader(str))) {
list<string> lines = reader.lines().collect(collectors.tolist());
lines.foreach(system.out::println);
} catch (ioexception e) {
e.printstacktrace();
}
实际建议
对于你的具体案例:
string str = "a\n" + "b\n" + "c";
// 如果确定文本很小,用 split 更简洁
string[] lines = str.split("\n");
for (string line : lines) {
system.out.println(line);
}
// 如果要养成好习惯或处理可能的大文本,用 bufferedreader
try (bufferedreader reader = new bufferedreader(new stringreader(str))) {
reader.lines().foreach(system.out::println);
} catch (ioexception e) {
e.printstacktrace();
}
总结: 对于你当前的小例子,split("\n") 完全足够且更简洁。但如果考虑到代码的可扩展性和健壮性,bufferedreader 是更好的选择。
scanner 相比 bufferedreader 提供了更丰富的文本解析功能,主要在数据类型解析和分隔符控制方面有优势。
scanner 的额外控制能力
1. 数据类型自动解析
string data = "john 25 78.5 true\nalice 30 65.2 false";
try (scanner scanner = new scanner(data)) {
while (scanner.hasnext()) {
if (scanner.hasnextint()) {
int age = scanner.nextint();
system.out.println("年龄: " + age);
} else if (scanner.hasnextdouble()) {
double weight = scanner.nextdouble();
system.out.println("体重: " + weight);
} else if (scanner.hasnextboolean()) {
boolean status = scanner.nextboolean();
system.out.println("状态: " + status);
} else {
string name = scanner.next();
system.out.println("姓名: " + name);
}
}
}
2. 灵活的分隔符控制
string csvdata = "a,b,c\n1,2,3\nx,y,z";
// 使用逗号作为分隔符
try (scanner scanner = new scanner(csvdata)) {
scanner.usedelimiter(",|\n"); // 逗号或换行符作为分隔符
while (scanner.hasnext()) {
string token = scanner.next();
system.out.println("token: " + token);
}
}
3. 模式匹配(正则表达式)
string text = "价格: $25.50, 重量: 1.5kg, 日期: 2023-01-01";
try (scanner scanner = new scanner(text)) {
// 查找价格模式
string pricepattern = "\\$\\d+\\.\\d+";
while (scanner.hasnext(pricepattern)) {
string price = scanner.next(pricepattern);
system.out.println("找到价格: " + price);
}
// 重置scanner查找其他模式
scanner = new scanner(text);
string datepattern = "\\d{4}-\\d{2}-\\d{2}";
if (scanner.hasnext(datepattern)) {
string date = scanner.next(datepattern);
system.out.println("找到日期: " + date);
}
}
4. 区域设置和数字格式
string europeandata = "1.234,56 2.345,67"; // 欧洲数字格式
try (scanner scanner = new scanner(europeandata)) {
scanner.uselocale(locale.germany); // 使用德国区域设置
while (scanner.hasnextdouble()) {
double number = scanner.nextdouble();
system.out.println("数字: " + number);
}
}
5. 精确的输入验证
string input = "123 456 abc 789";
try (scanner scanner = new scanner(input)) {
// 精确控制输入类型
if (scanner.hasnextint()) {
int first = scanner.nextint(); // 123
}
if (scanner.hasnextint()) {
int second = scanner.nextint(); // 456
}
if (scanner.hasnext("abc")) {
string text = scanner.next(); // abc
}
if (scanner.hasnextint()) {
int third = scanner.nextint(); // 789
}
}
与 bufferedreader 的对比
| 特性 | scanner | bufferedreader |
|---|---|---|
| 数据类型解析 | ✅ 自动解析 int, double, boolean 等 | ❌ 只能返回 string |
| 分隔符控制 | ✅ 高度可配置,支持正则表达式 | ❌ 固定按行读取 |
| 模式匹配 | ✅ 支持正则表达式模式匹配 | ❌ 不支持 |
| 区域设置 | ✅ 支持不同地区的数字格式 | ❌ 不支持 |
| 性能 | ❌ 相对较慢 | ✅ 更快 |
| 内存使用 | ❌ 缓冲区较小 | ✅ 缓冲区可配置 |
| 简单行读取 | ✅ 支持但较慢 | ✅ 专门优化 |
使用场景建议
使用 scanner 的场景
// 解析结构化数据
string studentdata = "张三 20 计算机 85.5";
try (scanner scanner = new scanner(studentdata)) {
string name = scanner.next();
int age = scanner.nextint();
string major = scanner.next();
double score = scanner.nextdouble();
}
// 解析csv数据
string csv = "1,苹果,5.5\n2,香蕉,3.2";
try (scanner scanner = new scanner(csv)) {
scanner.usedelimiter(",|\n");
while (scanner.hasnext()) {
// 按字段解析
}
}
使用 bufferedreader 的场景
// 简单逐行读取大文件
try (bufferedreader reader = new bufferedreader(new filereader("largefile.txt"))) {
string line;
while ((line = reader.readline()) != null) {
// 处理每一行
}
}
// 性能要求高的场景
try (bufferedreader reader = new bufferedreader(new filereader("file.txt"), 8192)) {
// 使用更大的缓冲区
}
什么时候该用 bufferedreader
只有当文本规模达到以下程度时才需要考虑:
- 行数:成千上万行
- 文件大小:几十mb以上
- 内存敏感:在移动设备或内存受限环境
总结
选择 scanner 当需要:
- 自动数据类型转换
- 复杂的分隔符逻辑
- 正则表达式模式匹配
- 解析结构化文本数据
选择 bufferedreader 当需要:
- 高性能的简单行读取
- 处理大文件
- 最小内存占用
- 简单的文本处理
对于你的原始需求(一行一行读取文本),如果只是简单读取,bufferedreader 性能更好;如果需要解析每行的数据内容,scanner 更合适。
以上就是java实现一行一行读取文本的多种方法详解的详细内容,更多关于java按行读取文本的资料请关注代码网其它相关文章!
发表评论