1 回答

TA貢獻(xiàn)2003條經(jīng)驗(yàn) 獲得超2個(gè)贊
String fixedSizetoXML(String extractedTestFromPDF) {
String[] lines = extractedTestFromPDF.split("\\R");
Pattern pattern = Pattern.compile("^\\s*(\\S.{20})\\s\\s+([-\\d,\\.]+)\\s+.*$");
// (--------) (-----------)
return "<?xml verion="1.0">\n<Xml>\n"
+ Stream.of(lines)
.map(pattern::matcher)
.filter(m::find)
.map(m -> String.format("<Data>\n"
+ " <Allowance>%s</Allowance>\n"
+ " <Allowance_Amount>%s</Allowance_Amount>\n"
+ "</Data>\n",
m.group(1).trim(), m.group(2)))
.collect(Collectors.joining(""))
+ "<Xml>\n";
}
我冒昧地添加了一條 XML 預(yù)處理指令<?xml ...>,并為清楚起見更改xml為Xml.
這些是具有固定長(zhǎng)度字段的記錄。計(jì)算位置并不完全安全,看到制表符\t并考慮特殊字符:é可能是一個(gè)字符,但也e加上一個(gè)特殊的零寬度′,我改用正則表達(dá)式模式。數(shù)量前至少需要兩個(gè)空白字符。
Java 7
String fixedSizetoXML(String extractedTestFromPDF) {
String[] lines = extractedTestFromPDF.split("\\R");
Pattern pattern = Pattern.compile("^\\s*(\\S.{20})\\s\\s+([-\\d,\\.]+)\\s+.*$");
// (--------) (-----------)
StringBuilder sb = new StringBuilder(lines.length * 64);
sb.append("<?xml verion="1.0">\n<Xml>\n");
for (String line : lines) {
Matcher m = pattern.matcher(line);
if (m.find()) {
String data = String.format("<Data>\n"
+ " <Allowance>%s</Allowance>\n"
+ " <Allowance_Amount>%s</Allowance_Amount>\n"
+ "</Data>\n",
m.group(1).trim(), m.group(2));
sb.append(data);
}
}
sb.append("<Xml>\n");
return sb.toString();
}
添加回答
舉報(bào)