我有一个大约130MB的大文件,每行包含10个A字符,而在第10个“A”字符的末尾是\ t,我想提取这个文本文件,然后将所有A改为B。任何人都可以帮助它的代码片段吗?
这是我到现在所写的
USE DATABASE imodelanalytics;
@searchlog =
EXTRACT characters string
FROM "/iModelAnalytics/Samples/Data/dummy.txt"
USING Extractors.Text(delimiter: '\t', skipFirstNRows: 1);
@modify =
SELECT characters AS line
FROM @searchlog;
OUTPUT @modify
TO "/iModelAnalytics/Samples/Data/B.txt"
USING Outputters.Text();
我是新手,所以任何建议都会有所帮助!谢谢
假设所有的字段都是AAAAAAAAAA
然后你可以写:
@modify = SELECT "BBBBBBBBBB" AS characters FROM @searchlog;
如果只有一些是A
s,那么你会在SELECT
条款中做到:
@modify =
SELECT (characters == "AAAAAAAAAA" ? "BBBBBBBBBB" : characters) AS characters
FROM @searchlog;
如果AAAAAAAAAA
周围还有其他字符,那么您将使用更多的C#字符串函数来查找它们并以类似的模式替换它们。