本文使用第三方stringr库,用于处理R的字符串。
str_c()
:字符串拼接,默认拼接符为空字符串,并自动删除NULL
输入str_length()
:字符串长度str_sub()
:截取子字符串,支持类python的负数选取模式str_trim()
:消除字符串两侧的空白str_detect()
:是否包含正则表达式的模式str_subset()
:返回包含正则表达式模式的子集,即str_detect()
为TRUE
的子集str_locate()
:返回第一个满足正则表达式模式的子串的起始位置和结束位置,返回类型为data framestr_locate_all()
:返回所有满足正则表达式模式的子串的起始位置和结束位置,返回类型为liststr_extract()
:抽出第一个符合正则表达式模式的具体内容,返回类型为vectorstr_extract_all()
:抽出所有符合正则表达式模式的具体内容,返回类型为liststr_match()
:比str_extract()
功能更复杂,除了返回完整的匹配内容外,还会输出每个分组的具体内容str_match_all()
:比str_extract_all()
功能更复杂,除了返回完整的匹配内容外,还会输出每个分组的具体内容str_replace()
:将str_extract()
的内容替换为目标字符串str_replace_all()
:将str_extract_all()
的内容替换为目标字符串str_split()
:将字符串按照正则表示的pattern拆分为多个子串,返回类型为liststr_split_fixed()
:将字符串按照正则表示的pattern拆分为多个固定子串,不足部分用空字符串填补,返回类型为matrix