在R
中处理字符串,stringr
包是最合适的包之一。
stringr
包中大多数函数接受2
个参数:要处理的字符串和正则表达式。
在大多数类型中,数据都是以文本编码的,即使有时候表示的是数字。因此学习对文本的操作是有必要的。R
提供了一些用于处理文本的内置工具,并且R
为文本分析提供了丰富的软件包生态系统。 首先,让我们学习一些基本的文本操作功能。
当我们处理一个新的数据集的时候,第一件事就是要对数据做一个了解。数据的格式是什么?数据的维度是多少?变量名是什么? 变量如何存储? 是否缺少数据? 数据中是否有任何缺陷?