使用R进行数据分析和可视化
Summary()是最重要的功能之一,有助于汇总数据集中的每个属性。 根据变量的类型,它提供了一组描述性统计信息: 如果是数字变量->给出均值,中位数,众数,范围和四分位数。 如果是因子变量->给出一个带有频率的表格。 如果是因子+数字变量->给出缺失值的数量。 如果是字符变量->给出长度和类。 如果我们只需要数据集中特定变量的汇总统计信息,则可以使用 summary(datasetName $ VariableName)-> summary(titanic $ Pclass) as.factor(dataset $ ColumnName) 有时,数据集中的某些变量是因素,但可能会被解释为数字。 例如,Pclass(Passenger…