Home Data Science Big Data Data Analytics Data Visualization Statistics Database Data Analysis Open Data Data Analytics Visualization Web Scraping Predictive Analytics Data Engineering Linear Regression Data Scientist R Programming Data Cleaning

关于 R Programming 的优秀文章

玩免费代码训练营数据Pt 2

深入数据 大家好! 很高兴您回来了。 今天我们要完成这个项目。 我们正在分析2016年Free Code Camp调查中对数据科学家和数据工程师职位感兴趣的人员,以建立客户角色。 我们通过了解参与者的年龄范围来启动EDA流程。 让我们弄清楚有多少人去过技术训练营。 表(DSInt_df $ AttendedBootcamp) 0 1 622 13 不要为此感到震惊。 在R中,1被认为是True,0被认为是False。…

R的基础知识-第1部分(第2365号帖子)

你好 它将花费一些篇幅来介绍R编程的基本概念。 RStudio简介 变量分配 向量 矩阵 因素 数据框 清单 RStudio简介 这是RStudio 4窗格布局的屏幕截图。 窗格A:此窗格可用于编写R脚本。 也可以打开多个选项卡以同时处理不同的脚本。 此窗格还用于查看数据框(数据框将在本博客的后面部分进行说明)。 窗格B:此窗格的主要用途是列出所有变量和对象。 还可以通过扩展树结构来查看它们的简短摘要。 C部分:这是控制台。…

R中的可视化分析(第2部分):使用数据可视化从数据中获取洞察力。

背景: 在上一篇文章中,我们使用了Old Faithful Geyser -faithful-数据集对一维和二维数值数据进行了可视化分析。 在R小型项目中的Visual Analysis的延续中,我们将对变量关系执行Visual Analysis。 使用的数据集是MTCARS和MPG数据集。 系好安全带! 加载两个数据集。 数据(mtcars) 数据(mpg) 加载GGPlot2库。 库(ggplot2) 我们安装GGally软件包,该软件包包含ggplot2的扩展名,可简化创建某些图的过程。 有关此软件包的更多信息,请参见此处。 install.packages('GGally')…

RFM Skorlama — VeriyiHazırlama

BuyazımızdaRFMSkorlamanınuygulamasınageçiyoruz。 Kullanacağımızveri CDsatışverisi olacak。 布鲁斯·哈迪(Bruce Hardie):数据集 编辑描述 www.brucehardie.com Adresine giderek CDNOW数据集(第1/10个样本)dosyasınıindirmeniz gerekiyor。 SonrasıiçinR yeterli olacak! Veriyi RStudio’yayüklemekiçin getwd()…

主成分分析在稀疏n维矩阵中的应用

问题陈述:主成分分析不适用于稀疏矩阵。 因此,应考虑减少成本和内存使用量的方法。 稀疏矩阵是比非零值分量包含更多数量的零值分量的矩阵。 这种矩阵形式很少有非零值。 方法 : 让我们以由n维向量组成的数据X为例。 矩阵X分解为较小矩阵的乘积,以使平方重建误差最小。 X≈AS 可用于稀疏PCA的不同算法是: ·特征值分解 ·EM算法 ·牛顿法 ·GRQI-(广义瑞利商) ·sSVD —如果我们推广到任意矩形(mxn)矩阵,则也称为SVD(稀疏奇异向量分解) 特征值分解 :此方法计算协方差矩阵及其特征向量…

使用R进行数据分析和可视化

Summary()是最重要的功能之一,有助于汇总数据集中的每个属性。 根据变量的类型,它提供了一组描述性统计信息: 如果是数字变量->给出均值,中位数,众数,范围和四分位数。 如果是因子变量->给出一个带有频率的表格。 如果是因子+数字变量->给出缺失值的数量。 如果是字符变量->给出长度和类。 如果我们只需要数据集中特定变量的汇总统计信息,则可以使用 summary(datasetName $ VariableName)-> summary(titanic $ Pclass) as.factor(dataset $ ColumnName) 有时,数据集中的某些变量是因素,但可能会被解释为数字。 例如,Pclass(Passenger…

Lanzamiento! Libro Vivo de Ciencia de Datos📗(开源)

最终决断的数据科学现场电子书 ! El libro se abre sin barrerasidiomáticasante las personas de habla-hispana con ganas de aprender 👨‍🎓👩‍🎓。 修订版,英文版和通用版。…

DPLYR和管道!

欢迎R爱好者,本文是上一篇文章DPLYR简介的后续文章。 在本文中,我们将了解有关dplyr和管道运算符的更多信息。 在上一篇文章中,我们学习了dplyr的一些功能。 现在,我们将详细了解dplyr的功能。 此外,我们还将从使用magrittr包中了解Pipe操作器。 在本文中,我们将使用印度国家证券交易所数据集,您可以从kaggle下载。 在[1]中: #Dplyr和管道 在[2]中: 数据= read.csv(file.choose(),标题= T) 在[3]中: dim(data) #数据集的尺寸 出[3]: 1. 846404…

玩数据帧(Post#4/365)

你好 提前道歉。 这则帖子迟到了3天。 我将尽力弥补这一点。 曾经使用电子表格进行任何数据分析的任何人都必须注意到您在电子表格中的巨大利益。 您可以查看和检查前面的整个数据集。 此外,您可以轻松地添加列/行,修改任何条目,过滤一些条目等。这些任务对于数据分析至关重要,而学习如何在R中执行此类任务至关重要。 我将在这篇文章中使用电子表格。 我将在R中的电子表格中复制最常用的操作。其中包括以下内容。 在R中导入数据集 子集行和列 升序或降序 添加/更新/删除数据集中的列或值 观察数计数 使用前五行 检查数据结构 查找 R包含几个预先加载的数据集。…

Os melhores链接到#1

Os melhores将在2019年11月17日的11月17日链接! Eaípessoal,tudo bem? 保罗·瓦斯康塞洛斯(Paulo Vasconcellos)深信不疑,而数据黑客组织的博客也链接到了《博客日报》。 数据科学和数据科学方面的意见已经完成。 Desse Modo,caso queiram acompanhar和sériecompleta(超级人文科学竞赛)和séclicar aqui。 数据黑客和trazer专有权之间的联系的思想联系方式,全称是Portuguêse com algunscomentários,quandocabíveis。 塞里·科莫·塞西里奥·普雷西罗,塞拉·普埃科·梅斯的“ verboso”做过代理,并在塞罗里·福斯图里·科塞恩·桑多纳姆做了封口。 乌玛乌尔蒂玛机会…

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • …
  • 11
  • Next

Supreme Topics

卡桑德拉·雷兹的奇案

在Apache Spark SQL中使用JDBC的提示

带有完整代码和解释的Twitter情绪分析(朴素贝叶斯)

梦幻英超联赛分析

客户审查分析的多个层次

每个数据分析师应下载六本免费书籍

这种抗癌治疗延长生命—五个好主意:2017年4月5日

大数据适合您吗?

如何分享一个真正好的电池秘密

银行业发展

RadarScope:现在已添加特殊海洋警告

1801年电子报:Lana Del Rey,东京旅行,太空实验室撞向地球

不知道种族成为种族主义者时

返回数据科学

提出问题后,如何建立数据分析?

  • Copyright © e科技 - All Rights Reserved.
  • Topics
  • Terms
  • Privacy Policy