【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技
你可以在一个目录中保存一个ui.R文件和server.R文件来创建一个Shiny应用,每一个应用都需要自己独特的存放位置,运行应用的方法是在函数runApp中置入目录名称。
春天在心里:全英文的这是
# 查看转换结果
问题9:有没有学r语言比较好的书籍或者论坛?
春天在心里:现在京东,当当都有。
关于这个函数的例子,大家可以查看帮助文档,里面有利用鸢尾花数据集进行演示,我们重点来讲讲哑变量处理这块,这方面的资料网上比较少。
# 对自身变量进行预测,并转换成data.frame格式具体来说,R语言具有以下优势:
Daniel-谢佳标:好的,那老师接下来给大家用一个案例讲讲rattle的用法。 接下来,让我们一起来学习下如何利用R语言做大数据的处理及建模。 shinydashboard扩展包为shiny框架提供了BI框架,一个dashboard由三部分组成:标题栏、侧边栏、主面板。通过install.packages(“shinydashboard”)完成安装。
了解了一些R语言的优点,接下来让我们一起来学习下如何安装R。
左下方的窗口是R控制台,被当作是标准的R控制台。
有多种抽样方法用于改变数据集中类的失衡,常用的有以下两种:
ok,接下来我们一起来学习Rattle的安装:
点击左下角“阅读原文”有更多干货分享!
问答社区和在线学院是国内最大的商业智能BI 和大数据领域的技术社区和在线学习平台,技术版块与在线课程已经覆盖 商业智能、数据分析、数据挖掘、大数据、数据仓库、Microsoft BI、Oracle BIEE、IBM Cognos、SAP BO、Kettle、Informatica、DataStage、Halo BI、QlikView、Tableau、Hadoop 等国外主流产品和技术。
问题8:R一般适合处理多少个G的数据?
可以给不熟悉R语言的人快速上手的机会
如下截图所示:
自由讨论问题1:老师,游戏那本书,啥时可买到? 很多时候,我们作为数据分析师,自己做出来的东西如果叫开发同学做二次开发,开发周期长,且出来的东西跟需求又可能不一样。此时,就想先自己搭建一套完整的数据分析平台原型,进行数据交互及展示。所以,shiny包的出现可以很好地满足那些只会R语言,不会css、html这些前端技术的同学,可以快速搭建自己的web网页。 春天在心里:如果要做到类似excel中的高级动态表,有那种控件的,实现这样的功能需要什么包啊
线上活动:Friday BI Fly 每周五晚 20:30,技术和行业交流,30余个微信直播群互动交流。
R语言作为一种GNU项目,开放了全部源代码,用户可以免费下载使用和修改。
由于以上一些优点,使得R语言越来越受到学生和数据分析从业者的青睐。从每年的中国R语言大会的参会人员和规模就可以验证这一点,很多高校现在也开设了R语言相关的课程。
问题3:library(rattle) 出现错误,一直关不了这个错误,怎么解决?
library(shiny) 此时我们从截图中可以看到gender和mood变量是因子型变量。
天善智能 是一个专注于商业智能BI、数据分析、数据挖掘和大数据技术的垂直社区平台。 与传统的数据挖掘工具SAS、SPSS和IBM SPSS Modeler等软件相比,R的缺点在于没有友好的操作菜单,这会使很多熟悉其他工具的用户起初会觉得很困难。
其基本框架如下截图所示:
运行完代码得到的结果如下:
哑变量(Dummy Variable)也叫虚拟变量,引入哑变量的目的是将不能够定量处理的变量量化,如性别、年龄、职业等。这种“量化”通常是通过引入“哑变量”来完成的。根据这些因素的属性类型,构建只取“0”或“1”的人工变量,通常称为哑变量。
Daniel-谢佳标:恩 就在shiny包里面。 R语言中有一个个专门进行哑变量处理的函数,它就是caret包中的dummyVars( )函数。其基本表达形式为:dummyVars(formula, data, sep = ".", levelsOnly = FALSE, fullRank = FALSE, ...),其中,formula表示模型公式,data是需要处理的数据集。 大家晚上好,很高兴今晚继续跟大家分享R语言的一些知识。昨晚直播完,有学员反映没有R语言基础的听的一头雾水,今晚我们先来了解下R语言以及R语言的安装。