重庆小潘seo博客

当前位置:首页 > 重庆网站建设 >

重庆网站建设

【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技

时间:2016-08-08 02:05:20 作者:采集侠 来源:网络整理
周五BI飞起来,每周一个主题,一场跟数据有关的行业、工具、技术的交流盛宴,锁定在每周五晚20:30,不见不散! 未来几期的微信直播活动分享主题将包括 谈谈BI在生产企业的应用、数据科学家应用、SPSS数据挖掘、数据挖掘经典案例赏析 等,具体日期安排请关

你可以在一个目录中保存一个ui.R文件和server.R文件来创建一个Shiny应用,每一个应用都需要自己独特的存放位置,运行应用的方法是在函数runApp中置入目录名称。

春天在心里:全英文的这是

# 查看转换结果

问题9:有没有学r语言比较好的书籍或者论坛?

春天在心里:现在京东,当当都有。

关于这个函数的例子,大家可以查看帮助文档,里面有利用鸢尾花数据集进行演示,我们重点来讲讲哑变量处理这块,这方面的资料网上比较少。

# 对自身变量进行预测,并转换成data.frame格式

具体来说,R语言具有以下优势

Daniel-谢佳标:好的,那老师接下来给大家用一个案例讲讲rattle的用法。


接下来,让我们一起来学习下如何利用R语言做大数据的处理及建模。

shinydashboard扩展包为shiny框架提供了BI框架,一个dashboard由三部分组成:标题栏、侧边栏、主面板。通过install.packages(“shinydashboard”)完成安装。


了解了一些R语言的优点,接下来让我们一起来学习下如何安装R。

左下方的窗口是R控制台,被当作是标准的R控制台。

有多种抽样方法用于改变数据集中类的失衡,常用的有以下两种:

ok,接下来我们一起来学习Rattle的安装:

点击左下角“阅读原文”有更多干货分享!

问答社区和在线学院是国内最大的商业智能BI 和大数据领域的技术社区和在线学习平台,技术版块与在线课程已经覆盖 商业智能、数据分析、数据挖掘、大数据、数据仓库、Microsoft BI、Oracle BIEE、IBM Cognos、SAP BO、Kettle、Informatica、DataStage、Halo BI、QlikView、Tableau、Hadoop 等国外主流产品和技术。

问题8:R一般适合处理多少个G的数据?

可以给不熟悉R语言的人快速上手的机会


【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技

如下截图所示:

自由讨论

问题1:老师,游戏那本书,啥时可买到?

很多时候,我们作为数据分析师,自己做出来的东西如果叫开发同学做二次开发,开发周期长,且出来的东西跟需求又可能不一样。此时,就想先自己搭建一套完整的数据分析平台原型,进行数据交互及展示。所以,shiny包的出现可以很好地满足那些只会R语言,不会css、html这些前端技术的同学,可以快速搭建自己的web网页。

春天在心里:如果要做到类似excel中的高级动态表,有那种控件的,实现这样的功能需要什么包啊

runApp("D:/myapp")

customers<-data.frame(id=c(10,20,30,40,50),

线上活动:Friday BI Fly 每周五晚 20:30,技术和行业交流,30余个微信直播群互动交流。

R语言作为一种GNU项目,开放了全部源代码,用户可以免费下载使用和修改。



【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技

由于以上一些优点,使得R语言越来越受到学生和数据分析从业者的青睐。从每年的中国R语言大会的参会人员和规模就可以验证这一点,很多高校现在也开设了R语言相关的课程。

【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技

问题3:library(rattle) 出现错误,一直关不了这个错误,怎么解决?

【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技


library(shiny)

此时我们从截图中可以看到gender和mood变量是因子型变量。



【Friday BI Fly】2016年08月05日基于R语言的大数据处理与建模技

天善智能  是一个专注于商业智能BI、数据分析、数据挖掘和大数据技术的垂直社区平台。

2R语言的安装


与传统的数据挖掘工具SAS、SPSS和IBM SPSS Modeler等软件相比,R的缺点在于没有友好的操作菜单,这会使很多熟悉其他工具的用户起初会觉得很困难。

 


其基本框架如下截图所示:

运行完代码得到的结果如下:

哑变量(Dummy Variable)也叫虚拟变量,引入哑变量的目的是将不能够定量处理的变量量化,如性别、年龄、职业等。这种“量化”通常是通过引入“哑变量”来完成的。根据这些因素的属性类型,构建只取“0”或“1”的人工变量,通常称为哑变量。

Daniel-谢佳标:恩 就在shiny包里面。

R语言中有一个个专门进行哑变量处理的函数,它就是caret包中的dummyVars( )函数。其基本表达形式为:dummyVars(formula, data, sep = ".", levelsOnly = FALSE,  fullRank = FALSE, ...),其中,formula表示模型公式,data是需要处理的数据集。

大家晚上好,很高兴今晚继续跟大家分享R语言的一些知识。昨晚直播完,有学员反映没有R语言基础的听的一头雾水,今晚我们先来了解下R语言以及R语言的安装。