




 
如何从数据中挖掘价值?一是要锻炼数据思维;二是需要选择一个便利快捷的工具。
R语言在数据分析方面有着灵活、高效的优势。本书以R语言为基础,深度讲解从数据思维到实战的全过程。在章节组织上,本书从R语言简介及优势入手,再到数据读取、清洗、描述、建模等数据分析的各个环节,由浅入深逐个讲解,是一本实务分析中的“R语言指南”。同时,书中采用大量实际案例辅以说明,既有助于上手分析,也可用于教学使用。
本书所有代码、数据可在狗熊会官网(http://www.xiong99.com.cn/create.php)免费下载。同时,关注狗熊会微信公众号,可获取更多扩展资源。
作者简介:
范超 经济学博士,University of Notre Dame 联合培养博士,浙江工商大学统计学院讲师,中国现场统计研究会经济与金融统计分会理事,主要研究领域为经济社会统计,包括多指标综合评价,数字经济,互联网统计等。先后主持国家社会科学基金项目、“浙江省哲学社会科学领军人才培育专项课题”子课题、浙江省统计局课题等,曾参与国家社科重大项目2项,省部级课题,横向课题7项,曾在 Multivariate Behavioral Research、《福建论坛(人文社会科学版)》、《现代管理科学》等 SSCI,CSSCI 杂志上发表论文7篇,参与编写《互联网统计》《经济社会公共数据空间标准化与空间统计应用研究》等著作。 朱雪宁 复旦大学大数据学院副教授,博士生导师。2017年获得北京大学光华管理学院商务统计与经济计量系博士学位,2017—2018在美国宾夕... 范超 经济学博士,University of Notre Dame 联合培养博士,浙江工商大学统计学院讲师,中国现场统计研究会经济与金融统计分会理事,主要研究领域为经济社会统计,包括多指标综合评价,数字经济,互联网统计等。先后主持国家社会科学基金项目、“浙江省哲学社会科学领军人才培育专项课题”子课题、浙江省统计局课题等,曾参与国家社科重大项目2项,省部级课题,横向课题7项,曾在 Multivariate Behavioral Research、《福建论坛(人文社会科学版)》、《现代管理科学》等 SSCI,CSSCI 杂志上发表论文7篇,参与编写《互联网统计》《经济社会公共数据空间标准化与空间统计应用研究》等著作。 朱雪宁 复旦大学大数据学院副教授,博士生导师。2017年获得北京大学光华管理学院商务统计与经济计量系博士学位,2017—2018在美国宾夕法尼亚州立大学从事博士后研究工作。入选2019年度上海市青年科技英才扬帆计划,2022年获得国家自然科学基金优秀青年基金项目资助。主要研究领域为网络数据分析、空间计量模型、高维数据建模等,研究成果发表于 Journal of Econometrics、Journal of the American Statistical Association、Annals of Statistics、中国科学等国内外经济计量与统计学期刊。
目录:
第1章 初识R语言 1
1.1 初识R语言 1
1.2 安装R语言 10
1.3 获取R帮助文档 24
第2章 R语言数据操作 36
2.1 R中的数据类型 36
2.2 数据读入 85
第3章 R语言与统计分析 103
3.1 描述分析及可视化 103
3.2 统计检验 153
3.3 回归分析 161
3.4 代码规范与文档撰写 196
第4章 R语言与非结构化数据分析 211
4.1 文本分析 211
4.2 图像分析 226
第5章 R语言与机器学习 251
5.1 机器学习概述 251
5.2 数据预处理 260
5.3 模型训练与调参 270
5.4 模型训练与集成 276
第6章 R语言爬虫初介 284
6.1 HTML基础与R语言解析 284
6.2 XML与XPath表达式以及R爬虫应用 290
6.3 HTTP协议 296
6.4 AJAX与网页动态加载 303
6.5 正则表达式与字符串处理函数 308
6.6 R语言爬虫实战 315
点击下载