第七届中国R语言会议杭州A会场演讲摘
时间 演讲嘉宾 嘉宾简介 主题 1:30 – 2:15 林祯舜 先锋信息科技/辰智咨询·数据科学家 R-web-大型多人在线数据分析协作平台 林祯舜博士是数据科学及营销科学方面的专家,毕业于人民大学统计学院并获得博士学位,在企业界,目前担任信息技术咨询公司的总经理,在学术界,目前是兰州商学院及吉林大学的兼职教授。 林博士学术领域的研究方向包括数据挖掘,机器学习,统计计算,网站效果测量与点击流数据分析。林博士的学术论文是关于互联网点击流的模型应用,这个模型是第一个应用在互联网媒体规划的基础模型,主要的贡献是打破互联网媒体规划和传统电视媒体规划使用相同模型的迷思,对互联网媒体规划的理论与应用找出一个突破口,目前全球互联网监测公司所使用的媒体规划模型,都是在林博士发表的论文基础上加以改进并产品化。这篇论文在年五月被美国网站分析协会(WebAnalyticsassociation)选为网站分析领域最需要阅读的14篇论文之一。国际顶尖广告研究期刊,广告研究学报(JournalofAdvertisingResearch)在创刊50周年的特刊上,针对互动网络的专文中,特别提到林博士论文在互动媒体规划方面的贡献,这是该领域被提到的四篇文章之一。林博士相关的学术研究论文发表在JournalofAdvertising(JA),JournaloftheAmericanSocietyforInformationScienceandTechnology(JASIST),InformationResearch,营销科学学报等期刊。 如果你是有经验的数据分析人员(或者数据科学家、数据挖掘工程师),你会发现要将一个数据进行分析并得到有洞察力的建议,这是一个知识发现的过程,这个过程中有三个重要的组成部分:数据、工具、人,数据在工具中经由人的探索及验证的过程逐渐积累形成知识,这个过程在未来会经由数据的交叉复用、分析方法(或算法)的镶嵌以及分析人员的协作与交流而加快知识的积累与生产,因此工具(或平台)的协作及弹性就越来越重要,这个报告要介绍第一个由华人统计学家基于R语言研发的数据分析云平台,阐述这个协作平台的设计理念及未来的愿景,希望这个平台在未来能让更多人能学习数据分析,理解分析思维,为培养未来的数据科学人才贡献一份心力。 2:20 – 3:05 林倩莹 SupStat数据科学家 基于R语言的电信用户数据挖掘应用 年我们移动通信用户总数超过10亿大关,而预计今年用户总数将会增加至20亿。如此庞大的用户量必然产生了巨大的数量。作为数据挖掘应用的重点行业,电信业如何利用这个庞大的原始数据,针对不同的客户采取不同的营销策略,从而为公司增加收益呢? 对于电信公司来说,用户新增入网之后,将会经过三个阶段,分别是新增入网时的成本投入阶段,之后到成熟稳定的价值贡献阶段,最后用户就会逐渐衰退流失,为零负收益阶段。显然,用户在稳定期时收益贡献率最高,那如何判别新增入网的用户之后是否会成为这个时期的稳定用户呢。本报告通过观察,先定义稳定用户为在网时长24个月以上用户,作为用户的稳定性标识,从万数据中抽取1%为样本,筛选出25个相关指标,利用随机森林算法建立了用户稳定性模型来实现对用户初入网3个月的短期行为的分析,以此预测该用户是否能成为稳定用户的目标,从而锁定非稳定用户作为营销对象。此外,针对用户的不同行为特征,本报告利用Kmeans聚类分析将用户纵向划分为六个不同的群体,分别是优质高端群、贵中求惠群、繁忙潜力群、融合捆绑群、消极使用群和套餐快销群。对应不同群体的特征,公司便能做出针对性的营销策略,增加不同群体中稳定用户的数量,提高各群体的收益贡献。经过评估,稳定性模型的准确率达90%以上,说明模型效果非常好,具有实际可操作性。 3:10 – 3:55 王勇 天猫技术部,搜索研发专家 LearningToRankinTmallSearch 在搜索引擎服务中,对返回结果的排序是非常重要的一个环节。早起的排序规则通常是基于对业务的了解和不断尝试而手动定制的。随着机器学习领域的不断发展,最近几年排序学习(LearningtoRank)越来越受人北京哪治白癜风北京市中科医院好不好 |
转载请注明地址:http://www.jinsihouz.com/hzxpyh/712.html
- 上一篇文章: 学生考级2017年7月杭州潮声播语言艺术
- 下一篇文章: 杭州竹君作文天声口才语言艺术表演班迎新