最新文章

用统计学来分析红楼梦后40回的作者
2018-07-17
“满纸荒唐言,一把辛酸泪。都云作者痴,谁解其中味?”——曹雪芹中国的四大名著,红楼梦有非常特别的位置。小时候喜欢《西游记》,觉得魑魅魍魉,何其神幻;再者喜欢《水浒传》,梁山好汉,快意江湖。但读的最多的却是红楼梦。中国有句古话说,少不读红楼,老不读三国。少时读红楼,觉得晦涩难懂;年纪大些再读,仍觉得扑朔迷离,意味无穷。红楼梦是一本包罗万象的小说,纵横诗书、绘画、音乐、饮食、服饰等多个领域,其文学价值不言而喻。
统计学 红楼梦 969 人学过
如何利用机器学习实现有噪声标签样本分类模型
2018-07-17
在工业生产活动中,有一类常见机器学习问题,就是如何基于有噪声样本标签训练模型,以进行故障检测和分类。先解释下什么是有噪声样本标签,它指的是训练模型用的样本标签并非完全准确,部分样本的标签有标错的情况。对于这个问题,为了便于大家理解,我们以一个最近成功实践的项目为例,以实例为大家讲述如何实现。
机器学习 1419 人学过
从9个方面来看数据隐私的保护
2018-07-10
不管对于个人还是企业来说,隐私数据都非常重要。法律监管的越严,企业越难获得个人隐私数据。而没有质量好的数据,企业给用户提供的服务质量就会下降。我们希望能在服务与隐私保护间找到一处平衡,即能享受贴心的服务又不用过于担心自己的隐私泄露,正如苹果公司的群体偏好分析。法律加强监管、技术助力隐私保护以及个人隐私保护防范意识的提高,未来数据企业发展会更为规范,期待企业能给我们推荐更多的惊喜。
数据隐私 610 人学过
机器学习与数据科学推荐书籍 20本
2018-07-06
推荐一下机器学习与数据科学推荐书籍,中文翻译国外作者,值得推荐。
机器学习 数据科学 662 人学过
是谁在监视我们的生活
2018-07-02
在App安装后,他能够获得大量授权,推断数据里的人群做什么工作、常去哪里、毕业于什么学校、有什么爱好、有没有结婚、有没有外遇、有没有房、有没有车、现在是外出度假还是在家待着,甚至通过读取银行通知短信,推测实际收入。
大数据 659 人学过
大数据来预测世界杯冠军
2018-06-29
几天前俄罗斯彼尔姆国立研究大学的大四学生制造的神经网络,预测德国队将在2018年世界杯中夺冠,而世界杯前三名将是德国队、巴西队和阿根廷队。据说,这项预测的准确度超过80%。我们现在知道实际情况已经站在了20%里面,不过我们到是可以看一下他们是怎么预测的。
ai 世界杯 584 人学过
不同年龄段的妈妈线上消费和行为观察
2018-06-27
背奶妈妈、职场妈妈、虎妈、丧偶式育儿妈妈、广场舞大妈、口嫌体正直的亲妈、游轮常驻vip妈妈……明明综艺里满屏的超人妈妈、网红圈刷屏的辣妈潮妈、娱乐圈盛产的93年靓妈,而反观现实生活,赐予妈妈的都是些又苦又累、又满腹嘲讽的头衔,难道这才是真相?还是以偏概全?
上网行文 840 人学过
2018智慧城市管理与服务国际大会(2018年7月11-13日 上海)
2018-06-27
当今世界,随着人工智能技术的成熟,城市管理正在步入“智慧”时代,人工智能作为智慧城市的关键核心,将迎来全新的发展机遇与挑战。在技术创新的不断驱动下,智慧城市管理也将迈向更高层级,人工智能、“互联网+”、5G通信等更多前沿技术将被引入智慧城市领域,新一代信息技术与现代城市深度融合,共同促进城市精细化管理,推动城市高效运转和可持续发展。
智慧城市 827 人学过
数据科学与机器学习面试指南
2018-06-27
跨入数据科学领域并不是一件简单的事,而如果你不具备数据科学方面的背景,实现这一目标更是难上加难(很可能这正是你的现状吧)。而你从其他同样想成为数据科学家的人们那里所听来的各种故事,说不定会使面试这件事更加令人望而生畏。
机器学习 数据科学 772 人学过
图解:个税起征点拟提至每月5000元,月薪万元能省多少钱?
2018-06-27
据@新华视点6月19日消息,备受关注的个人所得税法修正案草案19日提请十三届全国人大常委会第三次会议审议,草案将个税起征点由每月3500元提高至每月5000元(每年6万元)。除了起征点,关于个税我们还有哪些知识点需要关注?中国个税立法始于1980年,第五届全国人民代表大会通过了《中华人民共和国个人所得税法》,那时个税起征点定为800元。
个税 612 人学过
Uber人工智能来识别醉酒乘客
2018-06-20
近日公布的美国专利申请记录显示,Uber(优步,类似滴滴打车)申请了一个非常有意思的专利,即用人工智能来识别醉酒乘客。Uber申请的这项专利名为“PredictingUserStateUsingMachineLearning”,即“以机器学习预测用户状态”,由Uber的信任和安全团队提交。在专利描述中,Uber称他们将研发一个协调系统,该系统使用关于过去在Uber上的行程和行为数据来训练计算机预测提交行程请求的用户的状态
人工智能 uber 531 人学过
学Python 推荐的书
2018-06-16
2017年11月29日,自己曾在公众号内写过一篇《聊聊我的R语言学习路径和感受》的文章,受到了很多朋友的关注和赞扬,同时,也有其他公众号在帮忙转载。当然,也有很多朋友也给我留言,能不能聊聊关于Python的学习建议,时隔一个多月,今天抽空再来谈谈自己学习Python的路程吧。准确的说自己是从2014年的9月份开始接触Python的,那会由于工作需要,硬着头皮开始学习Python,不怕各位笑话,我的第一本Python启蒙书籍是《与孩子一起学编程》。这本书真的非常通俗易懂,从什�
python 763 人学过
“00后画像报告” 我们对他们的认识可能是错的
2018-06-16
5月4日,腾讯QQ携手中青报发布了《00后画像报告》,该报告以腾讯QQ7.83亿月活跃用户为基础,通过问卷调查和QQ平台大数据分析,对00后群体进行整体形象描述。这份报告一定程度上颠覆了我们对于00后的认知,数据表明这一代人远比我们想象的要积极乐观,近九成的00后都表现得相当积极正面。让我们来看看这份报告具体都谈了哪些内容吧:
00后画像 568 人学过
2018年5月网络综艺观众研究报告
2018-06-13
从《中国有嘻哈》、《这!就是街舞》、《偶像练习生》、《创造101》等先后成为现象级综艺,到“Freestyle”“Pickme”“C位出道”“菊外人”等流行词的爆火,动辄破亿次的播放量,昭示了网综已经进入了全民话题带流量的时代。各视频平台对网综的持续发力,开启了IP体系化运营和网综生态营销的新模式;网综节目的受众也由浅层互动到深度参与,发生了从观众到用户的变迁。强娱乐、重垂直、深互动、年轻态……
各种机器学习算法的优点和缺点分析
2018-06-12
使用最简单的算法,可以满足您的需求,并且只有在严格需要的情况下才用更复杂的算法。
机器学习 机器学习算法 783 人学过
如何使用ggplot2绘制公共债务地图
2018-06-09
在这个部分,我们将从维基百科上获取数据并使用ggplot2将它们绘制出来。
ggplot2 726 人学过
如何通过精细化运营打造增长引擎
2018-06-08
路盛华,现在在沪江负责运营和用户增长。为什么现在提「增长」的人这么多?我认为移动互联网的红利正在逐渐褪去,大家的竞争越来越激烈,导致大家增长乏力。以前一个APP放在市场上可能就会有很多自然流量,现在流量越来越贵,获取流量的难度和成本越来越高……
沪江 760 人学过
一名物理学家的 数据科学工作初体验
2018-06-08
作为一名物理学家,搞物理的都笃信这点:提出正确的问题,通过正确的推理,来寻求真理。事实上,提出正确的问题,无疑是重要的数据科学家。为了让你对本文有一个概观,本篇文章主要分三步部分:实习之前、实习期间和实习之后,让你了解我的学习历程。你可以根据你当前的学习阶段,随意跳到本文的任何部分,那让我们现在就开始吧。
数据科学 712 人学过
从区块链讲起 什么是以太坊
2018-06-07
 Mika虽然”比特币”和”以太坊”这两个术语常常一起出现,但实际上这两者有很大的区别。以太坊与比特币的唯一联系在于,两者均为成功的区块链技术应用。以太坊不像比特币仅仅是作为加密货币,它还具备一些特性,从而让其具有大型去中心化计算机的功能。要了解以太坊,首先必须了解区块链的工作原理。
区块链 以太坊 743 人学过
互联网企业该如何建设数据安全体系?
2018-06-05
Facebook数据泄露事件一度成为互联网行业的焦点,几百亿美元市值瞬间蒸发,这个代价足以在地球上养活一支绝对庞大的安全团队,甚至可以直接收购几家规模比较大的安全公司了。虽然媒体上发表了很多谴责的言论,但实事求是地讲,Facebook面临是一个业界难题,任何一家千亿美元的互联网公司面对这种问题,可能都没有太大的抵抗力,仅仅是因为全球区域的法律和国情不同,暂时不被顶上舆论的浪尖罢了。
互联网 数据安全 513 人学过