科学网

 找回密码
  注册
你的机器“不肯”学习,怎么办?
热度 1 王树义 2019-5-1 08:30
给你讲讲机器学习数据预处理中,归一化(normalization)的重要性。 前情回顾 Previously, on 玉树芝兰 …… 我给你写了一篇《 如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据? 》,为你讲解了 Tensorflow 2.0 处理结构化数据的分类。 结尾处,我给你 留了一个问题 。 把测试集输入模型中,检验效果。 ...
8293 次阅读|1 个评论 热度 1
如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据?
热度 1 王树义 2019-4-15 11:51
以客户流失数据为例,看 Tensorflow 2.0 版本如何帮助我们快速构建表格(结构化)数据的神经网络分类模型。 变化 表格数据,你应该并不陌生。毕竟, Excel 这东西在咱们平时的工作和学习中,还是挺常见的。 在之前的教程里,我为你分享过, 如何利用深度神经网络,锁定即将流失的客户 。里面用到的,就是这样的表 ...
6954 次阅读|1 个评论 热度 1
如何用 Python 和 BERT 做中文文本二元分类?
王树义 2019-4-8 08:59
兴奋 去年, Google 的 BERT 模型一发布出来,我就很兴奋。 因为我当时正在用 fast.ai 的 ULMfit 做自然语言分类任务(还专门写了《 如何用 Python 和深度迁移学习做文本分类? 》一文分享给你)。ULMfit 和 BERT 都属于预训练语言模型(Pre-trained Language Modeling),具有很多的相似性。 所谓语言模型,就是利 ...
6664 次阅读|没有评论
如何将 PDF 表格数据免费转换到 Excel ?
王树义 2019-4-1 08:50
所见即所获,提升你的数据采集效率。 需求 写了那篇《 如何用Python批量提取PDF文本内容? 》后,我在后台收到了许多留言。 不少读者询问,如果是 PDF 文件中的表格呢?能否正确转换? 我当时没有理解这种需求。因为那篇文章谈的主要是把文本抽取出来,目的主要是进行下一步的自然语言处理。这种 PDF 文件中大量的 ...
4892 次阅读|没有评论
如何用 R 绘制交互式社会网络图?
热度 1 王树义 2019-3-25 10:55
挖掘社会关系网络,助你洞若观火。 需求 最近有个学生问我,如何绘制 交互式 社会网络图(Interactive Social Network Graph)? 之所以一定要交互式,是因为他的应用场景,是演示给客户。 他解释说,如果客户有选项,可以根据需要来缩放图形、聚焦类别,甚至是可以拖拽图形元素,以不同视角来查看,那展示效果显 ...
10198 次阅读|1 个评论 热度 1
如何用 Python 和 Pandas 分析犯罪记录开放数据?
王树义 2019-3-6 11:38
从开放数据中,你可以了解一个城市或者社区是否安全,并合理避险。 开放 3月2日,应主办方 TechMill 的邀请,我参加了在达拉斯公共图书馆举行的“达拉斯-沃斯堡开放数据日”(DFW Open Data Day)。 为了鼓励我 INFO 5731 课程的学生们积极参加这项活动,我还制定了加分政策。 不过因为加分策略偏于保守,来的 ...
2979 次阅读|没有评论
如何用 Python 和循环神经网络预测严重交通拥堵?
热度 8 王树义 2018-12-12 12:09
本文为你介绍,如何从 Waze 交通事件开放数据中,利用序列模型找到规律,进行分类预测。以便相关部门可以未雨绸缪,提前有效干预可能发生的严重拥堵。 寻找 之前在《 文科生如何理解循环神经网络(RNN)? 》一文中,我为你讲解过循环神经网络的含义。《 如何用 Python 和循环神经网络做中文文本分类? 》一文,我又 ...
10252 次阅读|20 个评论 热度 8
如何用 Python 和循环神经网络(RNN)做中文文本分类?
王树义 2018-11-21 12:59
本文为你展示,如何使用 fasttext 词嵌入预训练模型和循环神经网络(RNN), 在 Keras 深度学习框架上对中文评论信息进行情感分类。 疑问 回顾一下,之前咱们讲了很多关于中文文本分类的内容。 你现在应该已经知道如何对 中文文本进行分词 了。 你也已经学习过,如何利用经典的机器学习方法,对分词后的中文文本, ...
12691 次阅读|没有评论
文科生如何理解循环神经网络(RNN)?
王树义 2018-11-15 21:05
这一份视频教程中,我会用简明的例子和手绘图,为你讲解循环神经网络(Recurrent Neural Network, RNN)的原理和使用方法。 关于深度学习,我已经为你讲解了不少内容了。 咱们简单回顾一下。常见的深度学习任务,面对的 数据类型 主要是三类: 第一类,是结构化数据,也就是样本和属性组成的表格。例如《 如 ...
9366 次阅读|没有评论
如何用 Python 和深度迁移学习做文本分类?
热度 1 王树义 2018-11-1 08:44
本文为你展示,如何用10几行 Python 语句,把 Yelp 评论数据情感分类效果做到一流水平。 疑问 在《 如何用 Python 和 fast.ai 做图像深度迁移学习? 》一文中,我为你详细介绍了迁移学习给图像分类带来的优势,包括: 用时少 成本低 需要的数据量小 不容易过拟合 有的同学,立刻就把 ...
14590 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 09:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部