科学网

 找回密码
  注册
如何用 Pandas 存取和交换数据?
王树义 2019-5-31 10:08
本文为你介绍 Pandas 存取数据的3种主要格式,以及使用中的注意事项。 问题 在数据分析的过程里,你已经体会到 Python 生态系统的强大了吧? 数据采集、整理、可视化、统计分析……一直到深度学习,都有相应的 Python 包支持。 但是你会发现,没有任何一个 Python 软件包,是全能的。 这是一种非常好的设计思维— ...
2955 次阅读|没有评论
如何用 Python 和 BERT 做多标签(multi-label)文本分类?
王树义 2019-5-21 09:08
10余行代码,借助 BERT 轻松完成多标签(multi-label)文本分类任务。 疑问 之前我写了《 如何用 Python 和 BERT 做中文文本二元分类? 》一文,为你讲解过如何用 BERT 语言模型和迁移学习进行文本分类。 不少读者留言询问: 王老师,难道 BERT 只能支持二元分类吗? 当然 不是 。 BERT 是去年以来非常流行的 ...
5995 次阅读|没有评论
你的机器“不肯”学习,怎么办?
热度 1 王树义 2019-5-1 08:30
给你讲讲机器学习数据预处理中,归一化(normalization)的重要性。 前情回顾 Previously, on 玉树芝兰 …… 我给你写了一篇《 如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据? 》,为你讲解了 Tensorflow 2.0 处理结构化数据的分类。 结尾处,我给你 留了一个问题 。 把测试集输入模型中,检验效果。 ...
8306 次阅读|1 个评论 热度 1
如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据?
热度 1 王树义 2019-4-15 11:51
以客户流失数据为例,看 Tensorflow 2.0 版本如何帮助我们快速构建表格(结构化)数据的神经网络分类模型。 变化 表格数据,你应该并不陌生。毕竟, Excel 这东西在咱们平时的工作和学习中,还是挺常见的。 在之前的教程里,我为你分享过, 如何利用深度神经网络,锁定即将流失的客户 。里面用到的,就是这样的表 ...
6970 次阅读|1 个评论 热度 1
如何用 Python 和 BERT 做中文文本二元分类?
王树义 2019-4-8 08:59
兴奋 去年, Google 的 BERT 模型一发布出来,我就很兴奋。 因为我当时正在用 fast.ai 的 ULMfit 做自然语言分类任务(还专门写了《 如何用 Python 和深度迁移学习做文本分类? 》一文分享给你)。ULMfit 和 BERT 都属于预训练语言模型(Pre-trained Language Modeling),具有很多的相似性。 所谓语言模型,就是利 ...
6678 次阅读|没有评论
如何将 PDF 表格数据免费转换到 Excel ?
王树义 2019-4-1 08:50
所见即所获,提升你的数据采集效率。 需求 写了那篇《 如何用Python批量提取PDF文本内容? 》后,我在后台收到了许多留言。 不少读者询问,如果是 PDF 文件中的表格呢?能否正确转换? 我当时没有理解这种需求。因为那篇文章谈的主要是把文本抽取出来,目的主要是进行下一步的自然语言处理。这种 PDF 文件中大量的 ...
4902 次阅读|没有评论
如何用 R 绘制交互式社会网络图?
热度 1 王树义 2019-3-25 10:55
挖掘社会关系网络,助你洞若观火。 需求 最近有个学生问我,如何绘制 交互式 社会网络图(Interactive Social Network Graph)? 之所以一定要交互式,是因为他的应用场景,是演示给客户。 他解释说,如果客户有选项,可以根据需要来缩放图形、聚焦类别,甚至是可以拖拽图形元素,以不同视角来查看,那展示效果显 ...
10219 次阅读|1 个评论 热度 1
如何用 Python 和 Pandas 分析犯罪记录开放数据?
王树义 2019-3-6 11:38
从开放数据中,你可以了解一个城市或者社区是否安全,并合理避险。 开放 3月2日,应主办方 TechMill 的邀请,我参加了在达拉斯公共图书馆举行的“达拉斯-沃斯堡开放数据日”(DFW Open Data Day)。 为了鼓励我 INFO 5731 课程的学生们积极参加这项活动,我还制定了加分政策。 不过因为加分策略偏于保守,来的 ...
2991 次阅读|没有评论
如何用 Python 和循环神经网络预测严重交通拥堵?
热度 8 王树义 2018-12-12 12:09
本文为你介绍,如何从 Waze 交通事件开放数据中,利用序列模型找到规律,进行分类预测。以便相关部门可以未雨绸缪,提前有效干预可能发生的严重拥堵。 寻找 之前在《 文科生如何理解循环神经网络(RNN)? 》一文中,我为你讲解过循环神经网络的含义。《 如何用 Python 和循环神经网络做中文文本分类? 》一文,我又 ...
10265 次阅读|20 个评论 热度 8
如何用 Python 和循环神经网络(RNN)做中文文本分类?
王树义 2018-11-21 12:59
本文为你展示,如何使用 fasttext 词嵌入预训练模型和循环神经网络(RNN), 在 Keras 深度学习框架上对中文评论信息进行情感分类。 疑问 回顾一下,之前咱们讲了很多关于中文文本分类的内容。 你现在应该已经知道如何对 中文文本进行分词 了。 你也已经学习过,如何利用经典的机器学习方法,对分词后的中文文本, ...
12716 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 08:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部