wshuyi的个人博客分享 http://blog.sciencenet.cn/u/wshuyi

博文

按标题搜索
如何在 fast.ai 用 BERT 做中文文本分类?
2019-7-29 10:19
鱼我所欲也,熊掌亦我所欲也。 痛点 我之前用 BERT ,就 没有 痛快过。 最初,是 Google 发布的原始 Tensorflow 代码,一堆堆参数,一行行代码,扑面而来。让人看着,就眼晕。 后来,Google 把 BERT 在 Tensorflow Hub 上面打了个包。 还是需要很多行代码,许多参数设置,才能让它学习你自己提供的数据。不过我还 ...
9327 次阅读|没有评论
如何用 fast.ai 高效批量推断测试集?
2019-7-22 08:42
简洁和效率,我们都要。 痛点 通过咱们之前几篇 fast.ai 深度学习框架介绍,很多读者都认识到了它的威力,并且有效加以了利用。 fast.ai 不仅语法简洁,还包裹了很多实用的数据集与预训练模型,这使得我们在研究和工作中,可以省下大量的时间。 跟着教程跑一遍,你会发现做图像、文本分类,乃至推荐系统,其实是非 ...
6438 次阅读|没有评论
如何正确使用机器学习中的训练集、验证集和测试集?
热度 3 2019-7-3 10:53
训练集、验证集和测试集,林林总总的数据集合类型,到底该怎么选、怎么用?看过这篇教程后,你就能游刃有余地处理它们了。 问题 审稿的时候,不止一次,我遇到作者 错误使用 数据集合跑模型准确率,并和他人成果比较的情况。 他们的研究创意有的很新颖,应用价值较高,工作可能也做了着实不少。 但因对比方法错误 ...
14587 次阅读|4 个评论 热度 3
如何免费获得高质量标注数据?
2019-6-12 09:46
用第一性原理,破解科研数据获取难题。 标注 自从开始了解机器学习以后,想必你已经发现,数据分析领域,标注(annotation)是很重要的。 请你再次回顾一下这张图。 我多次外出讲座时,这张图总能让与会者感到眼前一亮。 图片的原作者是华盛顿大学的 Pedro Domingos 教授。但是因为许多著名的机器学习课程争相引 ...
7029 次阅读|没有评论
如何用 Pandas 存取和交换数据?
2019-5-31 10:08
本文为你介绍 Pandas 存取数据的3种主要格式,以及使用中的注意事项。 问题 在数据分析的过程里,你已经体会到 Python 生态系统的强大了吧? 数据采集、整理、可视化、统计分析……一直到深度学习,都有相应的 Python 包支持。 但是你会发现,没有任何一个 Python 软件包,是全能的。 这是一种非常好的设计思维— ...
3433 次阅读|没有评论
如何用 Python 和 BERT 做多标签(multi-label)文本分类?
2019-5-21 09:08
10余行代码,借助 BERT 轻松完成多标签(multi-label)文本分类任务。 疑问 之前我写了《 如何用 Python 和 BERT 做中文文本二元分类? 》一文,为你讲解过如何用 BERT 语言模型和迁移学习进行文本分类。 不少读者留言询问: 王老师,难道 BERT 只能支持二元分类吗? 当然 不是 。 BERT 是去年以来非常流行的 ...
6552 次阅读|没有评论
那本 Tensorflow 2.0 奇书,你可以限时免费下载了
2019-5-12 10:49
还记得在《 文科生 Python 与数据科学入门教材推荐 》一文里,我推荐给你的这本书吗? 它的第一版,是数据科学出版史上的奇迹。 就连放在 Github 上 的配套代码,居然都获得了超过 14000 星。 还专门有人,做了一期视频。给你讲为什么这是他读过的,关于深度学习的 最好的一本书 。 视频的链接在 这里 ( http:/ ...
3886 次阅读|没有评论
数据科学入门后,该做什么?
热度 2 2019-5-10 10:28
三种学习方式,助你建构多重网络,获得能力与价值的非线性增长。 疑问 有不少读者,在我的数据科学教程下留言,问我类似这样的问题: 王老师,我已经跟着您的全部教程,从头到尾实践了一遍。中间不懂的地方,也专门看书或者上网查找,补充了知识。感觉数据科学算是入门了。但是之后我该做什么呢?有没有什么进阶教 ...
13091 次阅读|2 个评论 热度 2
你的机器“不肯”学习,怎么办?
热度 1 2019-5-1 08:30
给你讲讲机器学习数据预处理中,归一化(normalization)的重要性。 前情回顾 Previously, on 玉树芝兰 …… 我给你写了一篇《 如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据? 》,为你讲解了 Tensorflow 2.0 处理结构化数据的分类。 结尾处,我给你 留了一个问题 。 把测试集输入模型中,检验效果。 ...
8622 次阅读|1 个评论 热度 1
文科生 Python 与数据科学入门教材推荐
2019-4-22 10:50
从入门到精通,给你推荐几本 Python 与数据科学好书。 需求 最近读者数量增长了不少。有许多新读者留言,说自己想入门 Python 与数据科学,希望我能够推荐一些教材书籍。 老读者们都知道,我经常会在教程末尾的“资源”或者“小结”章节,推荐相关的书目。我推荐的书籍,有个特点,就是写得简明易懂,适合文科生阅 ...
10440 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-21 10:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部